在 FreeBSD 10 上搭建 Time Machine 备份服务

2015年09月22日 | 标签: freebsd, time machine

Backblaze 是一家在线存储服务商，每隔一段时间他们就会发布他们的存储服务器 Storage Pod 设计细节（Storage Pod 4.5），一些第三方公司就按照这个设计造出一些廉价的存储服务器来出售。

没调查清楚头脑一热就买了，买回来拆开一看有点后悔：

只有一个系统盘，OS 装在一个盘上太危险，至少应该双硬盘 RAID1；
只有一个电源，服务器系统至少需要配用2个可用电源；
没有硬件 RAID，这个无所谓，我们也不打算用 RAID；
只有2个 GigE 网卡，我们购买了额外2个 10 GigE；
开箱操作不方便，更换一个硬盘每次都要把10几个螺丝钉卸下来；
没有硬盘指示灯，哪个硬盘坏了无法从45个硬盘里迅速识别出来。

……

backblaze

不过我们对这台存储服务器没太多要求，主要做归档备份用，不是我们的主备份，也不太在乎它是否可靠，所以先凑合着用吧。两年前我们提到 “把 Time Machine 备份到 FreeNAS 上”，FreeNAS 现在变得有点臃肿，官方要求最小 8GB 内存，推荐最小 16GB 内存，这次打算直接用 FreeBSD + ZFS.

ZFS 准备工作

我们选择 FreeBSD 做备份的主要原因就是因为 ZFS，ZFS 操作起来太方便了。把30个硬盘连起来创建一个叫做 backup 的大存储池，采用 raidz2（相当于 RAID6）：

# zpool create backup raidz2 /dev/da0 /dev/da1 /dev/da2 /dev/da3 /dev/da4 /dev/da5 /dev/da6
 /dev/da7 /dev/da8 /dev/da9 /dev/da10 /dev/da11 /dev/da12 /dev/da13 /dev/da14 /dev/da15 /
dev/da16 /dev/da17 /dev/da18 /dev/da19 /dev/da20 /dev/da21 /dev/da22 /dev/da23 /dev/da24
/dev/da25 /dev/da26 /dev/da27 /dev/da28 /dev/da29

在 pool 上创建一个文件系统 timemachine，创建好后就自动挂载好了，不用再手动 mount：

# zfs create backup/timemachine

# df -h
Filesystem            Size    Used   Avail Capacity  Mounted on
/dev/ada0p2           447G    2.3G    409G     1%    /
devfs                 1.0K    1.0K      0B   100%    /dev
backup                 31T    278K     31T     0%    /backup
backup/timemachine     31T    1.0G     31T     0%    /backup/timemachine

对每个使用 Mac/Time Machine 的用户需要在 FreeBSD 系统上增加一个对应的帐户，并把帐户加到 timemachine 组里面便于统一管理：

# pw useradd -n vpsee -s /bin/csh -m
# passwd vpsee

# pw groupadd timemachine
# pw groupmod timemachine -m vpsee
# pw groupshow timemachine
timemachine:*:1002:vpsee

在 /backup/timemachine 下面新建一个用户目录，并给予适当权限：

# mkdir /backup/timemachine/vpsee
# chown vpsee:timemachine /backup/timemachine/vpsee
# chmod 700 /backup/timemachine/vpsee
# chmod 777 /backup/timemachine

安装和配置 Netatalk

Netatalk 是一个开源的 AFP (Apple File Protocol) 文件服务器，为 Mac OS X 提供文件共享服务。Avahi 是 Apple Zeroconf 协议的开源实现，类似 Bonjour 的功能，它可以让你在 Mac 系统里自动发现你的 FreeBSD 服务器。我们直接使用 pkg 安装软件包：

# pkg install netatalk3
# pkg install nss_mdns
# pkg install avahi

修改 nsswitch.conf:

# vi /etc/nsswitch.conf
#
# nsswitch.conf(5) - name service switch configuration file
# $FreeBSD: releng/10.2/etc/nsswitch.conf 224765 2011-08-10 20:52:02Z dougb $
#
...
hosts: files dns mdns
...

配置 afp:

# vi /usr/local/etc/afp.conf
;
; Netatalk 3.x configuration file
;

[Global]
vol preset = default_for_all_vol
log file = /var/log/netatalk.log
log level = default:info
hosts allow = 172.20.0.0/23
mimic model = TimeCapsule6,116
disconnect time = 1

[default_for_all_vol]
file perm = 0640
directory perm = 0750
cnid scheme = dbd

[TimeMachine]
time machine = yes
path=/backup/timemachine/$u
valid users = @timemachine
#512 GB limit
vol size limit = 512000

配置完后启动各服务：

# /usr/local/etc/rc.d/dbus onestart
# /usr/local/etc/rc.d/avahi-daemon onestart
# /usr/local/etc/rc.d/netatalk onestart

如果测试后都好用的话别忘了把服务加到启动文件里：

# vi /etc/rc.conf
...
zfs_enable="YES"
dbus_enable="YES"
avahi_daemon_enable="YES"
avahi_dnsconfd_enable="YES"
netatalk_enable="YES"
...

Mac 配置

在 Mac 上把这个选项打开：

$ defaults write com.apple.systempreferences TMShowUnsupportedNetworkVolumes 1

打开 Finder -> Go -> Connect to Server… 填入 FreeBSD 的 IP 地址（afp://192.168.2.201）后点击 Connect，使用刚才创建的帐号和密码登录进入之后就会看到 TimeMachine 文件夹。

打开 System Preferences -> Time Machine -> On 选择 TimeMachine 文件夹，然后点击 Use Disk 就应该能用了。

timemachine

分类：Linux | BSD | Solaris | 评论(5)

使用 Grafana＋collectd＋InfluxDB 打造现代监控系统

2015年03月19日 | 标签: collectd, grafana, influxdb

想打造 New Relic 那样漂亮的实时监控系统我们只需要 InfluxDB/collectd/Grafana 这三个工具，这三个工具的关系是这样的：

采集数据（collectd）-> 存储数据（InfluxDB) -> 显示数据（Grafana）。

InfluxDB 是 Go 语言开发的一个开源分布式时序数据库，非常适合存储指标、事件、分析等数据，看版本号（v0.8.8）就知道这个项目还很年轻；
collectd 就不用介绍了吧，C 语言写的一个系统性能采集工具；
Grafana 是纯 Javascript 开发的前端工具，用于访问 InfluxDB，自定义报表、显示图表等。

下面的安装和配置步骤在 Ubuntu 14.04 Server 64bit 版上完成。升级整个系统后重启：

$ sudo apt-get update
$ sudo apt-get upgrade
$ sudo reboot

安装 InfluxDB

InfluxDB 是 Go 写的，不依赖任何其他包或库，很干净。安装很容易：

$ wget https://s3.amazonaws.com/influxdb/influxdb_latest_amd64.deb
$ sudo dpkg -i influxdb_latest_amd64.deb

启动 InfluxDB：

$ sudo /etc/init.d/influxdb start
Setting ulimit -n 65536
Starting the process influxdb [ OK ]
influxdb process was started [ OK ]

启动后打开 web 管理界面 http://192.168.2.183:8083/ 默认用户名和密码是 root 和 root. InfluxDB 的 Web 管理界面端口是 8083，HTTP API 监听端口是 8086，如果需要更改这些默认设定，修改 InfluxDB 的配置文件重启就可以了。

InfluxDB

在刚安装好的 InfluxDB 上创建一个名为 collectd 的数据库，可以用命令行创建，也可以用 Web 管理界面操作：

$ curl "http://192.168.2.183:8086/db?u=root&p=root" -d "{\"name\": \"collectd\"}"

InfluxDB

安装 collectd

安装 collectd：

$ sudo apt-get install collectd

配置 collectd 为客户端，收集到数据后直接发给 InfluxDB：

$ sudo vi /etc/collectd/collectd.conf
...
LoadPlugin network
...
<Plugin network>
        Server "192.168.2.183" "25826"
</Plugin>
...

重启 collectd：

$ sudo /etc/init.d/collectd restart

InfluxDB 现在自带一个 collectd 插件来获取 collectd 客户端发来的数据，以前可没这么方便哦，0.8.4 版本以前只能通过 influxdb-collectd-proxy 这样的第三方程序来连接 collectd 和 InfluxDB. 如果你检查一下服务器上打开的端口就会发现 influxdb 插件启动了一个 25826 端口，如果发现 InfluxDB 数据库里没有（收集到）数据，务必检查这个 25826 端口是否正常启动了：

$ sudo netstat -tupln
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      622/sshd
tcp6       0      0 :::8086                 :::*                    LISTEN      668/influxdb
tcp6       0      0 :::22                   :::*                    LISTEN      622/sshd
tcp6       0      0 :::8090                 :::*                    LISTEN      668/influxdb
tcp6       0      0 :::8099                 :::*                    LISTEN      668/influxdb
tcp6       0      0 :::8083                 :::*                    LISTEN      668/influxdb
udp6       0      0 :::25826                :::*                                668/influxdb

InfluxDB 自带的 collectd 插件默认是关闭的，需要手动配置打开 enabled = true，并填上 database = “collectd” 这一行，这里的 “collectd” 就是我们上面创建的那个数据库，更改配置后记得重启 InfluxDB：

$ sudo vi /opt/influxdb/current/config.toml
$ sudo vi /opt/influxdb/shared/config.toml
...
  # Configure the collectd api
  [input_plugins.collectd]
  enabled = true
  # address = "0.0.0.0" # If not set, is actually set to bind-address.
  # port = 25826
  database = "collectd"
  # types.db can be found in a collectd installation or on github:
  # https://github.com/collectd/collectd/blob/master/src/types.db
  # typesdb = "/usr/share/collectd/types.db" # The path to the collectd types.db file
...

$ sudo /etc/init.d/influxdb restart
Setting ulimit -n 65536
Setting ulimit -n 65536
influxdb process was stopped [ OK ]
Setting ulimit -n 65536
Starting the process influxdb [ OK ]
influxdb process was started [ OK ]

现在 InfluxDB 已经准备好接受和处理 collectd 传来的数据了。用命令行或者 Web 管理界面验证一下数据库里是否有数据：

$ curl -G 'http://192.168.2.183:8086/db/collectd/series?u=root&p=root&q=list+series&pretty=true'
[
    {
        "name": "list_series_result",
        "columns": [
            "time",
            "name"
        ],
        "points": [
            [
                0,
                "192.168.2.183/cpu-0/cpu-idle"
            ],
...
        ]
    }
]

InfluxDB

安装 Grafana

下载 grafana 后解压发到 web 服务器上就可用。这里省去配置 Nginx/Apache 之类的麻烦，直接用最简单的 Web 服务器 python -m SimpleHTTPServer 驱动：

$ wget http://grafanarel.s3.amazonaws.com/grafana-1.9.1.tar.gz
$ tar xzvf grafana-1.9.1.tar.gz
$ cd grafana-1.9.1.tar.gz
$ cp config.sample.js config.js

$ vi config.js
...
      // InfluxDB example setup (the InfluxDB databases specified need to exist)
      datasources: {
        influxdb: {
          type: 'influxdb',
          url: "http://192.168.2.183:8086/db/collectd",
          username: 'root',
          password: 'root',
        },
        ...
      },
...

$ sudo python -m SimpleHTTPServer

用浏览器访问 Grafana，这里的默认端口是 8000：

Grafana

Troubleshooting

下面有多个网友评论提到修改配置文件后端口 25826 也无法起来的问题，和 influxdb 启动时候使用的是哪个配置文件有关，用 ps aux | grep influxdb 可以看到当前 influxdb 使用的是哪个配置文件：

$ sudo vi /opt/influxdb/current/config.toml
$ sudo vi /opt/influxdb/shared/config.toml

$ ps aux | grep influxdb
influxdb   668 19.1  8.1 2655964 82336 ?       Sl   Mar31 6375:52 /usr/bin/influxdb -pidfile /opt/influxdb/shared/influxdb.pid -config /opt/influxdb/shared/config.toml
...

两个配置文件 /opt/influxdb/current/config.toml 和 /opt/influxdb/shared/config.toml 的确很坑爹～

分类：Linux | BSD | Solaris | 评论(26)

Nginx: could not build the server_names_hash 解决办法

2015年02月2日 | 标签: nginx

上周给一台 Nginx proxy 服务器增加一个虚拟主机名（server_name）后重启 nginx 报错，nginx -t 测试和查看 nginx 错误日志均发现需要增加 server_names_hash_bucket_size 的默认参数：

# /etc/init.d/nginx reload
 * Reloading nginx configuration nginx                                            [fail]

# nginx -t
nginx: [emerg] could not build the server_names_hash, you should increase either server_names_hash_max_size: 512 or server_names_hash_bucket_size: 64
nginx: configuration file /etc/nginx/nginx.conf test failed

# tail /var/log/nginx/error.log
2015/01/28 10:21:51 [emerg] 22362#0: could not build the server_names_hash, you should increase either server_names_hash_max_size: 512 or server_names_hash_bucket_size: 64

解决办法是在 nginx 配置文件的 http 段中增加如下配置：

# vi /etc/nginx/nginx.conf
...
http {
        ...
        server_names_hash_max_size 512;
        server_names_hash_bucket_size 128;
        ...
}
...

Nginx 官方文档关于 server_names_hash_max_size 和 server_names_hash_bucket_size 这两个参数的用法解释的很清楚。

分类：Linux | BSD | Solaris | 评论(3)

一个能并列高亮显示文件比较结果的小工具 icdiff

2014年12月8日 | 标签: diff, icdiff

很久没有更新博客了，一直在忙今年的收尾工作，先前的存储服务器计划出了点小问题，资金刚刚到账，这两天完成订购后剩下的事情就留到明年了。

发现一个刚出炉的文件比较小工具 icdiff. icdiff 可以并列显示两个文件的不同，比传统的 diff 好看多了。

虽然传统 diff 很强大，估计没几个人喜欢看这样的比较结果：

$ diff 1.css 2.css

diff

icdiff 是 python 程序，从 github 上下载的是可执行文件，直接运行就可以了。icdiff 能并列显示比较结果，还能高亮显示差异，找起问题来容易多了：

$ git clone https://github.com/jeffkaufman/icdiff.git
$ cd icdiff
$ ./icdiff 1.css 2.css

diff

分类：Linux | BSD | Solaris, Mac | 评论(3)

在一个列表里选定主机名后直接 SSH 登陆

2014年08月19日 | 标签: csshx, ssh

标题真拗口，详细一点应该是，在一个文本文件里有一个主机名（和 IP 地址）列表，通过 vi/vim 的上下键选择某个主机名（IP 地址）后，点击回车键就可以完成相应的 SSH 登陆。

不管 chef/puppet/salt/ansible 这类自动化配置工具多么智能，我们总有需要登陆到单台服务器上找问题的时候。总不能每次去翻 doc/txt 文档找相应的 IP 地址和用户名吧，找到 IP 地址和用户名后、copy 出来、切换窗口、再 ssh？有点累～～

机械的工作总是能找到替代的工具来完成，warp 就是这样一个小工具，确切的说是一个小 bash 脚本，warp 从 .warp 文本文件里读取主机名（IP 地址）信息，然后自动连上 ssh.

$ wget https://raw.githubusercontent.com/jpalardy/warp/master/warp
$ chmod +x warp

我们可以看到这个 .warp 文件格式很自由，只要保证第一列是主机名和 IP 地址（执行 ssh 命令格式的后半部分）就可以了，还可以用 — 和 # 当作注释方便我们区分和归类不同的服务器：

$ vi ~/.warp
# VIRTUAL MACHINE HOSTS

-- production servers

host101.vpsee.com -- xen host
host102.vpsee.com
root@host103.vpsee.com -- kvm host
user@host104.vpsee.com

-- development servers

172.20.2.101
172.20.2.102
root@172.20.2.103
user@172.20.2.104

# SUN GRID ENGINE HOSTS

sge101
sge102.cluster.vpsee.com
192.168.2.15 -- local datacenter

执行 warp 后会自动打开 vi/vim，然后使用 kj 键选择某行后回车即可：

$ ./warp

如果选择多行，warp 还支持 csshx 哦～

分类：Linux | BSD | Solaris | 评论(7)

使用 tuned/tuned-adm 工具动态调优系统

2014年08月7日 | 标签: performance

RHEL/CentOS 在 6.3 版本以后引入了一套新的系统调优工具 tuned/tuned-adm，其中 tuned 是服务端程序，用来监控和收集系统各个组件的数据，并依据数据提供的信息动态调整系统设置，达到动态优化系统的目的；tuned-adm 是客户端程序，用来和 tuned 打交道，用命令行的方式管理和配置 tuned，tuned-adm 提供了一些预先配置的优化方案可供直接使用，比如：笔记本、虚拟机、存储服务器等。

如果你正在使用笔记本（电池电源），想优化系统、节约电源又不想知道太多这方面的细节，就可以用 tuned/tuned-adm 这套工具并应用 laptop-battery-powersave 方案来调整和优化系统。当然不同的系统和应用场景有不同的优化方案，tuned-adm 预先配置的优化策略不是总能满足要求，这时候就需要定制，tuned-adm 允许用户自己创建和定制新的调优方案。

系统的性能优化是个很大的话题，如果对这方面感兴趣可以参考 Linux 性能监测系列文章：
介绍，CPU，Memory, IO, Network, Tools.

安装和启动 tuned:

# yum update
# yum install tuned

# service tuned start
# chkconfig tuned on

# service ktune start
# chkconfig ktune on

查看当前优化方案：

# tuned-adm active
Current active profile: default
Service tuned: enabled, running
Service ktune: enabled, running

查看预先配置好的优化方案：

# tuned-adm list
Available profiles:
- laptop-battery-powersave
- virtual-guest
- desktop-powersave
- sap
- server-powersave
- virtual-host
- throughput-performance
- enterprise-storage
- laptop-ac-powersave
- latency-performance
- spindown-disk
- default
Current active profile: default

如果服务器是虚拟机母机的话，可以选用 virtual-host 方案优化。如果报错 “kernel.sched_migration_cost” is an unknown key 可以通过编辑 sysctl.ktune 这个文件解决。

# tuned-adm profile virtual-host
Reverting to saved sysctl settings:                        [  OK  ]
Calling '/etc/ktune.d/tunedadm.sh stop':                   [  OK  ]
Reverting to cfq elevator: sda sdb sdc sdd sde sdf sdg     [  OK  ]
Stopping tuned:                                            [  OK  ]
Switching to profile 'virtual-host'
Applying deadline elevator: sda sdb sdc sdd sde sdf sdg    [  OK  ]
Applying ktune sysctl settings:
/etc/ktune.d/tunedadm.conf:                                [FAILED]
  error: "kernel.sched_migration_cost" is an unknown key

Calling '/etc/ktune.d/tunedadm.sh start':                  [  OK  ]
Applying sysctl settings from /etc/sysctl.conf
Starting tuned:                                            [  OK  ]

# vi /etc/tune-profiles/virtual-host/sysctl.ktune
...
#kernel.sched_migration_cost = 5000000
...

# tuned-adm profile virtual-host

如果是企业存储服务器的话，可以用 enterprise-storage 方案：

# tuned-adm profile enterprise-storage
Stopping tuned:                                            [  OK  ]
Switching to profile 'enterprise-storage'
Applying deadline elevator: dm-0 sda sdb sdc sdd           [  OK  ]
Applying ktune sysctl settings:
/etc/ktune.d/tunedadm.conf:                                [  OK  ]
Calling '/etc/ktune.d/tunedadm.sh start':                  [  OK  ]
Applying sysctl settings from /etc/sysctl.conf
Starting tuned:                                            [  OK  ]

上面预定的方案不是总能满足要求，如果有自己的需求可以定制自己的方案。自己定制很容易，切换到优化方案的配置目录，拷贝一个例子，然后编辑里面的相关参数就可以了，使用 tuned-adm list 命令会看到刚创建的新方案 my-virtual-host：

# cd /etc/tune-profiles/
# cp -r virtual-host my-virtual-host
# vi my-virtual-host/*

# tuned-adm list
Available profiles:
- laptop-battery-powersave
- virtual-guest
- desktop-powersave
- sap
- server-powersave
- virtual-host
- throughput-performance
- enterprise-storage
- laptop-ac-powersave
- latency-performance
- spindown-disk
- default
- my-virtual-host
Current active profile: virtual-host

分类：Linux | BSD | Solaris, Site Reliability | Performance | 没有评论

如何设置 Postfix 邮件服务器上的自动回复

2014年07月9日 | 标签: postfix, vacation

我们使用 Gmail/Hotmail/Yahoo/126/QQ 这些邮件服务的时候很容易设置邮件自动回复功能，比如休假期间处理邮件不方便的时候设置一个自动回复告知来信者 “本人正在休假中，信已收到，会尽快回复。” 如果是自己架设的 Postfix 邮件服务器（参考：在 Ubuntu 12.04 上安装和配置邮件服务），设置自动回复要麻烦一些。

先安装 vacation 这个小程序：

$ sudo apt-get update
$ sudo apt-get install vacation

在用户的主目录里创建 .vacation.msg 文件，写上几句留言，执行 vacation 命令会在用户主目录生成 .vacation.db 文件：

$ cd ~

$ vi .vacation.msg
Subject: Re: $SUBJECT
I am on vacation until 20 July, call me if you have any urgent messages.
Thanks,
vpsee.com

$ vacation -I

然后依然是在用户主目录，添加一个 .forward 文件来触发自动回复，意思是每次这个用户收到邮件都会触发（其实就是 pipe）vacation 这个程序来处理：

$ vi .forward
\vpsee, "|/usr/bin/vacation vpsee"

分类：Linux | BSD | Solaris | 没有评论

安装和使用 Elasticsearch

2014年05月16日 | 标签: elasticsearch, linux, python

Elasticsearch 是开源搜索平台的新成员，实时数据分析的神器，发展迅猛，基于 Lucene、RESTful、分布式、面向云计算设计、实时搜索、全文搜索、稳定、高可靠、可扩展、安装＋使用方便，介绍都说的很好听，好不好用拿出来遛一遛。

做了个简单测试，在两台完全一样的虚拟机上，2000万条左右数据，Elasticsearch 插入数据速度比 MongoDB 慢很多（可以忍受），但是搜索/查询速度快10倍以上，这只是单机情况，多机集群情况下 Elasticsearch 表现更好一些。以下安装步骤在 Ubuntu Server 14.04 LTS 上完成。

安装 Elasticsearch

升级系统后安装 Oracle Java 7，既然 Elasticsearch 官方推荐使用 Oracle JDK 7 就不要尝试 JDK 8 和 OpenJDK 了：

$ sudo apt-get update
$ sudo apt-get upgrade

$ sudo apt-get install software-properties-common
$ sudo add-apt-repository ppa:webupd8team/java
$ sudo apt-get update

$ sudo apt-get install oracle-java7-installer

加入 Elasticsearch 官方源后安装 elasticsearch：

$ wget -O - http://packages.elasticsearch.org/GPG-KEY-elasticsearch | sudo apt-key add -
$ sudo echo "deb http://packages.elasticsearch.org/elasticsearch/1.1/debian stable main" >> /etc/apt/sources.list

$ sudo apt-get update
$ sudo apt-get install elasticsearch

加入到系统启动文件并启动 elasticsearch 服务，用 curl 测试一下安装是否成功：

$ sudo update-rc.d elasticsearch defaults 95 1

$ sudo /etc/init.d/elasticsearch start

$ curl -X GET 'http://localhost:9200'
{
  "status" : 200,
  "name" : "Fer-de-Lance",
  "version" : {
    "number" : "1.1.1",
    "build_hash" : "f1585f096d3f3985e73456debdc1a0745f512bbc",
    "build_timestamp" : "2014-04-16T14:27:12Z",
    "build_snapshot" : false,
    "lucene_version" : "4.7"
  },
  "tagline" : "You Know, for Search"
}

Elasticsearch 的集群和数据管理界面 Marvel 非常赞，可惜只对开发环境免费，如果这个工具也免费就无敌了，安装很简单，完成后重启服务访问 http://192.168.2.172:9200/_plugin/marvel/ 就可以看到界面：

$ sudo /usr/share/elasticsearch/bin/plugin -i elasticsearch/marvel/latest

$ sudo /etc/init.d/elasticsearch restart
 * Stopping Elasticsearch Server                                           [ OK ]
 * Starting Elasticsearch Server                                           [ OK ]

Elasticsearch Marvel

安装 Python 客户端驱动

和 MongoDB 一样，我们一般用程序和 Elasticsearch 交互，Elasticsearch 也支持多种语言的客户端驱动，这里仅安装 Python 驱动，其他语言可以参考官方文档。

$ sudo apt-get install python-pip
$ sudo pip install elasticsearch

写个简单程序把 gene_info.txt 的数据导入到 Elasticsearch：

#!/usr/bin/python
# -*- coding: UTF-8 -*-

import os, os.path, sys, re
import csv, time, string
from datetime import datetime
from elasticsearch import Elasticsearch

def import_to_db():
    data = csv.reader(open('gene_info.txt', 'rb'), delimiter='\t')
    data.next()

    es = Elasticsearch()
    for row in data:
        doc = {
            'tax_id': row[0],
            'GeneID': row[1],
            'Symbol': row[2],
            'LocusTag': row[3],
            'Synonyms': row[4],
            'dbXrefs': row[5],
            'chromosome': row[6],
            'map_location': row[7],
            'description': row[8],
            'type_of_gene': row[9],
            'Symbol_from_nomenclature_authority': row[10],
            'Full_name_from_nomenclature_authority': row[11],
            'Nomenclature_status': row[12],
            'Other_designations': row[13],
            'Modification_date': row[14]
        }
        res = es.index(index="gene", doc_type='gene_info', body=doc)

def main():
    import_to_db()

if __name__ == "__main__":
    main()

Kibana 是一个功能强大的数据显示客户端，通过插件方式和 Elasticsearch 集成在一起，安装很容易，下载解压就可以了，然后重启 Elasticsearch 服务访问 http://192.168.2.172:9200/_plugin/kibana/ 就能看到界面：

$ wget https://download.elasticsearch.org/kibana/kibana/kibana-3.0.1.tar.gz
$ tar zxvf kibana-3.0.1.tar.gz
$ sudo mv kibana-3.0.1 /usr/share/elasticsearch/plugins/_site
$ sudo /etc/init.d/elasticsearch restart

Elasticsearch Kibana

分类：Linux | BSD | Solaris | 评论(12)

服务器批量执行工具 PSSH

2014年05月9日 | 标签: pssh, ssh

操作一台服务器的时候可以 ssh，操作多台服务器可以开多个窗口多个 ssh，那操作很多台服务器呢？

我们的一个 Oracle Gird Engine 集群上大概有60多台 Ubuntu 服务器作执行节点，这些服务器操作系统和软件配置完全一样（上线后由 puppet 统一配置），有时候我们需要在这些服务器上做同样的操作，这个时候特别适合使用 PSSH 这种 ssh 批量操作工具。

当然，如果对 Python 不恐惧的话也可以用 Fabric 批量执行服务器任务。

下载和安装 pssh：

$ git clone http://code.google.com/p/parallel-ssh/
$ cd parallel-ssh/
$ sudo python setup.py install

批量执行

首先新建一个服务器列表文件，把需要操作的服务器的 hostname（或者 IP 地址）加进去，然后就可以批量执行 uptime 命令了，-l 指定登录用户名，-A 询问密码，-h 指定服务器列表文件：

$ vi grids
grid01
grid02
grid03
grid04
grid05

$ pssh -i -l root -A -h grids 'uptime'
Warning: do not enter your password if anyone else has superuser
privileges or access to your account.
Password:
[1] 05:42:09 [SUCCESS] grid01
 11:42:09 up 620 days, 20:30,  0 users,  load average: 6.09, 6.14, 6.13
[2] 05:42:09 [SUCCESS] grid03
 11:42:09 up 620 days, 20:29,  0 users,  load average: 9.01, 9.04, 9.05
[3] 05:42:09 [SUCCESS] grid05
 11:42:09 up 620 days, 20:10,  0 users,  load average: 8.46, 8.18, 8.10
[4] 05:42:09 [SUCCESS] grid04
 11:42:09 up 620 days, 20:25,  0 users,  load average: 6.00, 6.01, 6.05
[5] 05:42:10 [SUCCESS] grid02
 11:42:10 up 606 days,  2:07,  0 users,  load average: 6.03, 6.02, 6.01

批量上传

批量上传本地文件 linux-3.14.3.tar.xz 到服务器上的 /tmp 目录：

$ pscp -l root -A -h grids linux-3.14.3.tar.xz /tmp/
Warning: do not enter your password if anyone else has superuser
privileges or access to your account.
Password:
[1] 05:56:16 [SUCCESS] grid01
[2] 05:56:16 [SUCCESS] grid03
[3] 05:57:04 [SUCCESS] grid05
[4] 05:57:04 [SUCCESS] grid04
[5] 05:57:05 [SUCCESS] grid02

批量下载

批量下载服务器上的某文件到本地，不用担心重名问题，因为 pssh 已经建立了 grid01, grid02, …, grid05 目录来存放下载的文件：

$ pslurp -l root -h grids -A /tmp/linux-3.14.3.tar.xz .
Warning: do not enter your password if anyone else has superuser
privileges or access to your account.
Password:
[1] 06:06:01 [SUCCESS] grid01
[2] 06:06:01 [SUCCESS] grid03
[3] 06:06:06 [SUCCESS] grid04
[4] 06:06:06 [SUCCESS] grid02
[5] 06:06:06 [SUCCESS] grid05

$ ls
grid01  grid02  grid03  grid04  grid05  grids  linux-3.14.3.tar.xz  parallel-ssh

批量同步

有时候我们需要保持开发机上（某目录里）的数据和服务器上的数据一致：

$ prsync -l root -h grids -A -r develop/ /tmp/production/
Warning: do not enter your password if anyone else has superuser
privileges or access to your account.
Password:
[1] 06:12:52 [SUCCESS] grid05
[2] 06:12:52 [SUCCESS] grid01
[3] 06:12:52 [SUCCESS] grid04
[4] 06:12:52 [SUCCESS] grid02
[5] 06:12:52 [SUCCESS] grid03

分类：Linux | BSD | Solaris | 评论(4)

使用 OpenVPN Access Server 轻松搭建 VPN 服务器

2014年04月25日 | 标签: openvpn, openvpn access server, tunnelblick

平时很少用 VPN，需要的时候一般用 ssh -D 搞定，或者 sshuttle 也是个不错的工具。自己配置 OpenVPN 虽然不是很麻烦，但对第一次配置 VPN 的新手来说还是挺费神费事的，如果急用或者怕麻烦的话可以选用 OpenVPN 的商业收费版本 OpenVPN Access Server，其免费的 license 可以支持2个 VPN 用户的同时在线，对个人用户来说足够用了。OpenVPN Access Server 装完即可用，无需配置。

安装

在 CentOS 6.x 上下载和安装 OpenVPN Access Server:

# yum update
# yum upgrade

# wget http://swupdate.openvpn.org/as/openvpn-as-2.0.7-CentOS6.i386.rpm

# rpm -ivh openvpn-as-2.0.7-CentOS6.i386.rpm
Preparing...                ########################################### [100%]
   1:openvpn-as             ########################################### [100%]
The Access Server has been successfully installed in /usr/local/openvpn_as
Configuration log file has been written to /usr/local/openvpn_as/init.log
Please enter "passwd openvpn" to set the initial
administrative password, then login as "openvpn" to continue
configuration here: https://173.252.243.254:943/admin
To reconfigure manually, use the /usr/local/openvpn_as/bin/ovpn-init tool.

Access Server web UIs are available here:
Admin  UI: https://173.252.243.254:943/admin
Client UI: https://173.252.243.254:943/

# passwd openvpn

在 Ubuntu 14.04 上下载和安装 OpenVPN Access Server（写这篇文章的时候 Ubuntu 14.04 刚刚发布，for Ubuntu 14.04 的官方版本还没有出来，可以使用 Ubuntu 13.10 的）：

$ sudo apt-get update
$ sudo apt-get upgrade
$ sudo apt-get install iptables
$ wget http://swupdate.openvpn.org/as/openvpn-as-2.0.7-Ubuntu13.i386.deb
$ sudo dpkg -i openvpn-as-2.0.7-Ubuntu12.i386.deb
$ sudo passwd openvpn

使用

打开管理界面 https://173.252.243.254:943/admin 使用用户名 openvpn 和密码登录，进去随便看一下就可以了，不用做任何配置就可以用：

OpenVPN Access Server

打开客户端界面 https://173.252.243.254:943/ 使用用户名 openvpn 和密码登录后下载 OpenVPN Connect for Mac OS X 客户端，安装后点击连接就可以用了，很方便。

OpenVPN Access Server

如果你想使用其他的 OpenVPN 客户端的话，比如 Tunnelblick，就需要下载客户端的配置文件 Yourself (user-locked profile) 或者 Anyone at this server (server-locked profile). 下载后的文件名是 client.ovpn，这个文件稍后会在配置 Tunnelblick 时用到。

Tunnelblick 是 Mac 上比较流行的一个开源 OpenVPN 客户端，另一个好用的客户端 Viscosity 是收费的。

下载 Tunnelblick 后安装，然后导入刚才下载的 client.ovpn 配置文件就可以了，导入的方法比较奇怪，桌面上会自动创建一个 Empty Tunnelblick VPN Configuration 文件夹，把 client.ovpn 拖进去后重命名文件夹（注意是文件夹不是文件）为 Empty Tunnelblick VPN Configuration.tblk 后双击文件夹导入，导入后点击 Connect 会弹出登录对话框，输入用户名 openvpn 及其密码就可以了。

OpenVPN Access Server

分类：Linux | BSD | Solaris | 评论(20)

在 FreeBSD 10 上搭建 Time Machine 备份服务

ZFS 准备工作

安装和配置 Netatalk

Mac 配置

使用 Grafana＋collectd＋InfluxDB 打造现代监控系统

安装 InfluxDB

安装 collectd

安装 Grafana

Troubleshooting

Nginx: could not build the server_names_hash 解决办法

一个能并列高亮显示文件比较结果的小工具 icdiff

在一个列表里选定主机名后直接 SSH 登陆

使用 tuned/tuned-adm 工具动态调优系统

如何设置 Postfix 邮件服务器上的自动回复

安装和使用 Elasticsearch

安装 Elasticsearch

安装 Python 客户端驱动

服务器批量执行工具 PSSH

批量执行

批量上传

批量下载

批量同步

使用 OpenVPN Access Server 轻松搭建 VPN 服务器

安装

使用

分类

随机

评论

友链

关于