分类工具技巧下的文章

February 18, 2022

1. 下载 VirtualBox

进入 VirtualBox 官方下载页面下载即可。

2. 双击 exe 文件按步骤安装

安装完成后点击运行，运行截图如下：

3. 下载 CentOS ISO

进入 CentOS 官方下载页面，选择任意一个 mirror 站点，下载精简版本的 CentOS-7-x86_64-Minimal-2009.iso 文件。

4. 在 VirtualBox 上创建一个虚拟机

点击 “新建” 弹出 “新建虚拟电脑” 对话框，依次填写：名称、文件夹、类型、版本、内存大小（1024MB）。

在 “虚拟硬盘” 下选择 “现在创建虚拟硬盘”，点击 “创建” 按钮弹出 “创建虚拟硬盘” 对话框：

然后选择文件位置、文件大小（8GB）、虚拟硬盘文件类型（VDI）、动态分配，并点击 “创建” 按钮完成虚拟机的创建。

5. 在 VirtualBox 上安装 CentOS 操作系统

完成虚拟机的创建后，该虚拟机默认为 “关闭中” 状态，这时的虚拟机还没有安装任何操作系统，是启动不了的。

我们点击 “设置” 按钮，在 “设置” 对话框中选择 “存储”，右侧的 “存储介质” 中可以看到 “控制器：IDE” 里显示着 “没有盘片”。我们单击选择 “没有盘片” 这一行，右侧会显示对应的 “分配光驱” 属性：

我们在下拉列表中点击 “选择虚拟盘”，并选择我们刚刚下载的 CentOS-7-x86_64-Minimal-2009.iso 文件，并点击 OK 确认。这个时候我们就可以开机了。双击这个虚拟机启动，首次启动会提示你选择启动盘，直接确定即可。进入我们的安装界面：

选择 “Install CentOS 7” 并按回车就开始安装 CentOS 操作系统了。首先选择语言：

然后选择安装位置：

直接 “自动配置分区” 即可：

点击 “开始安装” 进入自动安装界面：

在这个界面你可以 “设置 ROOT 密码” 或者 “创建用户”，然后等待系统安装完成，并 “重启” 虚拟机。

重启后，输入用户名和密码，就进入 CentOS 系统了：

6. 配置网络环境

系统刚安装好时，网络并没有配置，此时无法访问外网，也不能访问宿主机，如下：

# ping www.baidu.com
ping: www.baidu.com: Name or service not known

# 无线局域网适配器 WLAN
# ping 192.168.1.43
connect: Network is unreachable

# 以太网适配器 vEthernet (Default Switch)
# ping 172.24.128.1
connect: Network is unreachable

# 以太网适配器 VirtualBox Host-Only Network
# ping 192.168.56.1
connect: Network is unreachable

可以通过 ifcfg 文件来配置网络：

vi /etc/sysconfig/network-scripts/ifcfg-enp0s3

ifcfg 文件内容如下：

TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=dhcp
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=enp0s3
UUID=68f56f36-xxxx-xxxx-xxxx-24ca69e80f4d
DEVICE=enp0s3
ONBOOT=no

对配置文件内容感兴趣的同学可以参考这里的参数说明，将最后一行的 ONBOOT=no 改成 ONBOOT=yes，然后重启机器：

# reboot

重启后进入系统，就可以正常访问网络了：

# ping 192.168.1.43

至此，一台虚拟机环境搭建完成。

7. 搭建虚拟机集群环境

一台虚拟机环境对我们来说还远远不够，我们需要多创建几个虚拟机，VirtualBox 提供了虚拟机复制的功能，这样可以省去我们再重新安装。在虚拟机右键菜单中选择 “复制”：

在弹出的 “复制虚拟电脑” 对话框中填写新的虚拟机名称和其他一些配置：

“副本类型” 选择 “完全复制”：

复制完成后就生成了一个新的虚拟机，新的虚拟机和复制的虚拟机环境是完全一样的。我们通过这种方式复制 5 个虚拟机备用。

8. 测试集群网络

我们启动 centos-1 和 centos-2 两个虚拟机，登陆进去检查和主机的连通性，并使用 ip addr 查看本机的网络地址：

我们发现两台虚拟机的网络配置完全一样，就连 IP 和 MAC 地址都一模一样，这导致两个虚拟机之间根本无法通信，这是为什么呢？

如果你仔细的话，打开两个虚拟机网络配置的高级选项，可以看到 VirtualBox 为两个虚拟机生成的 MAC 地址是一模一样的：

这是因为在复制虚拟机的时候，对 MAC 地址有这么一个下拉选项：

选项中有三种情况：

包含所有网卡的 MAC 地址
仅包含 NAT 网卡的 MAC 地址
为所有网卡重新生成 MAC 地址

第一种和第三种都比较好理解，第一种是完全复制所有网卡的 MAC 地址，新生成的虚拟机所有网卡的 MAC 地址和之前的都一样，第三种是为所有网卡都重新生成 MAC 地址，而默认是第二种 仅包含 NAT 网卡的 MAC 地址，这个表示如果虚拟机的网络模式是 NAT，则完全复制，其他类型的网卡会重新生成 MAC 地址。那为什么对 NAT 网络模式会有这样的特殊照顾呢？

这里我们就需要学习下 VirtualBox 的网络模式了，VirtualBox 提供了各种不同的网络模式来满足各种不同的实验要求：

网络地址转换（NAT）
桥接网卡
内部网络
仅主机（Host-Only）网络
通用网络
NAT 网络
Cloud Network（实验中）

默认的网络模式为 网络地址转换（NAT）：

VirtualBox 官方文档对 NAT 有如下一段说明：

A virtual machine with NAT enabled acts much like a real computer that connects to the Internet through a router. The router, in this case, is the Oracle VM VirtualBox networking engine, which maps traffic from and to the virtual machine transparently. In Oracle VM VirtualBox this router is placed between each virtual machine and the host. This separation maximizes security since by default virtual machines cannot talk to each other.

可以看出，NAT 就像是一个介于宿主机和虚拟机之间的路由器，用于转发虚拟机到外网的流量。每个虚拟机和宿主机之间都有这么一个路由器，也就是说网络模式为 NAT 的时候，每个虚拟机都是独立于其他虚拟机的，之间是互不影响的，也是不能互相通信的，所以复制的时候，MAC 地址一模一样也无所谓了。

根据下面这张图，如果要让虚拟机之间能通信，我们可以选择除 NAT 之外的任何一个网络模式都可以，但是 Host-Only 模式会导致虚拟机访问不了外网，Internal 模式会导致虚拟机访问不了外网和宿主机：

所以最好的选择是 桥接网卡 或 NAT 网络 这两个模式，这里我们选择 NAT 网络 模式。

8.1 新建 NAT 网络

首先打开 VirtualBox 的 “管理” 菜单，选择 “全局设定”，然后在全局设定对话框中选择 “网络” 选项卡，点击右侧的加号，添加一个新的 NAT 网络，默认名称为 NatNetwork：

可以双击这个 NAT 网络查看它的配置：

然后打开虚拟机的网络配置，将网络模式从 网络地址转换（NAT） 改成 NAT 网络，界面名称选择刚刚创建的那个 NAT 网络 NatNetwork，并且记得在高级选项中重新生成一个 MAC 地址（因为刚刚复制的虚拟机 MAC 地址都是一样的，在同一个网络中会导致冲突）：

对其他的虚拟机重复刚才的操作。

8.2 验证

我们启动 centos-1 和 centos-2 两个虚拟机，登陆进去检查和主机的连通性，并使用 ip addr 查看本机的网络地址：

我们发现两台虚拟机的 IP 已经变得不一样了，然后通过 ping 检查虚拟机之间的联通性也没问题，至此，虚拟机集群环境搭建完成。

参考

1. 使用 ip 配置网络

根据 Red Hat 官方文档中的说明，由于 net-tools 不支持 InfiniBand（无限带宽技术，缩写为 IB），ip 命令被用来替换 ifconfig 命令：

Note that the ip utility replaces the ifconfig utility because the net-tools package (which provides ifconfig) does not support InfiniBand addresses.

ip 命令的使用示例如下：

ip link set enp0s3 down
ip address add 10.0.2.15/24 dev enp0s3
ip link set enp0s3 up

2. 在 ifcfg 文件中配置静态地址

DEVICE="eth0"
BOOTPROTO="static"
NM_CONTROLLED="no"
ONBOOT="yes"
TYPE="Ethernet"
UUID=27137241-842e-4e50-88dd-8d8da1305dc0
DEFROUTE=yes
IPADDR=192.168.254.109
NETMASK=255.255.255.0
GATEWAY=
DNS1=
DNS2=
HWADDR=00:90:27:50:5B:30
ARPCHECK=no

扫描二维码，在手机上阅读！

August 3, 2019

记一个 Docker 镜像无法运行的坑

最近在工作中遇到了一个 Docker 镜像无法运行的问题，事后总结时发现其中有几个点挺有意思，值得记录下来以备后用，也可以避免其他人踩坑。

一、运行镜像报错

我的开发环境是 Windows，使用 Docker Desktop 作为本地 Docker 环境。最近在一个项目中需要把 war 包打成 Docker 镜像并推送到仓库里去，却发现打好的这个镜像运行不起来，运行时报下面这样的错：

# docker run --rm -it manager
standard_init_linux.go:207: exec user process caused "no such file or directory"

检查 Dockerfile 文件，是非常简单的：

FROM openjdk:8-jre-alpine

ADD entrypoint.sh entrypoint.sh
ADD *.war app.war

EXPOSE 8088

RUN chmod 755 entrypoint.sh
ENTRYPOINT ["./entrypoint.sh"]

镜像是基于 openjdk 的基础镜像，将 entrypoint.sh 和 *.war 拷贝到镜像中，并将 entrypoint.sh 作为默认的启动脚本文件。初看应该是没问题的，war 包在本地使用 java -jar 也可以跑起来。

二、检查镜像

那么这个镜像是怎么回事？看报错信息，应该是运行镜像时，找不到某个文件或目录，但是我的这个镜像一共就两个文件，一个 entrypoint.sh 一个 war 包，难道这两个文件没有 ADD 到镜像里？

于是试着运行命令 docker run --rm -it manager sh，想着进 shell 查看下文件，发现依然报错，难道镜像里没有 sh 脚本？试着连换了几个命令：docker run --rm -it manager /bin/bash 和 docker run --rm -it manager ls 发现都是这个错，这怎么可能呢，连 ls 都没有？

无奈 Google 之，才发现原来如果镜像配置了 entrypoint，要使用下面这样的方式来检查镜像：

# docker run --rm -it --entrypoint sh manager

进到容器里来了之后，使用 ls 可以看到文件都在，没毛病：

/ # ls
app.war        entrypoint.sh  lib            opt            run            sys            var
bin            etc            media          proc           sbin           tmp
dev            home           mnt            root           srv            usr

使用 java -jar app.war 可以正常运行，但是奇怪的是，./entrypoint.sh 脚本却运行不了：

/ # ./entrypoint.sh
sh: ./entrypoint.sh: not found

这个脚本文件明明就在这，却报错 not found，这让我一度怀疑人生，遇到灵异事件了。

三、换行惹的祸

不得已只能继续 Google 之，发现网络上跟我一样的人还有很多，脚本无法运行最可能的原因是 Sha-Bang 写的有问题，所谓 Sha-Bang 就是 #!，通常会写在 shell 文件第一行，用于指定命令行解释器。类似于下面这样：

/ # cat entrypoint.sh
#!/bin/sh
blabla

使用 ls /bin/sh 发现 /bin/sh 文件也在，应该没问题啊。苦思冥想之际，突然脑海中闪过一个想法，难道这里有隐藏字符？一般遇到这种灵异事件的时候，都很可能和隐藏字符有关。使用 cat -v 查看文件，果然发现这里的 /bin/sh 后面多了个 ^M：

/ # cat -v entrypoint.sh
#!/bin/sh^M
blabla

顿时豁然开朗，这不就是 Windows 下的换行符吗？一切都是换行符惹的祸。

使用 dos2unix 将 entrypoint.sh 文件中的 Windows 格式的换行符转为 UNIX 格式，再一次使用 docker build，这次终于运行成功了。

四、最坑的 Git 配置

到这里本来已经结束了，不过后来又发生了一件小事，让我又发现另一个坑，才找到了这个问题最根本的原因。当我解决了这个问题之后，就去给同事分享，可是听了我的分享之后，同事却一脸懵逼的表示自己从来都没遇到过这个问题，并且在他电脑上给我演示了一遍 docker build 和 docker run，一切正常，并没有报错，同样的一份代码，为什么在我的电脑上 build 就有问题？看着同事对我露出的迷之微笑，我又一次陷入了困惑。

我让他把 entrypoint.sh 发给我，看了下，他的换行符格式竟然是 UNIX 的，可是我本地代码换行符明明是 Windows 的，使用 git status 也可以看到 nothing to commit, working tree clean，表明本地代码和仓库代码是一样的，为什么换行符却不一样呢？

查看 Git 的配置文件，和他的对比了一下，发现一个很可能的疑点：

[core]
    autocrlf = true

查询官网文档，终于找到了原因，原来 Git 在 pull 代码的时候可能会偷偷的对你的代码做手脚。如果你配置了 autocrlf = true，那么当你签出代码时，Git 会自动的把 LF 转换成 CRLF，然后当你 push 的时候，又自动的将 CRLF 转换成 LF。这看上去很贴心的功能，实际上却有着很大的漏洞，譬如像我这样，直接在本地打镜像，或者需要直接将 shell 文件上传到 Linux 服务器上运行的，都可能会出问题。关键这个配置在 Windows 下默认是打开的，所以建议把这个配置关掉：

$ git config --global core.autocrlf false

坑之总结

坑一：镜像如果配置了 entrypoint，docker run 的时候应该加上 --entrypoint 参数来检查镜像
坑二：脚本运行时报 not found，最可能的原因是 Sha-Bang 写的有问题，检查脚本文件中是否存在隐藏字符，譬如 Windows 的换行符，这里不得不吐槽下，这个 not found 提示真的让人迷惑，提示里能不能把隐藏字符也带上？
坑三：建议关闭 Git 的 autocrlf 配置

参考

扫描二维码，在手机上阅读！

January 5, 2019

博客升级小记

由于几年前一直在做 .Net 相关的开发，于是在阿里云上买了一台 Windows Server 的主机，在上面用 IIS 搭建 Web 环境还是比较方便的。后来写 PHP，也是用的 Windows 环境，那个时候比较流行 SAE 搭建本地开发环境，非常简单，还写过一篇文章介绍了在 Windows 上搭建 PHP 本地开发环境的其他方法，基本上都是部署在这台服务器上。这台服务器一用就是好多年，所以后来开始写博客，无论是一开始用的 WordPress 还是现在用的 Typecho，也是一直放在这台服务器上的。但随着自己开始学 Java，学 Docker，学 DevOps，这台 Windows Server 越来越没用了，一年将近 1000 块的大洋，性价比超低。

最近这台服务器要到期了，一直想着换台 Linux 的服务器，终于可以如愿了。不过迁移服务器好麻烦，好多东西要备份，花了大半天时间把服务器上的东西备份好，又花了大半天的时间把博客迁移到新的服务器，这里对迁移过程做个记录，便于来日查阅。

一、备份博客

备份分两步，备份 MySQL 和备份 Typecho：

1.1 备份 MySQL

我这里直接使用 MySQL 的图形化客户端工具 SQLyog Ultimate，Backup/Export -> Backup Database As SQL Dump，选择 Structure and data，导出即可。

当然也可以用 mysqldump，譬如下面这样：

> mysqldump -u root -p --databases typecho_db > typecho_db.sql

1.2 备份 Typecho

这个没啥说的，直接将网站目录打包备份即可。值得注意的是 Typecho 的目录结构，它的根目录有几个文件：index.php 是入口文件，install.php 是安装文件，建议在安装完成后删除，config.inc.php 这个是 Typecho 的配置文件，在安装时自动生成的。除此之外，还有三个目录：admin 是管理后台的代码，var 是 Typecho 核心代码，usr 用于存放用户内容，譬如用户的主题位于 usr/themes，插件位于 usr/plugins，用户上传的文件位于 usr/uploads。

二、安装 MySQL

自从有了 Docker，Linux 下的很多软件安装起来都变得非常轻松。比如安装 MySQL，可以用下面的一行命令就可以搞定：

sudo docker run -d -p 3306:3306 -e MYSQL_ROOT_PASSWORD=password mysql:5.7

安装完成后，我们需要把刚刚备份的数据库导入到这个新数据库：

$ mysql -h 127.0.0.1 -uroot -p < typecho.sql

实际上还有更简单的一种方法，使用 Docker 运行 MySQL 时，可以在 /docker-entrypoint-initdb.d 目录下放一些初始化的脚本，可以是 shell，也可以是 sql，我们把刚刚备份的 typecho.sql 挂载到这个目录：

$ sudo docker run -d --name typecho-db -p 3306:3306 \
 -e MYSQL_ROOT_PASSWORD=password \
 -v ~/blog/mysql/init:/docker-entrypoint-initdb.d \
 mysql:5.7

三、搭建 Nginx + PHP-FPM

接下来我们搭建 Web 服务器，这包括两个部分：Nginx 和 PHP。

3.1 安装 PHP-FPM

首先我们安装 PHP，官方提供了几种不同类型的镜像，根据 tag 的名称来进行区分，比如：php-<version>-cli、php-<version>-apache、php-<version>-fpm 等，如果你使用的 Web 服务器是 Apache，可以直接使用 php-apache，这里由于我使用的是 Nginx，所以选择安装 php-fpm：

sudo docker run -d --name typecho-php -p 9000:9000 \
  -v ~/blog/websites:/var/www/html \
  php:7.2-fpm

FPM 是 PHP 的 FastCGI 进程管理器，一般来说，以 CGI 的方式来运行 PHP 有几种比较常见的方式，比如：CGI、FastCGI、PHP-FPM，关于这几个的区别，可以参考这里。PHP-FPM 默认监听 9000 端口，接受 Nginx 转发过来的 CGI 请求，下面我们就来配置 Nginx。

这里挂载了 /var/www/html 目录，是为了 PHP 程序找到要执行的脚本文件，下面的 Nginx 镜像也会挂载这个目录，但是目的是完全不一样的。

3.2 安装 Nginx

Nginx 使用下面的 Docker 命令安装：

sudo docker run -d --name typecho-nginx -p 80:80 -p 443:443 \
  -v ~/blog/nginx/conf:/etc/nginx/conf.d \
  -v ~/blog/websites:/var/www/html \
  nginx

Nginx 默认的配置文件里有几行被注释掉的代码，是配置 PHP FastCGI 的一个简单例子，如下：

    # pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000
    #
    #location ~ \.php$ {
    #    root           html;
    #    fastcgi_pass   127.0.0.1:9000;
    #    fastcgi_index  index.php;
    #    fastcgi_param  SCRIPT_FILENAME  /scripts$fastcgi_script_name;
    #    include        fastcgi_params;
    #}

但是拿这个例子直接跑 Typecho 会报 File Not Found 错误，根据 Typecho 的官方文档服务器环境设置，我们还需要加上 SCRIPT_NAME 和 PATH_INFO 这两个 FastCGI 参数。另外，如果你的博客开启了伪静态，还要加一条 rewrite 规则对所有的请求进行转发。下面是完整的配置：

server {
    listen 80;
    server_name www.aneasystone.com;

    root /var/www/html;

    location / {
        index index.php index.html index.htm;
    }
    
    if (!-e $request_filename) {
        rewrite ^(.*)$ /index.php$1 last;
    }

    location ~ \.php(\/.*)*$ {
        fastcgi_pass   172.17.0.1:9000;
        set $path_info "";
        set $real_script_name $fastcgi_script_name;
        if ($fastcgi_script_name ~ "^(.+?\.php)(/.+)$") {
            set $real_script_name $1;
            set $path_info $2;
        }
        fastcgi_param SCRIPT_FILENAME $document_root$real_script_name;
        fastcgi_param SCRIPT_NAME $real_script_name;
        fastcgi_param PATH_INFO $path_info;
        fastcgi_index  index.php;
        include        fastcgi_params;
    }
}

正如上文所述，Nginx 镜像和 PHP 镜像在运行时，都挂载了 /var/www/html 目录。这其实是为了支持 Typecho 的伪静态配置，我们通过 !-e $request_filename 来判断要访问的文件是否存在，如果不存在则 rewrite 到 index.php，如果我们不挂载 /var/www/html 这个目录，则所有访问的路径都会不存在，直接触发重写规则，这样会导致 Typecho 的管理后台打不开。

3.3 遭遇 Database Server Error

Web 服务器搭建好了后，访问博客首页，发现报 500 错误，页面上直接显示大大的 “Database Server Error” 提示信息。我们打开 Typecho 的调试模式，在 config.inc.php 文件顶部加上一行代码：

define('__TYPECHO_DEBUG__', TRUE);

重新刷新页面，可以看到下面的错误详情：

Adapter Typecho_Db_Adapter_Mysql is not available
Typecho_Db_Exception: Adapter Typecho_Db_Adapter_Mysql is not available in /var/www/html/var/Typecho/Db.php:123
Stack trace:
#0 /var/www/html/config.inc.php(57): Typecho_Db->__construct('Typecho_Db_Adap...', 'typecho_')
#1 /var/www/html/index.php(11): include_once('/var/www/html/c...')
#2 {main}

发现是找不到数据库适配器 Mysql，Google 之后发现 PHP 7 以后的版本已经去除了 Mysql 扩展，推荐使用 PDO，我们修改 config.inc.php 文件中定义 Typecho_Db 的地方，将 Mysql 改为 Pdo_Mysql：

$db = new Typecho_Db('Pdo_Mysql', 'typecho_');

重新刷新页面，发现错误还是没变：

Adapter Typecho_Db_Adapter_Pdo_Mysql is not available

使用 phpinfo() 查看 PHP 信息，发现只有 sqlite 这个 PDO driver：

才知道这是因为官方的 PHP 镜像里默认情况下并没有安装 pdo_mysql 这个扩展，可以使用 docker-php-ext-install 来安装，安装好后，要重启 PHP 重新加载扩展：

aneasystone@little-stone:~/blog/websites$ sudo docker exec -it typecho-php bash
root@42633b997f8b:/var/www/html# docker-php-ext-install pdo pdo_mysql
aneasystone@little-stone:~/blog/websites$ sudo docker restart typecho-php

四、升级 Typecho

至此，博客已经基本上完成了迁移，接着又把 Typecho 的版本升级了下。Typecho 1.1 正式版发布有 1 年多了，但我的版本还是 1.0，一直怕麻烦懒得升级，看着控制台的有新版本的提醒，都已经习惯性的无视了。这次趁着博客迁移，顺便升级下，才发现升级简单的很。

首先从 Typecho 的下载页面下载 Typecho 1.1 正式版，然后按照官方的升级步骤先备份 /admin/、/var/、/index.php、/install.php 这几个文件，要注意 /usr/ 目录不用动，正如上面提到的，这个目录下保存着用户自己的一些文件，包括主题，插件和上传的文件。然后解压下载的最新版本，将相应的几个文件和目录拷贝到 websites 目录。

这时 Typecho 的前台页面还可以照常访问，没有任何变化。不过访问管理后台时，可以看到检测到新版本的提醒：

我们点击 “完成升级” 按钮就升级成功了。可以看出 Typecho 的升级和插件、主题的安装一样，都还是手工操作的方式，如果能做一个管理的功能，那多好啊。

五、支持 HTTPS

HTTPS 早就已经是主流，譬如百度早在 2014 年就已经主持全站 HTTPS，而且谷歌的 Chrome 浏览器从 Version 68 开始，将对所有 HTTP 网站显示 “不安全” 的警告，所以用最新版的浏览器访问我的博客，左上角都能看到 “不安全” 的字样，这让人很不舒服，于是决定也投入到 HTTPS 的怀抱中来。

关于 HTTPS 相关的概念，我之前有一篇博客《HTTPS 和证书》做了详细的介绍，感兴趣的同学可以参考。要想让你的网站支持 HTTPS，你必须得有 SSL 安全证书，理论上我们自己也可以给自己签发证书，但是自己签发的证书，一般的浏览器都不会信任，所以我们要找证书授权中心，也就是所谓的 CA 来签发证书。在以前，签发 SSL 安全证书都是由一些比较大型的 CA 机构，比如 GeoTrust、GlobalSign 等来提供服务，而通常证书签发服务价格都比较昂贵，不过从 2015 年开始，情况有所改观，在这一年，EEF 电子前哨基金会、 Mozilla 基金会和美国密歇根大学成立了一个公益组织叫 ISRG (Internet Security Research Group)，他们推出了 Let’s Encrypt 免费证书。

根据你是否有访问 Web 服务器上 Shell 的权限，有两种方式来获取 Let’s Encrypt 证书，一种是使用官方推出的 ACME 客户端 Certbot，它可以通过 ACME 协议自动从 Let’s Encrypt CA 获取证书，另一种是使用主机供应商提供的服务，或者使用 Certbot 的手工模式生成证书，再上传到服务器上。很显然，第一种方式是最简单的。

访问 Certbot 的首页，选择你使用的软件（Apache、Nginx、Haproxy 等）以及你使用的操作系统，Certbot 暂时只支持 UNIX-like 类的操作系统，不支持 Windows，所以如果你的 Web 服务器是 Windows Server，可能要使用其他的 ACME 客户端，比如 acme.sh 脚本就支持 Windows（cygwin）。我这里选择 Nginx + Ubuntu 14.04 (trusty)：

下面会显示相应的操作步骤：

$ sudo certbot --nginx

这个命令使用了 Certbot 的 nginx 插件，它会自动获取证书，并且会自动修改你的 Nginx 配置文件，将证书自动设置好。当然，如果你不想让 Certbot 修改你的 Nginx 配置文件，可以加上 certonly 参数（官方将其称为 子命令）：

$ sudo certbot --nginx certonly

其实，这个命令也会修改你的 Nginx 配置文件，它的执行流程如下：

临时修改 Nginx 配置，添加一个新的 server 块，用于处理 ACME Challenge（详见 ACME 协议）
重新启动 Nginx
回滚相应的配置改动
再次重新启动 Nginx

如果你对这个流程还是不放心，不想让 Certbot 动你的 Nginx，或者像我这里遇到的场景一样，Nginx 运行在 Docker 容器里，而 Certbot 运行在宿主机里，Certbot 没法自动重启 Nginx，那么可以选择使用 webroot 插件：

$ sudo certbot certonly --webroot -w /var/www/html -d  www.aneasystone.com

这个命令会在 Web 根目录创建一个 /.well-known/acme-challenge 文件，Let’s Encrypt 通过域名来请求这个文件，以此来验证你对该域名所对应的主机是否拥有权限。如果一切顺利，根据屏幕上的提示操作即可，最终看到下面这样的提示就说明证书获取成功了。

IMPORTANT NOTES:
 - Congratulations! Your certificate and chain have been saved at:
   /etc/letsencrypt/live/www.aneasystone.com/fullchain.pem
   Your key file has been saved at:
   /etc/letsencrypt/live/www.aneasystone.com/privkey.pem
   Your cert will expire on 2019-04-04. To obtain a new or tweaked
   version of this certificate in the future, simply run certbot-auto
   again. To non-interactively renew *all* of your certificates, run
   "certbot-auto renew"
 - Your account credentials have been saved in your Certbot
   configuration directory at /etc/letsencrypt. You should make a
   secure backup of this folder now. This configuration directory will
   also contain certificates and private keys obtained by Certbot so
   making regular backups of this folder is ideal.
 - If you like Certbot, please consider supporting our work by:

   Donating to ISRG / Let's Encrypt:   https://letsencrypt.org/donate
   Donating to EFF:                    https://eff.org/donate-le

最终生成的 SSL 证书位于 /etc/letsencrypt/live/www.aneasystone.com/ 目录，我们修改 Nginx 的启动命令，将该目录挂载到 Docker 容器里：

sudo docker run -d --name typecho-nginx -p 80:80 -p 443:443 \
  -v ~/blog/nginx/conf:/etc/nginx/conf.d \
  -v /etc/letsencrypt:/etc/letsencrypt \
  -v ~/blog/websites:/var/www/html \
  nginx

然后修改 Nginx 的配置文件，将之前的 listen 80 改为 listen 443 ssl，再手动加上证书的配置：

    listen 443 ssl;

    ssl_certificate      /etc/letsencrypt/live/www.aneasystone.com/fullchain.pem;
    ssl_certificate_key  /etc/letsencrypt/live/www.aneasystone.com/privkey.pem;

最后，将 listen 80 放在一个新的 server 块，直接将 http 的请求重定向到 https 地址：

server {
    listen 80;
    server_name www.aneasystone.com;
    return 301 https://$server_name$request_uri;
}

至此，访问博客首页，发现自动跳转到 https://www.aneasystone.com 了。正在兴奋之余，还以为大功告成，却突然发现，博客上的菜单按钮点不动，F12 查看了下，才发现很多 js 和 css 报错，这是由于这些静态资源引用的是 HTTP 地址，在 HTTPS 站点引用 HTTP 资源，浏览器会直接 BLOCK 掉，所以还需要去插件和主题目录去修改所有用到的 HTTP 链接，改成 HTTPS 即可。

折腾到这里，是时候收工了。

不过对于 Certbot，还有很多东西可以学习，譬如它还支持其他的一些插件：apache、nginx、standalone、manual、webroot 等，如果你要申请泛域名证书（a wildcard certificate），还要使用 DNS 插件。下面是 Certbot 支持的插件列表：

另外，如果对 Certbot 的原理感兴趣，还可以了解下 ACME 协议。

参考

扫描二维码，在手机上阅读！

December 3, 2018

搭建自己的 Git 服务器

根据 RhodeCode 在 2016 年做过的一项分析报告 Version Control Systems Popularity in 2016，在如今的 VCS（版本控制系统）领域，Git 几乎已经一统江山，在选择自己的 VCS 时，有 87% 的人会选择使用 Git，排在第二名的 SVN 只占 6%，无论是从 Google Trends，还是在 Stack Overflow 上的提问，都可以看到 Git 的爆发式增长。另外，根据 Eclipse 的社区调查（Eclipse Community Survey），在 2010 年前后，SVN 的使用率都远超其他几款 VCS，从 2010 年开始，SVN 的使用率开始快速下滑，相应的，Git 的使用率快速上升，并在 2014 年超过了 SVN。

现在，Git 已经成为了程序员的必备技能，越来越多的企业开始采用 Git。在开源的世界里，Github 是程序员聚集的狂欢之地，但这并不适合企业的私有项目，虽然 Github 也支持创建私有项目，但是搭建一个自己的 Git 服务器在很多时候可能是更好的选择，这篇博客将介绍并学习几种搭建 Git 服务器的方法。

Git 支持四种不同的传输协议：本地协议（Local）、HTTP(S) 协议、SSH（Secure Shell）协议以及 Git 协议，这四种协议在不同的场合有不同的用途，并且各有利弊，可以根据实际情况来选择。

一、本地协议

本地协议是 Git 最基本的协议，当我们想在本地做一些 Git 实验时，这将非常有用。我们首先建立两个目录：/git/repo 和 ~/working，前者作为远程版本库，后者作为本地工作目录。

aneasystone@little-stone:~$ sudo mkdir -p /git/repo
aneasystone@little-stone:~$ sudo git init --bare /git/repo/test.git
已初始化空的 Git 仓库于 /git/repo/test.git/

我们在 /git/repo 目录通过 git init --bare 命令创建一个裸仓库（bare repository，即一个不包含当前工作目录的仓库），只要这一步，我们就可以开始使用了。接着我们在工作目录 clone 这个版本库：

aneasystone@little-stone:~$ cd ~/working/
aneasystone@little-stone:~/working$ git clone /git/repo/test.git
正克隆到 'test'...
warning: 您似乎克隆了一个空仓库。
完成。

然后我们可以使用 pull、push 就像操作其他的版本库一样。

aneasystone@little-stone:~/working$ cd test/
aneasystone@little-stone:~/working/test$ touch 1
aneasystone@little-stone:~/working/test$ touch 2
aneasystone@little-stone:~/working/test$ git add .
aneasystone@little-stone:~/working/test$ git commit -m 'first commit'
[master （根提交） 4983f84] first commit
 2 files changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 1
 create mode 100644 2
aneasystone@little-stone:~/working/test$ sudo git push
[sudo] aneasystone 的密码： 
对象计数中: 3, 完成.
Delta compression using up to 8 threads.
压缩对象中: 100% (2/2), 完成.
写入对象中: 100% (3/3), 205 bytes | 205.00 KiB/s, 完成.
Total 3 (delta 0), reused 0 (delta 0)
To /git/repo/test.git
 * [new branch]      master -> master

本地协议不仅在做 Git 实验时很有用，如果你的团队有一个共享文件系统，可以在这个共享文件系统上创建一个远程版本库，团队成员把这个共享文件系统挂在本地，就可以直接使用本地协议进行协作开发，完全不需要搭建一台专门的 Git 服务器。

二、SSH 协议

本地协议虽然简单，但是一般来说并不适用，因为你无法控制用户对共享文件系统的操作，用户拥有 push 权限也就意味着用户对远程目录拥有完整的 Shell 权限，他们有可能会无意甚至有意的修改或删除 Git 内部文件，损坏 Git 仓库。

更安全的做法是使用专门的 Git 服务器，如果你有一台可以使用 SSH 连接的服务器，搭建 Git 服务将会非常简单。首先我们要确保服务器上运行着 SSH 服务（sshd），大多数 Linux 服务器版本都默认包含了该服务，如果没有，可以先安装 openssh-server。然后在服务器上创建 Git 远程版本库：

root@myserver:~# mkdir -p /git/repo
root@myserver:~# git init --bare /git/repo/test.git
已初始化空的 Git 仓库于 /git/repo/test.git/

然后在本地 clone 这个版本库：

aneasystone@little-stone:~/working$ git clone ssh://root@myserver/git/repo/test.git
正克隆到 'test'...
root@myserver's password: 
warning: 您似乎克隆了一个空仓库。

可以看到和使用本地协议几乎一样，不同的地方在于，在 clone 的时候需要在 URL 前面加上 ssh://root@myserver，你也可以使用 scp 式的写法：

$ git clone root@myserver:/git/repo/test.git

另外一点不同的地方是，每次 pull、push 的时候都需要输入远程服务器的 root 密码。很显然，让每个 Git 用户都使用 root 来访问服务器是一种很不安全的做法，有几种方法可以解决这个问题：

最显而易见的方法是为每个 Git 用户创建一个独立的账号，并分别为他们分配对仓库的读写权限，这种方法行的通，但是对账号的管理非常麻烦，在团队人员不是很多的时候可以尝试，但是并不推荐；
另一种方法是配置 SSH 服务器使用某个已有的认证系统来管理用户，比如 LDAP，这在很多企业中是很常见的，这样可以省去用 adduser 手工管理服务器账号的麻烦；
还有一种方法是只创建一个账号，比如叫做 git，他对仓库具有读写权限，大家都使用这个账号来访问仓库。这种方法的好处是用户管理起来比较简单，而且可以使用后面介绍的 authorized_keys 文件对用户的公钥进行管理；

下面我们尝试下第三种方法。首先在服务器上创建一个名叫 git 的账号：

root@myserver:~# adduser git
Adding user `git' ...
Adding new group `git' (1000) ...
Adding new user `git' (1000) with group `git' ...
Creating home directory `/home/git' ...
Copying files from `/etc/skel' ...
Enter new UNIX password: 
Retype new UNIX password: 
passwd: password updated successfully
Changing the user information for git
Enter the new value, or press ENTER for the default
    Full Name []: git
    Room Number []:   
    Work Phone []: 
    Home Phone []: 
    Other []: 
Is the information correct? [Y/n] Y

再设置一下 git 仓库的权限（默认情况下，git 仓库的权限为 rwxr-xr-x，只有创建者 root 有写的权限，也就意味着使用 git 账号只能 clone pull，不能 push）：

# chmod a+w -R /git/repo/test.git

我们这里非常粗暴的使用 chmod a+w 将 git 仓库设置为对所有人可写，这里可以想一想，如果我们希望设置某些用户对仓库具有只读的权限，该怎么做呢？

然后就可以在本地愉快的进行 git 操作了：

$ git clone git@myserver:/git/repo/test.git

到这里似乎一切都很正常，但是几次实操之后你就会发现，每次 git 操作都要输入一次密码，这也太麻烦了，能不能“免密提交代码”呢？首先我们要知道，只要能通过 SSH 登陆到服务器，我们就能操作 git，所以如果 SSH 能支持免密登陆，我们就可以“免密提交代码”。还好，SSH 支持公钥认证，这种认证方式无需密码登陆。在 Linux 操作系统中，每个用户都可以拥有自己的一个或多个密钥对（公钥和私钥成对出现），这些密钥一般情况会保存在 ~/.ssh 目录下，在开始之前，我们先确认下自己是否已经生成过公钥了，可以看下这个目录下是否有 id_dsa.pub 或 id_rsa.pub 这样的文件，如果没有，我们通过 ssh-keygen 来生成：

aneasystone@little-stone:~/.ssh$ ssh-keygen
Generating public/private rsa key pair.
Enter file in which to save the key (/home/aneasystone/.ssh/id_rsa): 
Enter passphrase (empty for no passphrase): 
Enter same passphrase again: 
Your identification has been saved in /home/aneasystone/.ssh/id_rsa.
Your public key has been saved in /home/aneasystone/.ssh/id_rsa.pub.
The key fingerprint is:
SHA256:4Ulpufuhs/AgDMb0VXnqMUTw6bD/HrAOI2z9c1cod9I aneasystone@little-stone
The key's randomart image is:
+---[RSA 2048]----+
|      .oo.       |
|       oo+.      |
|  .   o.Oo       |
| o . . B++       |
|  + . ..So   o   |
| . + . ..+. + E  |
|    * * + oo +   |
|   . o Oo+.o.    |
|        **+.     |
+----[SHA256]-----+

这样我们在 ~/.ssh 目录生成了两个文件，id_rsa 是你的私钥，id_rsa.pub 是你的公钥。关于私钥和公钥的原理以及 RSA 加密算法等内容可以参考我之前写过的一篇介绍 HTTPS 和证书的文章。

我们假设你的 Git 服务器是由专门的服务器管理员负责维护和管理，当你生成你的公钥之后，就可以给服务器管理员发送一封申请 Git 服务的邮件，并附上你的公钥。服务器管理员在收到你的申请之后，如果同意了，就可以进行下面的操作：

首先将公钥文件拷贝到服务器上：

# scp id_rsa.pub root@myserver:/home/git

将公钥文件的内容追加到 git 账户的 authorized_keys 文件中（要注意的是，如果是第一次操作，/home/git 目录下是没有 .ssh 目录的，需要手工创建 .ssh 目录和 authorized_keys 文件）：

root@myserver:/home/git# cat id_rsa.pub >> /home/git/.ssh/authorized_keys

后续如果有其他的用户申请 Git 服务，都可以按照这个步骤操作。一旦完成这个操作，服务器管理员将会回复你的邮件，通知你 Git 服务已经开通，这个时候你再进行 git 操作就可以不用输入密码了。关于 SSH 的使用，更详细的步骤可以参考 Github 上的这篇指南：Connecting to GitHub with SSH。

作为服务器管理员，关于 SSH 还有一点需要考虑，那就是 SSH 的安全问题。在上面介绍本地协议时，我们说这种方式无法控制用户对 Git 仓库的操作，无法防止用户有意或无意的损坏 Git 仓库，使用 SSH 协议一样存在这样的问题，用户能通过 SSH 拉取和提交代码，也就意味着用户可以通过 SSH 连接到服务器，对 Git 仓库进行任何操作，这是一件很让人担心的事情。

因此，我们还需要对 git 账号做一些限制。默认情况下，我们新建账号的登陆 shell 是 /bin/bash，这个配置在 /etc/passwd 文件中：

git:x:1000:1000:git,,,:/home/git:/bin/bash

可以使用 chsh 命令修改用户的登陆 shell，让他不能通过 SSH 访问服务器，怎么修改呢？我们可以看一下 /etc/shells 文件，这里定义了所有可以使用的登陆 shell，你可以将 /bin/bash 改成这里的任何一个：

root@myserver:~# cat /etc/shells 
# /etc/shells: valid login shells
/bin/sh
/bin/dash
/bin/bash
/bin/rbash

很显然，这些 shell 并不是我们想要的，有没有一个 shell 只允许用户进行 git 操作，而不允许其他操作呢？还好，Git 的软件包提供了一个名叫 git-shell 的登陆 shell，我们可以把他加进去，一般情况下位于 /usr/bin/git-shell。我们使用 chsh 修改 git 的登陆 shell：

root@myserver:~# chsh git
Changing the login shell for git
Enter the new value, or press ENTER for the default
    Login Shell [/bin/bash]: /usr/bin/git-shell

这样当用户 git 通过 SSH 连接服务器时，就会直接被拒绝了。

三、Git 协议

SSH 协议解决了用户直接操作 Git 仓库的权限问题，但是如果我们希望对除仓库维护者之外的所有人都开放 Git 仓库的只读权限，这在开源项目中和企业内部往往是很常见的，任何人都可以去查看仓库的代码，这时管理员需要给每一个用户配置 SSH 密钥是非常麻烦的。虽然也可以使用变通的方法来达到这个效果，但是很繁琐，下面是具体的步骤：

使用 g+w 设置 Git 仓库的权限，让仓库创建者所在的用户组具有写权限，而不是所有人都有写权限（这一步通常也可以在 git init 的时候加上 --shared 参数）；
然后将 git 账号加到仓库创建者的用户组；
再创建一个 git_ro 账户，这个账户对仓库只有只读权限；
最后为 git_ro 账户创建一个密钥对，把 git_ro 的私钥公开出来供所有人使用。

可以看到使用 SSH 协议最终都逃不过授权这一步，而且公开私钥的做法也不是很优雅。实际上，Git 提供了另一种方式来让这个操作更简单，那就是 Git 协议。使用 Git 协议必须要在服务器上运行 Git 守护进程，git 命令自带了一个 daemon 参数：

root@myserver:~# git daemon --reuseaddr --base-path=/git/repo/ /git/repo/

上面的各个参数可以参考 git-daemon 的文档。git-daemon 会监听 9418 端口，如果你的服务器有防火墙，需要将该端口添加到白名单，如果你使用的是阿里云服务器，需要像下面这样添加一个安全组规则：

为了让所有的用户都可以访问我们的仓库，还需要在仓库目录下创建一个名为 git-daemon-export-ok 的文件：

root@myserver:~# cd /git/repo/test.git/
root@myserver:/git/repo/test.git/# touch git-daemon-export-ok

至此，所有人都可以通过 Git 协议来克隆或拉取项目源码了（注意上面指定了 base-path 参数为 /git/repo/，所以 URL 可以直接写 git://myserver/test.git）：

aneasystone@little-stone:~/working$ git clone git://myserver/test.git

一般情况下，服务器管理员还会做一些其他的配置，譬如在服务器重启时让 Git 守护进程自动启动，这有很多种方式可以实现，可以参考《Pro Git》 Git 守护进程这一节的内容。

四、HTTP(S) 协议

我们一般通过 Git 协议进行无授权访问，通过 SSH 协议进行授权访问，如果你的项目是内部项目，只针对部分授权用户，那使用 SSH 协议就足够了，但是如果既需要授权访问也需要无授权访问，可能需要 SSH 协议和 Git 协议搭配使用，这在维护上成本很高。这时就到了我们的压轴戏 —— HTTP 协议出场的时候了，它同时支持上面两种访问方式。

通过 HTTP 协议访问 Git 服务是目前使用最广泛的方式，它支持两种模式：旧版本的 Dumb HTTP 和新版本的 Smart HTTP，Dumb HTTP 一般很少使用，下面除非特殊说明，所说的 HTTP 协议都是 Smart HTTP。使用 HTTP 协议的好处是可以使用各种 HTTP 认证机制，比如用户名/密码，这比配置 SSH 密钥要简单的多，对普通用户来说也更能接受。如果担心数据传输安全，也可以配置 HTTPS 协议，这和普通的 Web 服务是一样的。

下面我们就来尝试搭建一个基于 HTTP 协议的 Git 服务器。《Pro Git》上提供了一个基于 Apache 的配置示例，如果你是使用 Apache 作为 Web 服务器，可以参考之，我们这里使用 Nginx 来作为 Web 服务器，其原理本质上是一样的，都是通过 Web 服务器接受 HTTP 请求，并将请求转发到 Git 自带的一个名为 git-http-backend 的 CGI 脚本。

首先我们安装所需的软件：

# apt-get install -y git-core nginx fcgiwrap apache2-utils

其中，Nginx 作为 Web 服务器，本身是不能执行外部 CGI 脚本的，需要通过 fcgiwrap 来中转，就像使用 php-fpm 来执行 PHP 脚本一样。apache2-utils 是 Apache 提供的一个 Web 服务器的工具集，包含了一些有用的小工具，譬如下面我们会用到的 htpasswd 可以生成 Basic 认证文件。

启动 nginx 和 fcgiwrap，并访问 http://myserver 测试 Web 服务器是否能正常访问：

# service nginx start
# service fcgiwrap start

然后我们打开并编辑 Nginx 的配置文件（/etc/nginx/sites-available/default）:

location / {
        include fastcgi_params;
        fastcgi_param SCRIPT_FILENAME /usr/lib/git-core/git-http-backend;
        fastcgi_param GIT_HTTP_EXPORT_ALL "";
        fastcgi_param GIT_PROJECT_ROOT /git/repo;
        fastcgi_param PATH_INFO $uri;
        fastcgi_param REMOTE_USER $remote_user;
        fastcgi_pass unix:/var/run/fcgiwrap.socket;
}

这里通过 fastcgi_param 设置了一堆的 FastCGI 参数，如下：

SCRIPT_FILENAME：指定 CGI 脚本 git-http-backend 的位置，表示每次 HTTP 请求会被转发到该 CGI 脚本；
GIT_HTTP_EXPORT_ALL：git-http-backend 默认只能访问目录下有 git-daemon-export-ok 文件的 Git 仓库，和上面介绍的 Git 协议是一样的，如果指定了 GIT_HTTP_EXPORT_ALL，表示允许访问所有仓库；
GIT_PROJECT_ROOT：Git 仓库的根目录；
REMOTE_USER：如果有认证，将认证的用户信息传到 CGI 脚本；

改完之后我们重启 Nginx，并通过 HTTP 协议 clone 仓库：

aneasystone@little-stone:~/working$ git clone http://myserver/test.git

4.1 开启身份认证

到这里一切 OK，但是当我们 push 代码的时候，却会报下面的 403 错误：

aneasystone@little-stone:~/working/test$ git push origin master
fatal: unable to access 'http://myserver/test.git/': The requested URL returned error: 403

为了解决这个错误，我们可以在 git-http-backend 的官网文档上找到这样的一段描述：

By default, only the upload-pack service is enabled, which serves git fetch-pack and git ls-remote clients, which are invoked from git fetch, git pull, and git clone. If the client is authenticated, the receive-pack service is enabled, which serves git send-pack clients, which is invoked from git push.

第一次读这段话可能会有些不知所云，这是因为我们对这里提到的 upload-pack、fetch-pack、receive-pack、send-pack 这几个概念还没有什么认识。但是我们大抵可以猜出来，默认情况下，只有认证的用户才可以 push 代码，如果某个 Git 仓库希望所有用户都有权限 push 代码，可以为相应的仓库设置 http.receivepack：

root@myserver:/# cd /git/repo/test.git/
root@myserver:/git/repo/test.git# git config http.receivepack true

当然最好的做法还是对 push 操作开启认证，官网文档上有一个 lighttpd 的配置我们可以借鉴：

$HTTP["querystring"] =~ "service=git-receive-pack" {
    include "git-auth.conf"
}
$HTTP["url"] =~ "^/git/.*/git-receive-pack$" {
    include "git-auth.conf"
}

这个配置看上去非常简单，但是想要理解为什么这样配置，就必须去了解下 Git 的内部原理。正如上面 git-http-backend 文档上的那段描述，当 Git 客户端执行 git fetch, git pull, and git clone 时，会调用 upload-pack 服务，当执行 git push 时，会调用 receive-pack 服务，为了更清楚的说明这一点，我们来看看 Nginx 的访问日志。

执行 git clone：

[27/Nov/2018:22:18:00] "GET /test.git/info/refs?service=git-upload-pack HTTP/1.1" 200 363 "-" "git/1.9.1"
[27/Nov/2018:22:18:00] "POST /test.git/git-upload-pack HTTP/1.1" 200 306 "-" "git/1.9.1"

执行 git pull：

[27/Nov/2018:22:20:25] "GET /test.git/info/refs?service=git-upload-pack HTTP/1.1" 200 363 "-" "git/1.9.1"
[27/Nov/2018:22:20:25] "POST /test.git/git-upload-pack HTTP/1.1" 200 551 "-" "git/1.9.1"

执行 git push：

[27/Nov/2018:22:19:33] "GET /test.git/info/refs?service=git-receive-pack HTTP/1.1" 401 204 "-" "git/1.9.1"
admin [27/Nov/2018:22:19:33] "GET /test.git/info/refs?service=git-receive-pack HTTP/1.1" 200 193 "-" "git/1.9.1"
admin [27/Nov/2018:22:19:33] "POST /test.git/git-receive-pack HTTP/1.1" 200 63 "-" "git/1.9.1"

可以看到执行 clone 和 pull 请求的接口是一样的，先请求 /info/refs?service=git-upload-pack，然后再请求 /git-upload-pack；而 push 是先请求 /info/refs?service=git-receive-pack，然后再请求 /git-receive-pack，所以在上面的 lighttpd 的配置中我们看到了两条记录，如果要对 push 做访问控制，那么对这两个请求都要限制。关于 Git 传输的原理可以参考《Pro Git》的 Git 内部原理 - 传输协议这一节。

我们依葫芦画瓢，Nginx 配置文件如下：

location @auth {
        auth_basic "Git Server";
        auth_basic_user_file /etc/nginx/passwd;

        include fastcgi_params;
        fastcgi_param SCRIPT_FILENAME /usr/lib/git-core/git-http-backend;
        fastcgi_param GIT_HTTP_EXPORT_ALL "";
        fastcgi_param GIT_PROJECT_ROOT /git/repo;
        fastcgi_param PATH_INFO $uri;
        fastcgi_param REMOTE_USER $remote_user;
        fastcgi_pass unix:/var/run/fcgiwrap.socket;
}

location / {
        error_page 418 = @auth;
        if ( $query_string = "service=git-receive-pack" ) {  return 418; }
        if ( $uri ~ "git-receive-pack$" ) { return 418; }

        include fastcgi_params;
        fastcgi_param SCRIPT_FILENAME /usr/lib/git-core/git-http-backend;
        fastcgi_param GIT_HTTP_EXPORT_ALL "";
        fastcgi_param GIT_PROJECT_ROOT /git/repo;
        fastcgi_param PATH_INFO $uri;
        fastcgi_param REMOTE_USER $remote_user;
        fastcgi_pass unix:/var/run/fcgiwrap.socket;
}

其中相同的配置我们也可以用 include 指令放在一个共用的配置文件里，这样我们就实现了在 push 的时候需要填写用户名和密码了。我们通过 Nginx 的 auth_basic_user_file 指令来做身份认证，用户名和密码保存在 /etc/nginx/passwd 文件中，这个文件可以使用上面提到的 apache2-utils 包里的 htpasswd 来生成：

root@myserver:/# htpasswd -cb /etc/nginx/passwd admin 123456

另外，在 push 的时候，有时候可能会遇到 unpack failed: unable to create temporary object directory 这样的提示错误：

aneasystone@little-stone:~/working/test$ git push origin master
Counting objects: 3, done.
Writing objects: 100% (3/3), 193 bytes | 0 bytes/s, done.
Total 3 (delta 0), reused 0 (delta 0)
error: unpack failed: unable to create temporary object directory
To http://myserver/test.git
 ! [remote rejected] master -> master (unpacker error)
error: failed to push some refs to 'http://myserver/test.git'

这一般情况下都是由于 Git 仓库目录的权限问题导致的，在这里 Git 仓库的根目录 /git/repo 是 root 创建的，而运行 nginx 和 fcgiwrap 的用户都是 www-data，我们可以把 Git 仓库目录设置成对所有人可读可写，也可以像下面这样将它的拥有者设置成 www-data 用户：

root@myserver:/# chown -R www-data:www-data /git/repo

4.2 凭证管理

上面我们站在管理员的角度解决了用户身份认证的问题，但是站在用户的角度，每次提交代码都要输入用户名和密码是一件很痛苦的事情。在上面介绍 SSH 协议时，我们可以使用 SSH 协议自带的公钥认证机制来省去输入密码的麻烦，那么在 HTTP 协议中是否存在类似的方法呢？答案是肯定的，那就是 Git 的凭证存储工具：credential.helper。

譬如像下面这样，将用户名和密码信息保存在缓存中：

$ git config --global credential.helper cache

这种方式默认只保留 15 分钟，如果要改变保留的时间，可以通过 --timeout 参数设置，或者像下面这样，将密码保存在文件中：

$ git config --global credential.helper store

这种方式虽然可以保证密码不过期，但是要记住的是，这种方式密码是以明文的方式保存在你的 home 目录下的。可以借鉴操作系统自带的凭证管理工具来解决这个问题，比如 OSX Keychain 或者 Git Credential Manager for Windows。更多的内容可以参考《Pro Git》凭证存储这一节。

除此之外，还有一种更简单粗暴的方式：

aneasystone@little-stone:~/working$ git clone http://admin:123456@myserver/test.git

五、综合对比

这一节对 Git 的四大协议做一个综合对比。

本地协议
- 优点：架设简单，不依赖外部服务，直接使用现有文件和网络权限，常用于共享文件系统
- 缺点：共享文件系统的配置和使用不方便，且无法保护仓库被意外损坏，传输性能较低
SSH 协议
- 优点：架设简单，所有数据经过授权加密，数据传输很安全，传输性能很高
- 缺点：不支持匿名访问，配置 SSH 的密钥对小白用户有一定的门槛
Git 协议
- 优点：对开放的项目很适用，无需授权，传输性能最高
- 缺点：缺乏授权机制，架设较麻烦，企业一般不会默认开放 9418 端口需要另行添加
HTTP/S 协议
- 优点：同时支持授权访问和无授权访问，传输性能较高，配合 HTTPS 也可以实现数据安全
- 缺点：架设 HTTP 服务较麻烦，认证凭证不好管理

六、更高级的工具

上面介绍的是搭建 Git 服务器最基本的方法，如果你只是希望能找一个版本控制系统来替代现有的 SVN，这也许就足够了。但如果你希望你的版本控制系统能拥有一个更友好的 UI 界面，能更好的管理你的用户和权限，能支持更现代的 Pull Request 功能以及能和 CI/CD 系统更紧密的联系起来，你就需要一个更高级的工具，你可以试试 GitWeb、Gitolite、Gitlab、Gogs、Gitea，当然，如果你愿意，你也可以把代码放在那些流行的代码托管平台上，比如 Github、Bitbucket 等等。

参考

扫描二维码，在手机上阅读！

November 1, 2018

实战 Prometheus 搭建监控系统

Prometheus 是一款基于时序数据库的开源监控告警系统，说起 Prometheus 则不得不提 SoundCloud，这是一个在线音乐分享的平台，类似于做视频分享的 YouTube，由于他们在微服务架构的道路上越走越远，出现了成百上千的服务，使用传统的监控系统 StatsD 和 Graphite 存在大量的局限性，于是他们在 2012 年开始着手开发一套全新的监控系统。Prometheus 的原作者是 Matt T. Proud，他也是在 2012 年加入 SoundCloud 的，实际上，在加入 SoundCloud 之前，Matt 一直就职于 Google，他从 Google 的集群管理器 Borg 和它的监控系统 Borgmon 中获取灵感，开发了开源的监控系统 Prometheus，和 Google 的很多项目一样，使用的编程语言是 Go。

很显然，Prometheus 作为一个微服务架构监控系统的解决方案，它和容器也脱不开关系。早在 2006 年 8 月 9 日，Eric Schmidt 在搜索引擎大会上首次提出了云计算（Cloud Computing）的概念，在之后的十几年里，云计算的发展势如破竹。在 2013 年，Pivotal 的 Matt Stine 又提出了云原生（Cloud Native）的概念，云原生由微服务架构、DevOps 和以容器为代表的敏捷基础架构组成，帮助企业快速、持续、可靠、规模化地交付软件。为了统一云计算接口和相关标准，2015 年 7 月，隶属于 Linux 基金会的云原生计算基金会（CNCF，Cloud Native Computing Foundation）应运而生。第一个加入 CNCF 的项目是 Google 的 Kubernetes，而 Prometheus 是第二个加入的（2016 年）。

目前 Prometheus 已经广泛用于 Kubernetes 集群的监控系统中，对 Prometheus 的历史感兴趣的同学可以看看 SoundCloud 的工程师 Tobias Schmidt 在 2016 年的 PromCon 大会上的演讲：The History of Prometheus at SoundCloud 。

一、Prometheus 概述

我们在 SoundCloud 的官方博客中可以找到一篇关于他们为什么需要新开发一个监控系统的文章 Prometheus: Monitoring at SoundCloud，在这篇文章中，他们介绍到，他们需要的监控系统必须满足下面四个特性：

A multi-dimensional data model, so that data can be sliced and diced at will, along dimensions like instance, service, endpoint, and method.
Operational simplicity, so that you can spin up a monitoring server where and when you want, even on your local workstation, without setting up a distributed storage backend or reconfiguring the world.
Scalable data collection and decentralized architecture, so that you can reliably monitor the many instances of your services, and independent teams can set up independent monitoring servers.
Finally, a powerful query language that leverages the data model for meaningful alerting (including easy silencing) and graphing (for dashboards and for ad-hoc exploration).

简单来说，就是下面四个特性：

多维度数据模型
方便的部署和维护
灵活的数据采集
强大的查询语言

实际上，多维度数据模型和强大的查询语言这两个特性，正是时序数据库所要求的，所以 Prometheus 不仅仅是一个监控系统，同时也是一个时序数据库。那为什么 Prometheus 不直接使用现有的时序数据库作为后端存储呢？这是因为 SoundCloud 不仅希望他们的监控系统有着时序数据库的特点，而且还需要部署和维护非常方便。纵观比较流行的时序数据库（参见下面的附录），他们要么组件太多，要么外部依赖繁重，比如：Druid 有 Historical、MiddleManager、Broker、Coordinator、Overlord、Router 一堆的组件，而且还依赖于 ZooKeeper、Deep storage（HDFS 或 S3 等），Metadata store（PostgreSQL 或 MySQL），部署和维护起来成本非常高。而 Prometheus 采用去中心化架构，可以独立部署，不依赖于外部的分布式存储，你可以在几分钟的时间里就可以搭建出一套监控系统。

此外，Prometheus 数据采集方式也非常灵活。要采集目标的监控数据，首先需要在目标处安装数据采集组件，这被称之为 Exporter，它会在目标处收集监控数据，并暴露出一个 HTTP 接口供 Prometheus 查询，Prometheus 通过 Pull 的方式来采集数据，这和传统的 Push 模式不同。不过 Prometheus 也提供了一种方式来支持 Push 模式，你可以将你的数据推送到 Push Gateway，Prometheus 通过 Pull 的方式从 Push Gateway 获取数据。目前的 Exporter 已经可以采集绝大多数的第三方数据，比如 Docker、HAProxy、StatsD、JMX 等等，官网有一份 Exporter 的列表。

除了这四大特性，随着 Prometheus 的不断发展，开始支持越来越多的高级特性，比如：服务发现，更丰富的图表展示，使用外部存储，强大的告警规则和多样的通知方式。下图是 Prometheus 的整体架构图（图片来源）：

从上图可以看出，Prometheus 生态系统包含了几个关键的组件：Prometheus server、Pushgateway、Alertmanager、Web UI 等，但是大多数组件都不是必需的，其中最核心的组件当然是 Prometheus server，它负责收集和存储指标数据，支持表达式查询，和告警的生成。接下来我们就来安装 Prometheus server。

二、安装 Prometheus server

Prometheus 可以支持多种安装方式，包括 Docker、Ansible、Chef、Puppet、Saltstack 等。下面介绍最简单的两种方式，一种是直接使用编译好的可执行文件，开箱即用，另一种是使用 Docker 镜像，更多的安装方式可以参考这里。

2.1 开箱即用

首先从官网的下载页面获取 Prometheus 的最新版本和下载地址，目前最新版本是 2.4.3（2018年10月），执行下面的命令下载并解压：

$ wget https://github.com/prometheus/prometheus/releases/download/v2.4.3/prometheus-2.4.3.linux-amd64.tar.gz
$ tar xvfz prometheus-2.4.3.linux-amd64.tar.gz

然后切换到解压目录，检查 Prometheus 版本：

$ cd prometheus-2.4.3.linux-amd64
$ ./prometheus --version
prometheus, version 2.4.3 (branch: HEAD, revision: 167a4b4e73a8eca8df648d2d2043e21bdb9a7449)
  build user:       root@1e42b46043e9
  build date:       20181004-08:42:02
  go version:       go1.11.1

运行 Prometheus server：

$ ./prometheus --config.file=prometheus.yml

2.2 使用 Docker 镜像

使用 Docker 安装 Prometheus 更简单，运行下面的命令即可：

$ sudo docker run -d -p 9090:9090 prom/prometheus

一般情况下，我们还会指定配置文件的位置：

$ sudo docker run -d -p 9090:9090 \
    -v ~/docker/prometheus/:/etc/prometheus/ \
    prom/prometheus

我们把配置文件放在本地 ~/docker/prometheus/prometheus.yml，这样可以方便编辑和查看，通过 -v 参数将本地的配置文件挂载到 /etc/prometheus/ 位置，这是 prometheus 在容器中默认加载的配置文件位置。如果我们不确定默认的配置文件在哪，可以先执行上面的不带 -v 参数的命令，然后通过 docker inspect 命名看看容器在运行时默认的参数有哪些（下面的 Args 参数）：

$ sudo docker inspect 0c
[...]
        "Id": "0c4c2d0eed938395bcecf1e8bb4b6b87091fc4e6385ce5b404b6bb7419010f46",
        "Created": "2018-10-15T22:27:34.56050369Z",
        "Path": "/bin/prometheus",
        "Args": [
            "--config.file=/etc/prometheus/prometheus.yml",
            "--storage.tsdb.path=/prometheus",
            "--web.console.libraries=/usr/share/prometheus/console_libraries",
            "--web.console.templates=/usr/share/prometheus/consoles"
        ],

[...]

2.3 配置 Prometheus

正如上面两节看到的，Prometheus 有一个配置文件，通过参数 --config.file 来指定，配置文件格式为 YAML。我们可以打开默认的配置文件 prometheus.yml 看下里面的内容：

/etc/prometheus $ cat prometheus.yml 
# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['localhost:9090']

Prometheus 默认的配置文件分为四大块：

global 块：Prometheus 的全局配置，比如 scrape_interval 表示 Prometheus 多久抓取一次数据，evaluation_interval 表示多久检测一次告警规则；
alerting 块：关于 Alertmanager 的配置，这个我们后面再看；
rule_files 块：告警规则，这个我们后面再看；
scrape_config 块：这里定义了 Prometheus 要抓取的目标，我们可以看到默认已经配置了一个名称为 prometheus 的 job，这是因为 Prometheus 在启动的时候也会通过 HTTP 接口暴露自身的指标数据，这就相当于 Prometheus 自己监控自己，虽然这在真正使用 Prometheus 时没啥用处，但是我们可以通过这个例子来学习如何使用 Prometheus；可以访问 http://localhost:9090/metrics 查看 Prometheus 暴露了哪些指标；

更多的配置参数可以参考这里。

三、学习 PromQL

通过上面的步骤安装好 Prometheus 之后，我们现在可以开始体验 Prometheus 了。Prometheus 提供了可视化的 Web UI 方便我们操作，直接访问 http://localhost:9090/ 即可，它默认会跳转到 Graph 页面：

第一次访问这个页面可能会不知所措，我们可以先看看其他菜单下的内容，比如：Alerts 展示了定义的所有告警规则，Status 可以查看各种 Prometheus 的状态信息，有 Runtime & Build Information、Command-Line Flags、Configuration、Rules、Targets、Service Discovery 等等。

实际上 Graph 页面才是 Prometheus 最强大的功能，在这里我们可以使用 Prometheus 提供的一种特殊表达式来查询监控数据，这个表达式被称为 PromQL（Prometheus Query Language）。通过 PromQL 不仅可以在 Graph 页面查询数据，而且还可以通过 Prometheus 提供的 HTTP API 来查询。查询的监控数据有列表和曲线图两种展现形式（对应上图中 Console 和 Graph 这两个标签）。

我们上面说过，Prometheus 自身也暴露了很多的监控指标，也可以在 Graph 页面查询，展开 Execute 按钮旁边的下拉框，可以看到很多指标名称，我们随便选一个，譬如：promhttp_metric_handler_requests_total，这个指标表示 /metrics 页面的访问次数，Prometheus 就是通过这个页面来抓取自身的监控数据的。在 Console 标签中查询结果如下：

上面在介绍 Prometheus 的配置文件时，可以看到 scrape_interval 参数是 15s，也就是说 Prometheus 每 15s 访问一次 /metrics 页面，所以我们过 15s 刷新下页面，可以看到指标值会自增。在 Graph 标签中可以看得更明显：

3.1 数据模型

要学习 PromQL，首先我们需要了解下 Prometheus 的数据模型，一条 Prometheus 数据由一个指标名称（metric）和 N 个标签（label，N >= 0）组成的，比如下面这个例子：

promhttp_metric_handler_requests_total{code="200",instance="192.168.0.107:9090",job="prometheus"} 106

这条数据的指标名称为 promhttp_metric_handler_requests_total，并且包含三个标签 code、instance 和 job，这条记录的值为 106。上面说过，Prometheus 是一个时序数据库，相同指标相同标签的数据构成一条时间序列。如果以传统数据库的概念来理解时序数据库，可以把指标名当作表名，标签是字段，timestamp 是主键，还有一个 float64 类型的字段表示值（Prometheus 里面所有值都是按 float64 存储）。

这种数据模型和 OpenTSDB 的数据模型是比较类似的，详细的信息可以参考官网文档 Data model。另外，关于指标和标签的命名，官网有一些指导性的建议，可以参考 Metric and label naming 。

虽然 Prometheus 里存储的数据都是 float64 的一个数值，但如果我们按类型来分，可以把 Prometheus 的数据分成四大类：

Counter
Gauge
Histogram
Summary

Counter 用于计数，例如：请求次数、任务完成数、错误发生次数，这个值会一直增加，不会减少。Gauge 就是一般的数值，可大可小，例如：温度变化、内存使用变化。Histogram 是直方图，或称为柱状图，常用于跟踪事件发生的规模，例如：请求耗时、响应大小。它特别之处是可以对记录的内容进行分组，提供 count 和 sum 的功能。Summary 和 Histogram 十分相似，也用于跟踪事件发生的规模，不同之处是，它提供了一个 quantiles 的功能，可以按百分比划分跟踪的结果。例如：quantile 取值 0.95，表示取采样值里面的 95% 数据。更多信息可以参考官网文档 Metric types，Summary 和 Histogram 的概念比较容易混淆，属于比较高阶的指标类型，可以参考 Histograms and summaries 这里的说明。

这四种类型的数据只在指标的提供方作区分，也就是上面说的 Exporter，如果你需要编写自己的 Exporter 或者在现有系统中暴露供 Prometheus 抓取的指标，你可以使用 Prometheus client libraries，这个时候你就需要考虑不同指标的数据类型了。如果你不用自己实现，而是直接使用一些现成的 Exporter，然后在 Prometheus 里查查相关的指标数据，那么可以不用太关注这块，不过理解 Prometheus 的数据类型，对写出正确合理的 PromQL 也是有帮助的。

3.2 PromQL 入门

我们从一些例子开始学习 PromQL，最简单的 PromQL 就是直接输入指标名称，比如：

# 表示 Prometheus 能否抓取 target 的指标，用于 target 的健康检查
up

这条语句会查出 Prometheus 抓取的所有 target 当前运行情况，譬如下面这样：

up{instance="192.168.0.107:9090",job="prometheus"}    1
up{instance="192.168.0.108:9090",job="prometheus"}    1
up{instance="192.168.0.107:9100",job="server"}    1
up{instance="192.168.0.108:9104",job="mysql"}    0

也可以指定某个 label 来查询：

up{job="prometheus"}

这种写法被称为 Instant vector selectors，这里不仅可以使用 = 号，还可以使用 !=、=~、!~，比如下面这样：

up{job!="prometheus"}
up{job=~"server|mysql"}
up{job=~"192\.168\.0\.107.+"}

=~ 是根据正则表达式来匹配，必须符合 RE2 的语法。

和 Instant vector selectors 相应的，还有一种选择器，叫做 Range vector selectors，它可以查出一段时间内的所有数据：

http_requests_total[5m]

这条语句查出 5 分钟内所有抓取的 HTTP 请求数，注意它返回的数据类型是 Range vector，没办法在 Graph 上显示成曲线图，一般情况下，会用在 Counter 类型的指标上，并和 rate() 或 irate() 函数一起使用（注意 rate 和 irate 的区别）。

# 计算的是每秒的平均值，适用于变化很慢的 counter
# per-second average rate of increase, for slow-moving counters
rate(http_requests_total[5m])

# 计算的是每秒瞬时增加速率，适用于变化很快的 counter
# per-second instant rate of increase, for volatile and fast-moving counters
irate(http_requests_total[5m])

此外，PromQL 还支持 count、sum、min、max、topk 等聚合操作，还支持 rate、abs、ceil、floor 等一堆的内置函数，更多的例子，还是上官网学习吧。如果感兴趣，我们还可以把 PromQL 和 SQL 做一个对比，会发现 PromQL 语法更简洁，查询性能也更高。

3.3 HTTP API

我们不仅仅可以在 Prometheus 的 Graph 页面查询 PromQL，Prometheus 还提供了一种 HTTP API 的方式，可以更灵活的将 PromQL 整合到其他系统中使用，譬如下面要介绍的 Grafana，就是通过 Prometheus 的 HTTP API 来查询指标数据的。实际上，我们在 Prometheus 的 Graph 页面查询也是使用了 HTTP API。

我们看下 Prometheus 的 HTTP API 官方文档，它提供了下面这些接口：

GET /api/v1/query
GET /api/v1/query_range
GET /api/v1/series
GET /api/v1/label/<label_name>/values
GET /api/v1/targets
GET /api/v1/rules
GET /api/v1/alerts
GET /api/v1/targets/metadata
GET /api/v1/alertmanagers
GET /api/v1/status/config
GET /api/v1/status/flags

从 Prometheus v2.1 开始，又新增了几个用于管理 TSDB 的接口：

POST /api/v1/admin/tsdb/snapshot
POST /api/v1/admin/tsdb/delete_series
POST /api/v1/admin/tsdb/clean_tombstones

四、安装 Grafana

虽然 Prometheus 提供的 Web UI 也可以很好的查看不同指标的视图，但是这个功能非常简单，只适合用来调试。要实现一个强大的监控系统，还需要一个能定制展示不同指标的面板，能支持不同类型的展现方式（曲线图、饼状图、热点图、TopN 等），这就是仪表盘（Dashboard）功能。因此 Prometheus 开发了一套仪表盘系统 PromDash，不过很快这套系统就被废弃了，官方开始推荐使用 Grafana 来对 Prometheus 的指标数据进行可视化，这不仅是因为 Grafana 的功能非常强大，而且它和 Prometheus 可以完美的无缝融合。

Grafana 是一个用于可视化大型测量数据的开源系统，它的功能非常强大，界面也非常漂亮，使用它可以创建自定义的控制面板，你可以在面板中配置要显示的数据和显示方式，它支持很多不同的数据源，比如：Graphite、InfluxDB、OpenTSDB、Elasticsearch、Prometheus 等，而且它也支持众多的插件。

下面我们就体验下使用 Grafana 来展示 Prometheus 的指标数据。首先我们来安装 Grafana，我们使用最简单的 Docker 安装方式：

$ docker run -d -p 3000:3000 grafana/grafana

运行上面的 docker 命令，Grafana 就安装好了！你也可以采用其他的安装方式，参考官方的安装文档。安装完成之后，我们访问 http://localhost:3000/ 进入 Grafana 的登陆页面，输入默认的用户名和密码（admin/admin）即可。

要使用 Grafana，第一步当然是要配置数据源，告诉 Grafana 从哪里取数据，我们点击 Add data source 进入数据源的配置页面：

我们在这里依次填上：

Name: prometheus
Type: Prometheus
URL: http://localhost:9090
Access: Browser

要注意的是，这里的 Access 指的是 Grafana 访问数据源的方式，有 Browser 和 Proxy 两种方式。Browser 方式表示当用户访问 Grafana 面板时，浏览器直接通过 URL 访问数据源的；而 Proxy 方式表示浏览器先访问 Grafana 的某个代理接口（接口地址是 /api/datasources/proxy/），由 Grafana 的服务端来访问数据源的 URL，如果数据源是部署在内网，用户通过浏览器无法直接访问时，这种方式非常有用。

配置好数据源，Grafana 会默认提供几个已经配置好的面板供你使用，如下图所示，默认提供了三个面板：Prometheus Stats、Prometheus 2.0 Stats 和 Grafana metrics。点击 Import 就可以导入并使用该面板。

我们导入 Prometheus 2.0 Stats 这个面板，可以看到下面这样的监控面板。如果你的公司有条件，可以申请个大显示器挂在墙上，将这个面板投影在大屏上，实时观察线上系统的状态，可以说是非常 cool 的。

五、使用 Exporter 收集指标

目前为止，我们看到的都还只是一些没有实际用途的指标，如果我们要在我们的生产环境真正使用 Prometheus，往往需要关注各种各样的指标，譬如服务器的 CPU负载、内存占用量、IO开销、入网和出网流量等等。正如上面所说，Prometheus 是使用 Pull 的方式来获取指标数据的，要让 Prometheus 从目标处获得数据，首先必须在目标上安装指标收集的程序，并暴露出 HTTP 接口供 Prometheus 查询，这个指标收集程序被称为 Exporter，不同的指标需要不同的 Exporter 来收集，目前已经有大量的 Exporter 可供使用，几乎囊括了我们常用的各种系统和软件，官网列出了一份常用 Exporter 的清单，各个 Exporter 都遵循一份端口约定，避免端口冲突，即从 9100 开始依次递增，这里是完整的 Exporter 端口列表。另外值得注意的是，有些软件和系统无需安装 Exporter，这是因为他们本身就提供了暴露 Prometheus 格式的指标数据的功能，比如 Kubernetes、Grafana、Etcd、Ceph 等。

这一节就让我们来收集一些有用的数据。

5.1 收集服务器指标

首先我们来收集服务器的指标，这需要安装 node_exporter，这个 exporter 用于收集 *NIX 内核的系统，如果你的服务器是 Windows，可以使用 WMI exporter。

和 Prometheus server 一样，node_exporter 也是开箱即用的：

$ wget https://github.com/prometheus/node_exporter/releases/download/v0.16.0/node_exporter-0.16.0.linux-amd64.tar.gz
$ tar xvfz node_exporter-0.16.0.linux-amd64.tar.gz
$ cd node_exporter-0.16.0.linux-amd64
$ ./node_exporter

node_exporter 启动之后，我们访问下 /metrics 接口看看是否能正常获取服务器指标：

$ curl http://localhost:9100/metrics

如果一切 OK，我们可以修改 Prometheus 的配置文件，将服务器加到 scrape_configs 中：

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
      - targets: ['192.168.0.107:9090']
  - job_name: 'server'
    static_configs:
      - targets: ['192.168.0.107:9100']

修改配置后，需要重启 Prometheus 服务，或者发送 HUP 信号也可以让 Prometheus 重新加载配置：

$ killall -HUP prometheus

在 Prometheus Web UI 的 Status -> Targets 中，可以看到新加的服务器：

在 Graph 页面的指标下拉框可以看到很多名称以 node 开头的指标，譬如我们输入 node_load1 观察服务器负载：

如果想在 Grafana 中查看服务器的指标，可以在 Grafana 的 Dashboards 页面搜索 node exporter，有很多的面板模板可以直接使用，譬如：Node Exporter Server Metrics 或者 Node Exporter Full 等。我们打开 Grafana 的 Import dashboard 页面，输入面板的 URL（https://grafana.com/dashboards/405）或者 ID（405）即可。

注意事项

一般情况下，node_exporter 都是直接运行在要收集指标的服务器上的，官方不推荐用 Docker 来运行 node_exporter。如果逼不得已一定要运行在 Docker 里，要特别注意，这是因为 Docker 的文件系统和网络都有自己的 namespace，收集的数据并不是宿主机真实的指标。可以使用一些变通的方法，比如运行 Docker 时加上下面这样的参数：

docker run -d \
  --net="host" \
  --pid="host" \
  -v "/:/host:ro,rslave" \
  quay.io/prometheus/node-exporter \
  --path.rootfs /host

关于 node_exporter 的更多信息，可以参考 node_exporter 的文档和 Prometheus 的官方指南 Monitoring Linux host metrics with the Node Exporter，另外，Julius Volz 的这篇文章 How To Install Prometheus using Docker on Ubuntu 14.04 也是很好的入门材料。

5.2 收集 MySQL 指标

mysqld_exporter 是 Prometheus 官方提供的一个 exporter，我们首先下载最新版本并解压（开箱即用）：

$ wget https://github.com/prometheus/mysqld_exporter/releases/download/v0.11.0/mysqld_exporter-0.11.0.linux-amd64.tar.gz
$ tar xvfz mysqld_exporter-0.11.0.linux-amd64.tar.gz
$ cd mysqld_exporter-0.11.0.linux-amd64/

mysqld_exporter 需要连接到 mysqld 才能收集它的指标，可以通过两种方式来设置 mysqld 数据源。第一种是通过环境变量 DATA_SOURCE_NAME，这被称为 DSN（数据源名称），它必须符合 DSN 的格式，一个典型的 DSN 格式像这样：user:password@(host:port)/。

$ export DATA_SOURCE_NAME='root:123456@(192.168.0.107:3306)/'
$ ./mysqld_exporter

另一种方式是通过配置文件，默认的配置文件是 ~/.my.cnf，或者通过 --config.my-cnf 参数指定：

$ ./mysqld_exporter --config.my-cnf=".my.cnf"

配置文件的格式如下：

$ cat .my.cnf
[client]
host=localhost
port=3306
user=root
password=123456

如果要把 MySQL 的指标导入 Grafana，可以参考这些 Dashboard JSON。

注意事项

这里为简单起见，在 mysqld_exporter 中直接使用了 root 连接数据库，在真实环境中，可以为 mysqld_exporter 创建一个单独的用户，并赋予它受限的权限（PROCESS、REPLICATION CLIENT、SELECT），最好还限制它的最大连接数（MAX_USER_CONNECTIONS）。

CREATE USER 'exporter'@'localhost' IDENTIFIED BY 'password' WITH MAX_USER_CONNECTIONS 3;
GRANT PROCESS, REPLICATION CLIENT, SELECT ON *.* TO 'exporter'@'localhost';

5.3 收集 Nginx 指标

官方提供了两种收集 Nginx 指标的方式。第一种是 Nginx metric library，这是一段 Lua 脚本（prometheus.lua），Nginx 需要开启 Lua 支持（libnginx-mod-http-lua 模块）。为方便起见，也可以使用 OpenResty 的 OPM（OpenResty Package Manager）或者 luarocks（The Lua package manager）来安装。第二种是 Nginx VTS exporter，这种方式比第一种要强大的多，安装要更简单，支持的指标也更丰富，它依赖于 nginx-module-vts 模块，vts 模块可以提供大量的 Nginx 指标数据，可以通过 JSON、HTML 等形式查看这些指标。Nginx VTS exporter 就是通过抓取 /status/format/json 接口来将 vts 的数据格式转换为 Prometheus 的格式。不过，在 nginx-module-vts 最新的版本中增加了一个新接口：/status/format/prometheus，这个接口可以直接返回 Prometheus 的格式，从这点这也能看出 Prometheus 的影响力，估计 Nginx VTS exporter 很快就要退役了（TODO：待验证）。

除此之外，还有很多其他的方式来收集 Nginx 的指标，比如：nginx_exporter 通过抓取 Nginx 自带的统计页面 /nginx_status 可以获取一些比较简单的指标（需要开启 ngx_http_stub_status_module 模块）；nginx_request_exporter 通过 syslog 协议收集并分析 Nginx 的 access log 来统计 HTTP 请求相关的一些指标；nginx-prometheus-shiny-exporter 和 nginx_request_exporter 类似，也是使用 syslog 协议来收集 access log，不过它是使用 Crystal 语言写的。还有 vovolie/lua-nginx-prometheus 基于 Openresty、Prometheus、Consul、Grafana 实现了针对域名和 Endpoint 级别的流量统计。

有需要或感兴趣的同学可以对照说明文档自己安装体验下，这里就不一一尝试了。

5.4 收集 JMX 指标

最后让我们来看下如何收集 Java 应用的指标，Java 应用的指标一般是通过 JMX（Java Management Extensions）来获取的，顾名思义，JMX 是管理 Java 的一种扩展，它可以方便的管理和监控正在运行的 Java 程序。

JMX Exporter 用于收集 JMX 指标，很多使用 Java 的系统，都可以使用它来收集指标，比如：Kafaka、Cassandra 等。首先我们下载 JMX Exporter：

$ wget https://repo1.maven.org/maven2/io/prometheus/jmx/jmx_prometheus_javaagent/0.3.1/jmx_prometheus_javaagent-0.3.1.jar

JMX Exporter 是一个 Java Agent 程序，在运行 Java 程序时通过 -javaagent 参数来加载：

$ java -javaagent:jmx_prometheus_javaagent-0.3.1.jar=9404:config.yml -jar spring-boot-sample-1.0-SNAPSHOT.jar

其中，9404 是 JMX Exporter 暴露指标的端口，config.yml 是 JMX Exporter 的配置文件，它的内容可以参考 JMX Exporter 的配置说明。然后检查下指标数据是否正确获取：

$ curl http://localhost:9404/metrics

六、告警和通知

至此，我们能收集大量的指标数据，也能通过强大而美观的面板展示出来。不过作为一个监控系统，最重要的功能，还是应该能及时发现系统问题，并及时通知给系统负责人，这就是 Alerting（告警）。Prometheus 的告警功能被分成两部分：一个是告警规则的配置和检测，并将告警发送给 Alertmanager，另一个是 Alertmanager，它负责管理这些告警，去除重复数据，分组，并路由到对应的接收方式，发出报警。常见的接收方式有：Email、PagerDuty、HipChat、Slack、OpsGenie、WebHook 等。

6.1 配置告警规则

我们在上面介绍 Prometheus 的配置文件时了解到，它的默认配置文件 prometheus.yml 有四大块：global、alerting、rule_files、scrape_config，其中 rule_files 块就是告警规则的配置项，alerting 块用于配置 Alertmanager，这个我们下一节再看。现在，先让我们在 rule_files 块中添加一个告警规则文件：

rule_files:
  - "alert.rules"

然后参考官方文档，创建一个告警规则文件 alert.rules：

groups:
- name: example
  rules:

  # Alert for any instance that is unreachable for >5 minutes.
  - alert: InstanceDown
    expr: up == 0
    for: 5m
    labels:
      severity: page
    annotations:
      summary: "Instance {{ $labels.instance }} down"
      description: "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 5 minutes."

  # Alert for any instance that has a median request latency >1s.
  - alert: APIHighRequestLatency
    expr: api_http_request_latencies_second{quantile="0.5"} > 1
    for: 10m
    annotations:
      summary: "High request latency on {{ $labels.instance }}"
      description: "{{ $labels.instance }} has a median request latency above 1s (current value: {{ $value }}s)"

这个规则文件里，包含了两条告警规则：InstanceDown 和 APIHighRequestLatency。顾名思义，InstanceDown 表示当实例宕机时（up === 0）触发告警，APIHighRequestLatency 表示有一半的 API 请求延迟大于 1s 时（api_http_request_latencies_second{quantile="0.5"} > 1）触发告警。配置好后，需要重启下 Prometheus server，然后访问 http://localhost:9090/rules 可以看到刚刚配置的规则：

访问 http://localhost:9090/alerts 可以看到根据配置的规则生成的告警：

这里我们将一个实例停掉，可以看到有一条 alert 的状态是 PENDING，这表示已经触发了告警规则，但还没有达到告警条件。这是因为这里配置的 for 参数是 5m，也就是 5 分钟后才会触发告警，我们等 5 分钟，可以看到这条 alert 的状态变成了 FIRING。

6.2 使用 Alertmanager 发送告警通知

虽然 Prometheus 的 /alerts 页面可以看到所有的告警，但是还差最后一步：触发告警时自动发送通知。这是由 Alertmanager 来完成的，我们首先下载并安装 Alertmanager，和其他 Prometheus 的组件一样，Alertmanager 也是开箱即用的：

$ wget https://github.com/prometheus/alertmanager/releases/download/v0.15.2/alertmanager-0.15.2.linux-amd64.tar.gz
$ tar xvfz alertmanager-0.15.2.linux-amd64.tar.gz
$ cd alertmanager-0.15.2.linux-amd64
$ ./alertmanager

Alertmanager 启动后默认可以通过 http://localhost:9093/ 来访问，但是现在还看不到告警，因为我们还没有把 Alertmanager 配置到 Prometheus 中，我们回到 Prometheus 的配置文件 prometheus.yml，添加下面几行：

alerting:
  alertmanagers:
  - scheme: http
    static_configs:
    - targets:
      - "192.168.0.107:9093"

这个配置告诉 Prometheus，当发生告警时，将告警信息发送到 Alertmanager，Alertmanager 的地址为 http://192.168.0.107:9093。也可以使用命名行的方式指定 Alertmanager：

$ ./prometheus -alertmanager.url=http://192.168.0.107:9093

这个时候再访问 Alertmanager，可以看到 Alertmanager 已经接收到告警了：

下面的问题就是如何让 Alertmanager 将告警信息发送给我们了，我们打开默认的配置文件 alertmanager.ym：

global:
  resolve_timeout: 5m

route:
  group_by: ['alertname']
  group_wait: 10s
  group_interval: 10s
  repeat_interval: 1h
  receiver: 'web.hook'
receivers:
- name: 'web.hook'
  webhook_configs:
  - url: 'http://127.0.0.1:5001/'
inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['alertname', 'dev', 'instance']

参考官方的配置手册了解各个配置项的功能，其中 global 块表示一些全局配置；route 块表示通知路由，可以根据不同的标签将告警通知发送给不同的 receiver，这里没有配置 routes 项，表示所有的告警都发送给下面定义的 web.hook 这个 receiver；如果要配置多个路由，可以参考这个例子：

  routes:
  - receiver: 'database-pager'
    group_wait: 10s
    match_re:
      service: mysql|cassandra

  - receiver: 'frontend-pager'
    group_by: [product, environment]
    match:
      team: frontend

紧接着，receivers 块表示告警通知的接收方式，每个 receiver 包含一个 name 和一个 xxx_configs，不同的配置代表了不同的接收方式，Alertmanager 内置了下面这些接收方式：

email_config
hipchat_config
pagerduty_config
pushover_config
slack_config
opsgenie_config
victorops_config
wechat_configs
webhook_config

虽然接收方式很丰富，但是在国内，其中大多数接收方式都很少使用。最常用到的，莫属 email_config 和 webhook_config，另外 wechat_configs 可以支持使用微信来告警，也是相当符合国情的了。

其实告警的通知方式是很难做到面面俱到的，因为消息软件各种各样，每个国家还可能不同，不可能完全覆盖到，所以 Alertmanager 已经决定不再添加新的 receiver 了，而是推荐使用 webhook 来集成自定义的接收方式。可以参考这些集成的例子，譬如将钉钉接入 Prometheus AlertManager WebHook。

七、学习更多

到这里，我们已经学习了 Prometheus 的大多数功能，结合 Prometheus + Grafana + Alertmanager 完全可以搭建一套非常完整的监控系统。不过在真正使用时，我们会发现更多的问题。

7.1 服务发现

由于 Prometheus 是通过 Pull 的方式主动获取监控数据，所以需要手工指定监控节点的列表，当监控的节点增多之后，每次增加节点都需要更改配置文件，非常麻烦，这个时候就需要通过服务发现（service discovery，SD）机制去解决。Prometheus 支持多种服务发现机制，可以自动获取要收集的 targets，可以参考这里，包含的服务发现机制包括：azure、consul、dns、ec2、openstack、file、gce、kubernetes、marathon、triton、zookeeper（nerve、serverset），配置方法可以参考手册的 Configuration 页面。可以说 SD 机制是非常丰富的，但目前由于开发资源有限，已经不再开发新的 SD 机制，只对基于文件的 SD 机制进行维护。

关于服务发现网上有很多教程，譬如 Prometheus 官方博客中这篇文章 Advanced Service Discovery in Prometheus 0.14.0 对此有一个比较系统的介绍，全面的讲解了 relabeling 配置，以及如何使用 DNS-SRV、Consul 和文件来做服务发现。另外，官网还提供了一个基于文件的服务发现的入门例子，Julius Volz 写的 Prometheus workshop 入门教程中也使用了 DNS-SRV 来当服务发现。

7.2 告警配置管理

无论是 Prometheus 的配置还是 Alertmanager 的配置，都没有提供 API 供我们动态的修改。一个很常见的场景是，我们需要基于 Prometheus 做一套可自定义规则的告警系统，用户可根据自己的需要在页面上创建修改或删除告警规则，或者是修改告警通知方式和联系人，正如在 Prometheus Google Groups 里的这个用户的问题：How to dynamically add alerts rules in rules.conf and prometheus yml file via API or something？不过遗憾的是，Simon Pasquier 在下面说到，目前并没有这样的 API，而且以后也没有这样的计划来开发这样的 API，因为这样的功能更应该交给譬如 Puppet、Chef、Ansible、Salt 这样的配置管理系统。

7.3 使用 Pushgateway

Pushgateway 主要用于收集一些短期的 jobs，由于这类 jobs 存在时间较短，可能在 Prometheus 来 Pull 之前就消失了。官方对什么时候该使用 Pushgateway 有一个很好的说明。

总结

这篇博客参考了网络上大量关于 Prometheus 的中文资料，有文档，也有博客，比如 1046102779 的 Prometheus 非官方中文手册，宋佳洋的电子书《Prometheus 实战》，在这里对这些原作者表示敬意。在 Prometheus 官方文档的 Media 页面，也提供了很多学习资源。

关于 Prometheus，还有非常重要的一部分内容这篇博客没有涉及到，正如博客一开头所讲的，Prometheus 是继 Kubernetes 之后第二个加入 CNCF 的项目，Prometheus 和 Docker、Kubernetes 的结合非常紧密，使用 Prometheus 作为 Docker 和 Kubernetes 的监控系统也越来越主流。关于 Docker 的监控，可以参考官网的一篇指南：Monitoring Docker container metrics using cAdvisor，它介绍了如何使用 cAdvisor 来对容器进行监控；不过 Docker 现在也开始原生支持 Prometheus 的监控了，参考 Docker 的官方文档 Collect Docker metrics with Prometheus；关于 Kubernetes 的监控，Kubernetes 中文社区里有不少关于 Promehtheus 的资源，另外，《如何以优雅的姿势监控 Kubernetes》这本电子书也对 Kubernetes 的监控有一个比较全面的介绍。

最近两年 Prometheus 的发展非常迅速，社区也非常活跃，国内研究 Prometheus 的人也越来越多。随着微服务，DevOps，云计算，云原生等概念的普及，越来越多的企业开始使用 Docker 和 Kubernetes 来构建自己的系统和应用，像 Nagios 和 Cacti 这样的老牌监控系统会变得越来越不适用，相信 Prometheus 最终会发展成一个最适合云环境的监控系统。

附录：什么是时序数据库？

上文提到 Prometheus 是一款基于时序数据库的监控系统，时序数据库常简写为 TSDB（Time Series Database）。很多流行的监控系统都在使用时序数据库来保存数据，这是因为时序数据库的特点和监控系统不谋而合。

增：需要频繁的进行写操作，而且是按时间排序顺序写入
删：不需要随机删除，一般情况下会直接删除一个时间区块的所有数据
改：不需要对写入的数据进行更新
查：需要支持高并发的读操作，读操作是按时间顺序升序或降序读，数据量非常大，缓存不起作用

DB-Engines 上有一个关于时序数据库的排名，下面是排名靠前的几个（2018年10月）：

另外，liubin 在他的博客上写了一个关于时序数据库的系列文章：时序列数据库武斗大会，推荐。

参考

扫描二维码，在手机上阅读！

September 2, 2018

新技术学习笔记：RabbitMQ

在分布式系统中，消息队列（Message Queue，简称 MQ） 用于交换系统之间的信息，是一个非常重要的中间组件。早在上世纪 80 年代，就已经有消息队列的概念了，不过当时叫做 TIB（The Information Bus），当时的消息队列大多是商业产品，直到 2001 年 Java 标准化组织（JCP）提出 JSR 914: Java Message Service (JMS) API，这是一个与平台无关的 API，为 Java 应用提供了统一的消息操作。 JMS 提供了两种消息模型：点对点（peer-2-peer）和发布订阅（publish-subscribe）模型，当前的大多数消息队列产品都可以支持 JMS，譬如：Apache ActiveMQ、RabbitMQ、Kafka 等。

不过，JMS 毕竟是一套 Java 规范，是和编程语言绑定在一起的，只能在 Java 类语言（比如 Scala、Groovy）中具有互用性，也就是说消息的生产者（Producer）和消费者（Consumer）都得用 Java 来编写。如何让不同的编程语言或平台相互通信呢？对于这个问题，摩根大通的 John O'Hara 在 2003 年提出了 AMQP（Advanced Message Queuing Protocol，高级消息队列协议）的概念，可以解决不同平台之间的消息传递交互问题，2004 到 2006 年之间，摩根大通和 iMatrix 公司一起着手 AMQP 标准的开发，并于 2006 年发布 AMQP 规范。AMQP 和 JMS 最大的区别在于它是一种通用的消息协议，更准确的说是一种 Wire Protocol（链接协议），AMQP 并不去限定 API 层的实现，而是只定义网络交换的数据格式，这和 HTTP 协议是类似的，使得 AMQP 天然就是跨平台的。

在之后的 2007 年，Rabbit 技术公司基于 AMQP 标准发布了 RabbitMQ 第一个版本。RabbitMQ 采用了 Erlang 语言开发，这是一种通用的面向并发的编程语言，使得 RabbitMQ 具有高性能、高并发的特点，不仅如此，RabbitMQ 还提供了集群扩展的能力，易于使用以及强大的开源社区支持，这让 RabbitMQ 在开源消息队列的产品中占有重要的一席之地。

一、RabbitMQ 安装

RabbitMQ 是用 Erlang 语言开发的，所以安装 RabbitMQ 之前，首先要安装 Erlang，在 Windows 上安装 Erlang 非常简单，直接去官网下载 Erlang OTP 的安装包文件并按提示点击安装即可。安装完成之后，我们就可以从 RabbitMQ 的官网下载和安装 RabbitMQ。其他操作系统的安装参考 Downloading and Installing RabbitMQ。

一切就绪后，我们运行 RabbitMQ Command Prompt，如果你采用的是 RabbitMQ 的默认安装路径，命令提示符会显示：

C:\Program Files\RabbitMQ Server\rabbitmq_server-3.7.7\sbin>

我们使用命令 rabbitmqctl status 查看 RabbitMQ 的服务状态：

$ rabbitmqctl status
Status of node rabbit@LAPTOP-MBA74KRU ...
[{pid,4248},
 {running_applications,
     [{rabbitmq_management,"RabbitMQ Management Console","3.7.7"},
      {rabbitmq_web_dispatch,"RabbitMQ Web Dispatcher","3.7.7"},
      {cowboy,"Small, fast, modern HTTP server.","2.2.2"},
      {amqp_client,"RabbitMQ AMQP Client","3.7.7"},
      {rabbitmq_management_agent,"RabbitMQ Management Agent","3.7.7"},
      {rabbit,"RabbitMQ","3.7.7"},
      {rabbit_common,"Modules shared by rabbitmq-server and rabbitmq-erlang-client","3.7.7"},
      {recon,"Diagnostic tools for production use","2.3.2"},
      {ranch_proxy_protocol,"Ranch Proxy Protocol Transport","1.5.0"},
      {ranch,"Socket acceptor pool for TCP protocols.","1.5.0"},
      {ssl,"Erlang/OTP SSL application","9.0"},
      {mnesia,"MNESIA  CXC 138 12","4.15.4"},
      {public_key,"Public key infrastructure","1.6"},
      {asn1,"The Erlang ASN1 compiler version 5.0.6","5.0.6"},
      {os_mon,"CPO  CXC 138 46","2.4.5"},
      {cowlib,"Support library for manipulating Web protocols.","2.1.0"},
      {jsx,"a streaming, evented json parsing toolkit","2.8.2"},
      {xmerl,"XML parser","1.3.17"},
      {inets,"INETS  CXC 138 49","7.0"},
      {crypto,"CRYPTO","4.3"},
      {lager,"Erlang logging framework","3.6.3"},
      {goldrush,"Erlang event stream processor","0.1.9"},
      {compiler,"ERTS  CXC 138 10","7.2.1"},
      {syntax_tools,"Syntax tools","2.1.5"},
      {syslog,"An RFC 3164 and RFC 5424 compliant logging framework.","3.4.2"},
      {sasl,"SASL  CXC 138 11","3.2"},
      {stdlib,"ERTS  CXC 138 10","3.5"},
      {kernel,"ERTS  CXC 138 10","6.0"}]},
 {listeners,
     [{clustering,25672,"::"},
      {amqp,5672,"::"},
      {amqp,5672,"0.0.0.0"},
      {http,15672,"::"},
      {http,15672,"0.0.0.0"}]},
 {vm_memory_calculation_strategy,rss},
 {vm_memory_high_watermark,0.4},
 {vm_memory_limit,3380019200},
 {disk_free_limit,50000000},
 {disk_free,358400446464},
 {run_queue,1},
 {uptime,6855},
 {kernel,{net_ticktime,60}}]

一般情况下，我们还会安装 RabbitMQ Management Plugin，先用 rabbitmq-plugins list 列出所有支持的插件：

$ rabbitmq-plugins list
Listing plugins with pattern ".*" ...
 Configured: E = explicitly enabled; e = implicitly enabled
 | Status: * = running on rabbit@LAPTOP-MBA74KRU
 |/
[  ] rabbitmq_amqp1_0                  3.7.7
[  ] rabbitmq_auth_backend_cache       3.7.7
[  ] rabbitmq_auth_backend_http        3.7.7
[  ] rabbitmq_auth_backend_ldap        3.7.7
[  ] rabbitmq_auth_mechanism_ssl       3.7.7
[  ] rabbitmq_consistent_hash_exchange 3.7.7
[  ] rabbitmq_event_exchange           3.7.7
[  ] rabbitmq_federation               3.7.7
[  ] rabbitmq_federation_management    3.7.7
[  ] rabbitmq_jms_topic_exchange       3.7.7
[E*] rabbitmq_management               3.7.7
[e*] rabbitmq_management_agent         3.7.7
[  ] rabbitmq_mqtt                     3.7.7
[  ] rabbitmq_peer_discovery_aws       3.7.7
[  ] rabbitmq_peer_discovery_common    3.7.7
[  ] rabbitmq_peer_discovery_consul    3.7.7
[  ] rabbitmq_peer_discovery_etcd      3.7.7
[  ] rabbitmq_peer_discovery_k8s       3.7.7
[  ] rabbitmq_random_exchange          3.7.7
[  ] rabbitmq_recent_history_exchange  3.7.7
[  ] rabbitmq_sharding                 3.7.7
[  ] rabbitmq_shovel                   3.7.7
[  ] rabbitmq_shovel_management        3.7.7
[  ] rabbitmq_stomp                    3.7.7
[  ] rabbitmq_top                      3.7.7
[  ] rabbitmq_tracing                  3.7.7
[  ] rabbitmq_trust_store              3.7.7
[e*] rabbitmq_web_dispatch             3.7.7
[  ] rabbitmq_web_mqtt                 3.7.7
[  ] rabbitmq_web_mqtt_examples        3.7.7
[  ] rabbitmq_web_stomp                3.7.7
[  ] rabbitmq_web_stomp_examples       3.7.7

使用下面的命令启用 Management Plugin：

$ rabbitmq-plugins enable rabbitmq_management
Enabling plugins on node rabbit@LAPTOP-MBA74KRU:
rabbitmq_management
The following plugins have been configured:
  rabbitmq_management
  rabbitmq_management_agent
  rabbitmq_web_dispatch
Applying plugin configuration to rabbit@LAPTOP-MBA74KRU...
The following plugins have been enabled:
  rabbitmq_management
  rabbitmq_management_agent
  rabbitmq_web_dispatch

started 3 plugins.

然后访问 http://localhost:15672/ 就可以通过 Web UI 对 RabbitMQ 进行管理了（默认的用户名和密码是：guest/guest）：

在生产环境安装 RabbitMQ 时，为了安全起见，我们最好在 Admin 标签下的 Users 里添加新的用户，并将 guest 用户移除。或者通过 rabbitmqctl 命令行：

$ rabbitmqctl add_vhost [vhost]
$ rabbitmqctl add_user [username] [password]  
$ rabbitmqctl set_user_tags [username] administrator  
$ rabbitmqctl set_permissions -p [vhost] [username] ".*" ".*" ".*"

关于 RabbitMQ 的安装，我们常常采用集群的形式，并且要保证消息队列服务的高可用性。这里有一篇文章可以参考《RabbitMQ集群安装配置+HAproxy+Keepalived高可用》。

二、RabbitMQ 核心概念

RabbitMQ 中有一些概念需要我们在使用前先搞清楚，主要包括以下几个：Broker、Virtual Host、Exchange、Queue、Binding、Routing Key、Producer、Consumer、Connection、Channel。这些概念之间的关系如下图所示（图片来源）：

Broker
简单来说就是消息队列服务器的实体，类似于 JMS 规范中的 JMS provider。它用于接收和分发消息，有时候也称为 Message Broker 或者更直白的称为 RabbitMQ Server。
Virtual Host
和 Web 服务器中的虚拟主机（Virtual Host）是类似的概念，出于多租户和安全因素设计的，可以将 RabbitMQ Server 划分成多个独立的空间，彼此之间互相独立，这样就可以将一个 RabbitMQ Server 同时提供给多个用户使用，每个用户在自己的空间内创建 Exchange 和 Queue。
Exchange
交换机用于接收消息，这是消息到达 Broker 的第一站，然后根据交换机的类型和路由规则（Routing Key），将消息分发到特定的队列中去。常用的交换机类型有：direct (point-to-point)、topic (publish-subscribe) 和 fanout (multicast)。
Queue
生产者发送的消息就是存储在这里，在 JMS 规范里，没有 Exchange 的概念，消息是直接发送到 Queue，而在 AMQP 中，消息会经过 Exchange，由 Exchange 来将消息分发到各个队列中。消费者可以直接从这里取走消息。
Binding
绑定的作用就是把 Exchange 和 Queue 按照路由规则绑定起来，路由规则可由下面的 Routing Key 指定。
Routing Key
路由关键字，Exchange 根据这个关键字进行消息投递。
Producer/Publisher
消息生产者或发布者，产生消息的程序。
Consumer/Subscriber
消息消费者或订阅者，接收消息的程序。
Connection
生产者和消费者和 Broker 之间的连接，一个 Connection 实际上就对应着一条 TCP 连接。
Channel
由于 TCP 连接的创建和关闭开销非常大，如果每次访问 Broker 都建立一个 Connection，在消息量大的时候效率会非常低。Channel 是在 Connection 内部建立的逻辑连接，相当于一次会话，如果应用程序支持多线程，通常每个线程都会创建一个单独的 Channel 进行通讯，各个 Channel 之间完全隔离，但这些 Channel 可以公用一个 Connection。

关于 RabbitMQ 中的这些核心概念，实际上也是 AMQP 协议中的核心概念，可以参考官网上对 AMQP 协议的介绍：AMQP 0-9-1 Model Explained 和 AMQP 0-9-1 Quick Reference。

三、RabbitMQ 实战

这一节通过一些简单的 RabbitMQ 实例学习上面介绍的各个概念，这样可以对 RabbitMQ 的理念有个更深入的了解。

想要完整的学习 RabbitMQ，建议把官网的 6 个例子挨个实践一把，这 6 个例子非常经典，网上很多 RabbitMQ 的教程都是围绕这 6 个例子展开的。我们知道 AMQP 是跨平台的，支持绝大多数的编程语言，所以官网提供的这些例子也几乎囊括了绝大多数的编程语言，如：Python、Java、Ruby、PHP、C# 等，而且针对 Java 甚至还提供了 Spring AMQP 的版本，实在是非常贴心了。你可以根据需要选择相应编程语言的例子，这里以 Java 为例，分别是：

如果觉得阅读英文比较费劲，网上也有大量的中文教程，譬如：RabbitMQ 中文文档、轻松搞定RabbitMQ、专栏：RabbitMQ从入门到精通、RabbitMQ指南，内容都是围绕这 6 个例子展开的。

上面是这几个例子的示意图。

第一个例子实现了一个最简单的生产消费模型，介绍了生产者（Producer）、消费者（Consumer）、队列（Queue）和消息（Message）的基本概念和关系，通过这个例子，我们可以学习如何发送消息，如何接受消息，这是最基础的消息队列的功能，只有一个生产者，也只有一个消费者，虽然简单，但是在日常工作中，有时也会使用这样的模型来做系统模块之间的解耦。

当发送的消息是一个复杂的任务，消费者在接受到这个任务后需要进行大量的计算时，这个队列叫做工作队列（Work Queue）或者任务队列（Task Queue），消费者被称之为 Worker，一个工作队列一般需要多个 Worker 对任务进行分发处理，这种设计具有良好的扩展性，如果要处理的任务太多，出现积压，只要简单的增加 Worker 数目即可。在第二个例子中实现了一个简单的工作队列模型，并介绍了两种任务调度的方法：循环调度 和 公平调度，另外还学习了 消息确认 和 消息持久化 的概念。

在第三个例子中介绍了发布/订阅模型（Publish/Subscribe）并构建了一个简单的日志系统，和前两个例子不一样的是，在这个例子中，所有的消费者都可以接受到生产者发送的消息，换句话说也就是，生产者发送的消息被广播给所有的消费者。在这个例子中我们学习了 交换机（Exchange） 的概念，在 RabbitMQ 的核心理念里，生产者不会直接发送消息给队列，而是发送给交换机，再由交换机将消息推送给特定的队列。消息从交换机推送到队列时会遵循一定的规则，这些规则就是 交换机类型（Exchange Type），常用的交换机类型有四种：直连交换机（direct）、主题交换机（topic）、头交换机（headers）和扇型交换机（fanout）。值得注意的是，在前面的例子中没有指定交换机，实际上使用的是匿名交换机，这是一种特殊的直连交换机。而这个例子要实现的发布/订阅模型，实际上是扇型交换机。

在第四个例子中介绍了 路由（Routing） 和 绑定（Bindings） 的概念。使用扇形交换机只能用来广播消息，没有足够的灵活性，可以使用直连交换机和路由来实现非常灵活的消息转发，在这个日志系统的例子中，我们根据日志的严重程度将消息投递到两个队列中，一个队列只接受 error 级别的日志，将日志保存到文件中，另一个队列接受所有级别的日志，并将日志输出到控制台。路由指的是生产者如何通过交换机将消息投递到特定队列，生产者一般首先通过 exchangeDeclare 声明好交换机，然后通过 basicPublish 将消息发送给该交换机，发送的时候可以指定一个 Routing Key 参数，交换机会根据交换机的类型和 Routing Key 参数将消息路由到某个队列。绑定是用来表示交换机和队列的关系，一般在消费者的代码中先通过 exchangeDeclare 和 queueDeclare 声明好交换机和队列，然后通过 queueBind 来将两者关联起来。在关联时，也可以指定一个 Routing Key 参数，为了和生产者的 Routing Key 区分开来，有时也叫做 Binding Key。只有生产者发送消息时指定的 Routing Key 和消费者绑定队列时指定的 Binding Key 完全一致时，消息才会被投递给该消费者声明的队列中。

从扇形交换机到直连交换机，再到主题交换机，实际上并没有太大的区别，只是路由的规则越来越细致和灵活。在第五个例子中，我们继续学习和改进这个简单的日志系统，消费者在订阅日志时，不仅要根据日志的严重程度，同时还希望根据日志的来源，像这种同时基于多个标准执行路由操作的情况，我们就要用到主题交换机。和直连交换机一样，在发送消息也需要指定一个 Routing Key，只不过这个 Routing Key 必须是以点号分割的特殊字符串，譬如 cron.info，kern.warn 等，消费者在绑定交换机和队列时也需要指定一个 Routing Key（Binding Key），这个 Binding Key 具有同样的格式，而且还可以使用一些特殊的匹配符来匹配路由（星号 * 匹配一个单词，井号 # 匹配任意数量单词），譬如 *.warn 可以用来匹配所有来源的警告日志。

在最后一个例子中，我们将学习更高级的主题，使用 RabbitMQ 实现一个远程过程调用（RPC）系统。这个例子和第二个例子介绍的工作队列是一样的，只不过在生产者将任务发送给消费者之后，还希望能从消费者那里得到任务的执行结果。这里生产者充当 RPC 系统中的客户端的角色，而消费者充当 RPC 系统中的服务器的角色。要实现 RPC 系统，必须声明两个队列，一个用来发送消息，一个用来接受回调。生产者在发送消息时，可以设置消息的属性，AMQP 协议中给消息预定义了 14 个属性，其中有一个属性叫做 reply_to，就是这里的回调队列。另外还有一个属性 correlation_id，可以将 RPC 的响应和请求关联起来。

所有例子的源码可以参考这里，我就不一一列出了。下面仅对第二个例子（工作队列模型）的源码进行分析，因为这个例子很常用，我们在日常工作中会经常遇到。

首先我们来看生产者，我们省略掉创建和关闭 Connection、Channel 的部分，无论是生产者还是消费者，这个都是类似的。（完整代码）

        channel.queueDeclare("hello-queue", false, false, false, null);
        for (int i = 1; i <= 10; i++) {
            String message = "Hello World" + StringUtils.repeat(".", i);
            channel.basicPublish("", "hello-queue", null, message.getBytes());
            System.out.println("Message Sent: " + message);
        }

可以看出生产者的核心代码实际上只有这两个函数：queueDeclare() 和 basicPublish()，首先通过 queueDeclare() 函数声明一个队列 hello-queue，然后使用 basicPublish() 函数向这个队列发送消息。看到这里的代码你可能会有疑问，我们之前不是说在 RabbitMQ 里，生产者不会直接向队列发送消息，而是发送给交换机，再由交换机转发到各个队列吗？实际上，这里用到了 RabbitMQ 的 匿名转发（Nameless Exchange） 特性，在 RabbitMQ 里已经预置了几个交换机，比如：amq.direct、amq.fanout、amq.headers、amq.topic，它们的类型和它们的名字是一样的，amq.direct 就是 direct 类型的交换机，另外，还有一个空交换机，它也是 direct 类型，这个是 RabbitMQ 默认的交换机类型。一般情况下，我们在用 queueDeclare() 声明一个队列之后，还要用 queueBind() 绑定队列到某个交换机上，如下所示：

        channel.exchangeDeclare("hello-exchange", BuiltinExchangeType.DIRECT);
        channel.queueDeclare("hello-queue", false, false, false, null);
        channel.queueBind("hello-queue", "hello-exchange", "hello-key");

如果一个队列没有任何绑定，那么这个队列默认是绑定在空交换机上的。所以这里的生产者是将消息发送到空交换机，再由空交换机转发到 hello-queue 队列的。我们再来看消费者，下面的代码实现了任务的循环调度：（完整代码）

        System.out.println(" [*] Waiting for messages. To exit press CTRL+C");
        channel.queueDeclare("hello-queue", false, false, false, null);
        channel.basicConsume("hello-queue", true, new DefaultConsumer(channel) {
            @Override
            public void handleDelivery(
                    String consumerTag,
                    Envelope envelope,
                    AMQP.BasicProperties properties,
                    byte[] body) throws IOException {
                try {
                    String message = new String(body, "UTF-8");
                    System.out.println("Message Recv: " + message);
                    int c = message.lastIndexOf(".") - message.indexOf(".");
                    if (c % 2 == 0) {
                        Thread.sleep(1000 * 5);
                    } else {
                        Thread.sleep(1000);
                    }
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
        });

在消费者的代码里，我们也用 queueDeclare() 声明了 hello-queue 队列，和生产者的代码是一样的。这里为什么既要在生产者里声明队列，又要在消费者里声明队列呢？而且我们在看其他例子的代码时也会发现，如果要用 exchangeDeclare() 声明交换机也会同时出现在生产者和消费者中。为了搞清楚它的作用，我们可以把生产者或消费者的这行代码去掉，看看会发生什么：如果在消费者里不声明队列，下面的 basicConsume() 函数会直接抛出 NOT_FOUND 异常；如果在生产者里不声明队列，basicPublish() 发送的消息会全部丢失。所以，无论是生产者发送消息，还是消费者消费消息，都需要先创建队列才行。那么这个队列到底是谁创建的呢？答案是：谁先执行谁创建。创建队列的操作是幂等的，也就是说调用多次只会创建一次队列。要注意的是，如果两次创建的时候参数不一样，后创建的会报错：PRECONDITION_FAILED - inequivalent arg。

使用 basicConsume() 函数对某个队列的消息进行消费非常简单，它会一直阻塞，等待消息的到来，这个函数接受一个 DefaultConsumer 对象参数，可以重写该对象的 handleDelivery() 函数，一旦消息到来，就会使用这个回调函数对消息进行处理。我们启动多个消费者实例，由于这些消费者同时消费 hello-queue 队列，RabbitMQ 会将消息挨个分配给消费者，而且是提前一次性分配好，这样每个消费者得到的消息数量是均衡的，所以叫做 循环调度。

这里要特别说明的是 basicConsume() 函数的第二个参数 autoAck，这个参数表示是否开启 消息自动确认，这是 RabbitMQ 的 消息确认（Message Acknowledgment） 特性。消息确认机制可以保证消息不会丢失，默认情况下，一旦 RabbitMQ 将消息发送给了消费者，就会从内存中删除，如果这时消费者挂掉，所有发给这个消费者的正在处理或尚未处理的消息都会丢失掉。如果我们让消费者在处理完成之后，发送一个消息确认（也就是 ACK），通知 RabbitMQ 这个消息已经接收并且处理完毕了，那么 RabbitMQ 才可以安全的删除该消息。很显然我们这里把 autoAck 参数设置为 true，是没有消息确认机制的，可能会出现消息丢失的情况。

循环调度有一个明显的缺陷，因为每个任务的处理时间是不一样的，所以按任务的先后顺序依次分配很可能会导致消费者消费的任务是不平衡的。我这里简单的模拟了这种不平衡的场景，首先生产者发送了 10 个任务，消费者处理奇数任务的执行时间设置为 5s，偶数任务执行时间设置为 1s，然后启动两个消费者实例，按循环调度算法，每个消费者都会领到 5 个任务，从任务数量上看是平衡的。但是从执行结果看，第一个消费者跑了 25s 才执行完所有任务，而第二个消费者 5s 就跑完了所有任务。对于这种情况，我们引入了公平调度方式。

如何实现公平调度呢？如果能让 RabbitMQ 不提前分配任务，而是在消费者处理完一个任务时才给它分配，不就可以了么？其实这里就要用到上面提到的消息确认机制了，RabbitMQ 提供了 basicQos() 函数用于设置消费者支持同时处理多少个任务，basicQos(1) 表示消费者最多只能同时处理一个任务，所以 RabbitMQ 每次都只分配一个任务给它，而且在这个任务没有处理完成之前，RabbitMQ 也不会给它推送新的任务。

公平调度的实现代码如下：（完整代码）

        System.out.println(" [*] Waiting for messages. To exit press CTRL+C");
        channel.basicQos(1);
        channel.queueDeclare("hello-queue", false, false, false, null);
        channel.basicConsume("hello-queue", false, new DefaultConsumer(channel) {
            @Override
            public void handleDelivery(
                    String consumerTag,
                    Envelope envelope,
                    AMQP.BasicProperties properties,
                    byte[] body) throws IOException {
                try {
                    String message = new String(body, "UTF-8");
                    System.out.println("Message Recv: " + message);
                    int c = message.lastIndexOf(".") - message.indexOf(".");
                    if (c % 2 == 0) {
                        Thread.sleep(1000 * 5);
                    } else {
                        Thread.sleep(1000);
                    }
                } catch (Exception e) {
                    e.printStackTrace();
                } finally {
                    channel.basicAck(envelope.getDeliveryTag(), false);
                }
            }
        });

在这里 basicConsume() 函数的第二个参数设置成了 false，表示开启消息确认机制，而且在 handleDelivery() 函数中处理完消息后，通过 basicAck() 手工确认消息完成。确认的方法除了 basicAck，还有 basicNack 和 basicReject，它们的区别在于 basicNack 一次可以拒绝多条消息，而 basicReject 一次只能拒绝一条消息。

四、RabbitMQ 高级特性

通过上一节的学习，我们已经可以在我们的系统中使用 RabbitMQ 了，合理的采用消息队列，可以在程序中实现异步处理、应用解耦、流量削峰、消息通讯等等功能。除了这些消息队列的常规功能，RabbitMQ 还具有很多高级特性，这些特性大多是 RabbitMQ 对 AMQP 协议的扩展实现，更多的特性可以参考官网文档：Protocol Extensions。这一节我们将学习延迟队列、优先级队列和持久化。

4.1 延迟队列

有时候我们不希望我们的消息立即被消费者消费，比如在网上购物时，如果用户下单完成后超过三十分钟未付款，订单需要自动取消，这个是延迟队列的一种典型应用场景，要实现这个功能，我们可以使用定时任务来实现，每隔一分钟扫描一次订单状态，但是这种做法显然效率太低了。当然，我们也可以用 DelayQueue、Timer、ScheduledExecutorService、Quartz 等带有调度功能的工具来实现，可以参考这篇博客中的相应实现：你真的了解延时队列吗。不过今天我们的重点是用 RabbitMQ 实现延迟队列。

延迟队列一般分为两种：基于消息的延迟和基于队列的延迟。基于消息的延迟是指为每条消息设置不同的延迟时间，那么每当队列中有新消息进入的时候就会重新根据延迟时间排序，显然这样做效率不是很高。实际应用中大多采用基于队列的延迟，每个队列中消息的延迟时间都是相同的，这样可以省去排序消息的工作，只需要检测超时时间按顺序投递即可。

事实上，RabbitMQ 并没有直接支持延迟队列，但是可以通过它的两个特性模拟出延迟队列来，这两个特性是：Time-To-Live Extensions 和 Dead Letter Exchanges。

Time-To-Live Extensions 让我们可以在 RabbitMQ 里为消息或者队列设置过期时间（TTL，time to live），单位为毫秒，当一条消息被设置了 TTL 或者进入设置了 TTL 的队列时，这条消息会在经过 TTL 毫秒后成为 死信（Dead Letter）。我们可以像下面这样通过 x-message-ttl 参数定义一个延迟队列：

Map<String, Object> args = new HashMap<String, Object>();
args.put("x-message-ttl", 60 * 1000);
channel.queueDeclare(queueName, false, false, false, args);

上面这个延迟队列的 TTL 为 60 秒，也就是说，在这个队列中的消息，超过 60 秒就会变成死信。在 RabbitMQ 中，除了过期的消息，还有两种情况消息可能会变成死信，第一种情况是消息被拒绝，并且没有设置 requeue，第二种情况是消息队列如果已满，再往该队列投递消息也会变成死信。那么 RabbitMQ 是如何处理这些死信的呢？

在上面的例子中，我们为队列设置了一个 x-message-ttl 参数，我们还可以给队列添加另一个参数 x-dead-letter-exchange，这个就是 Dead Letter Exchange（DLX），这个参数决定了当某个队列中出现死信时会被转移到哪？DLX 是一个普通的交换机，和其他的交换机没有任何区别，死信被投递到 DLX 后，通过 DLX 再路由到其他队列，这取决于你给 DLX 绑定了哪些队列。另外，死信被投递到 DLX 时还可以通过参数 x-dead-letter-routing-key 指定 Routing Key。下面这个图很好的阐述了这个过程：（图片来源）

把 TTL 和 DLX 综合起来实现一个延迟队列如下：

// 创建 DLX
channel.exchangeDeclare("this-is-my-dlx", "direct");

// 设置队列的 TTL 和 DLX
Map<String, Object> args = new HashMap<String, Object>();
args.put("x-message-ttl", 60 * 1000);
args.put("x-dead-letter-exchange", "this-is-my-dlx");
args.put("x-dead-letter-routing-key", "");
channel.queueDeclare(queueName, false, false, false, args);

这里省略了消费者的代码，消费者可以创建一个队列，并绑定到 this-is-my-dlx 这个交换机上，当这个队列中有消息到达时，说明有消息超时了，譬如订单创建超过 30 分钟了，这时去判断订单是否已经付款，如果未付款，则取消订单。

如前文所述，不仅可以设置队列的超时时间，我们也可以设置消息的超时时间：

AMQP.BasicProperties.Builder properties = new AMQP.BasicProperties().builder().expiration("60000");
channel.basicPublish("exchangeName", "routeKey", properties.build(), "Hello".getBytes());

4.2 优先级队列

在 RabbitMQ 中我们可以使用 x-max-priority 参数将队列标记为优先级队列，优先级的值是一个整数，优先级的值越大，越被提前消费。x-max-priority 参数的值限制了优先级的最大值，一般不宜设置的太大。

Map<String, Object> args= new HashMap<String, Object>();
args.put("x-max-priority", 10);
channel.queueDeclare("priority-queue", false, false, false, args);

优先级队列在 RabbitMQ 管理页面的 Features 里可以看到 Pri 标志：

我们按优先级 1 ~ 5 依次发送 5 条消息到这个队列：

for (int i = 1; i <= 5; i++) {
    AMQP.BasicProperties.Builder properties = new AMQP.BasicProperties().builder().priority(i);
    channel.basicPublish("", "priority-queue", properties.build(), ("Hello World" + i).getBytes());
}

然后启动消费者，可以看到 5 条消息并不是按顺序接受的，而是按优先级从大到小排序的：

 [*] Waiting for messages. To exit press CTRL+C
Message Recv: Hello World5
Message Recv: Hello World4
Message Recv: Hello World3
Message Recv: Hello World2
Message Recv: Hello World1

发送消息时，优先级不要超过 x-max-priority 的值，超过 x-max-priority 时按 x-max-priority 处理。另外有一点要注意：在这个例子里，我们不能先启动消费者，否则我们还是会看到消息是按顺序接受的，这是因为消息的优先级是在有消息堆积的时候才会有意义，如果消费者的消费速度比生产者的生产速度快，那么生产者刚发送完一条消息就被消费者消费了，队列中最多只有一条消息，还谈什么优先级呢。

4.3 持久化

在前面的例子里，我们学习了 RabbitMQ 的消息确认机制，这个机制可以保证消息不会由于消费者的崩溃而丢失。但是如果是 RabbitMQ 服务崩溃退出了呢？我们该如何保证交换机、队列以及队列中的消息在 RabbitMQ 服务崩溃之后不丢失呢？这就是持久化要解决的问题。在声明交换机和队列时，可以把 durable 设置为 true，在发送消息时，可以设置消息的 deliveryMode 属性为 2，如下：

持久化的交换机：

channel.exchangeDeclare("durable-exchange", BuiltinExchangeType.DIRECT, /*durable*/true);

持久化的队列：

channel.queueDeclare("durable-queue", /*durable*/true, false, false, null);

持久化的消息：

AMQP.BasicProperties.Builder properties = new AMQP.BasicProperties().builder().deliveryMode(2);
channel.basicPublish("", "durable-queue", properties.build(), "Hello World".getBytes());

为方便起见，也可以直接使用内置的 MessageProperties.PERSISTENT_TEXT_PLAIN 静态变量，可以看一下它的实现，实际上就是 deliveryMode = 2 的一个简单封装：

channel.basicPublish("", "durable-queue", MessageProperties.PERSISTENT_TEXT_PLAIN, "Hello World".getBytes());

关于持久化的话题，我们可以再深入研究一下。为了防止消费者丢消息，我们采取了消息确认机制；为了防止服务器丢消息，我们将交换机、队列和消息都设置成持久化的。但是这样就能万无一失了吗？答案是否定的。问题就在于持久化是需要将消息保存到磁盘的，如果在保存到磁盘的过程中 RabbitMQ 崩溃，消息一样会丢失。要解决这个问题，一个可选的方案是使用 RabbitMQ 的事务机制，不过事务机制会带来大量的开销，性能不高，所以又引入了 Publisher Confirm 机制。推荐王磊的这篇博客《RabbitMQ事务和Confirm发送方消息确认——深入解读》。

总结

通过这篇博客，我们学习了 AMQP 协议和 RabbitMQ 的基本概念，并学习了 RabbitMQ 的安装和管理，通过官网的 6 个例子，掌握了交换机的几种常见类型：direct、fanout 和 topics，最后通过延迟队列、优先级队列和消息的持久化，我们还学习了 RabbitMQ 的一些高级特性。可以看出消息队列的功能非常丰富，我们常常在消息队列选型时，要综合考虑各种因素，功能是最重要的一条，InfoQ 上的这篇文章《消息中间件选型分析：从Kafka与RabbitMQ的对比看全局》介绍了更多要考虑的点。另外，限于篇幅，很多 RabbitMQ 的知识点没有展开，比如 RabbitMQ 的管理和监控，集群安装，事务和 Publisher Confirm 机制等。本文中所有代码使用的都是 amqp-client，如果你在用 Spring Boot，推荐使用 spring-boot-starter-amqp，这里是官网的教程。

参考

扫描二维码，在手机上阅读！

August 3, 2018

新技术学习笔记：ZooKeeper

第一次接触 ZooKeeper 是在使用 Dubbo 服务框架的时候，当时对 ZooKeeper 只是停留在知道和了解的层面，公司的 ZooKeeper 都是由运维统一安装和管理，对于我们开发人员来说就是在程序的配置文件中加一行注册中心的地址而已。后来又在另一个分布式的项目中使用了 ZooKeeper 来进行配置的管理，可还是对其一知半解，从来没有深入学习过 ZooKeeper 的知识。最近在工作中接触了 IaaS 和 PaaS，被各种新技术转的晕乎不已，在做技术决策的时候，之前学过的东西都太肤浅了，根本没办法对各种技术方案做横向对比。所以决定花一点时间好好的学习和总结下这些技术，今天就从 ZooKeeper 开始。

ZooKeeper 由 Apache Hadoop 的子项目发展而来，并且在 2010 年 11 月正式成为了 Apache 的顶级项目。关于 ZooKeeper 的命名很有意思，动物园管理员，显然管理着一园的动物，比如：Hadoop（大象）、Hive（蜜蜂）、Pig（小猪）等等。

根据官网的介绍，ZooKeeper is a high-performance coordination service for distributed applications，它是为分布式应用提供的一种高性能协调服务。基于对 ZAB 协议（ZooKeeper Atomic Broadcast，ZooKeeper 原子消息广播协议）的实现，它能够很好地保证分布式环境中数据的一致性。也正是基于这样的特性，使得 ZooKeeper 成为了解决分布式数据一致性问题的利器。利用 ZooKeeper，可以很容易的在分布式环境下实现统一命名服务、配置管理、锁和队列、状态同步、集群管理等功能。

一、ZooKeeper 的安装

ZooKeeper 的安装分单机模式和集群模式两种。单机模式非常简单，直接从 Apache ZooKeeper™ Releases 下载最新版本到本地并解压，就可以在 bin 目录下找到 ZooKeeper 的服务端（zkServer）和客户端（zkCli），在 Windows 环境对应 .cmd 后缀的文件，在 Linux 环境对应 .sh 后缀的文件。在运行之前，还需要做两步配置：

配置 JAVA_HOME 环境变量
修改配置文件，将 conf/zoo_sample.cfg 修改为 conf/zoo.cfg

准备就绪后，直接运行 zkServer 文件，如果看到下面的显示，就说明 ZooKeeper 服务已经启动好了。

2018-08-04 10:06:22,525 [myid:] - INFO  [main:ZooKeeperServer@829] - tickTime set to 2000
2018-08-04 10:06:22,525 [myid:] - INFO  [main:ZooKeeperServer@838] - minSessionTimeout set to -1
2018-08-04 10:06:22,527 [myid:] - INFO  [main:ZooKeeperServer@847] - maxSessionTimeout set to -1
2018-08-04 10:06:23,149 [myid:] - INFO  [main:NIOServerCnxnFactory@89] - binding to port 0.0.0.0/0.0.0.0:2181

为了保证服务的稳定和可靠，生产环境大多是部署 ZooKeeper 的集群模式，集群模式和单机模式相比，有两点不同：

配置文件中要指定集群中所有机器的信息，形如：server.id=host:port1:port2
dataDir 目录下要配置一个 myid 文件

一个典型的 ZooKeeper 配置文件如下：

#常规配置
tickTime=2000
initLimit=10
syncLimit=5
clientPort=2181
dataDir=/zookeeper/data
dataLogDir=/zookeeper/logs
 
# 集群配置
server.1=192.168.0.101:2888:3888
server.2=192.168.0.102:2888:3888
server.3=192.168.0.103:2888:3888

关于 ZooKeeper 集群模式的部署和各参数的意思，可以参考 Zookeeper集群部署。

二、ZooKeeper 核心概念

在安装好 ZooKeeper 服务之后，我们就可以进行体验了。但是在体验它之前，我们还需要了解相关的几个核心概念，比如它的数据模型，四种不同类型的节点，节点监听等等。

ZooKeeper 的数据模型是一个类似文件系统的树形结构，树的每一个节点叫做 znode，它像一个小型文件一样，可以存储少量的数据（一般不多于 1M，这是因为 ZooKeeper 的设计目标并不是传统的数据库，而是用来存储协同数据的），但它并不是一个文件，因为每个节点还可以有多个子节点，看上去又好像是一个文件夹一样。和文件系统一样，ZooKeeper 的根节点名字为 /，并使用节点的路径来唯一标识一个节点，比如 /app1/p_1。另外，还提供了命令 get 和 set 来读写节点内容，命令 ls 来获取子节点列表，命令 create 和 delete 来创建和删除节点。但是要注意的是 ZooKeeper 中的路径只有绝对路径，没有相对路径，所以路径 ../data 是不合法的，也不存在 cd 这样的命令。下图是 ZooKeeper 数据模型的示意图（图片来源）：

另外，一共有四种不同类型的节点：

持久节点（PERSISTENT）：默认的节点类型，节点一旦创建，除非显式的删除，否则一直存在；
临时节点（EPHEMERAL）：ZooKeeper 的客户端和服务器之间是采用长连接方式进行通信的，并通过心跳来保持连接，这个连接状态称为 session，客户端在创建临时节点之后，如果一直保持连接则这个节点有效，一旦连接断开，该节点就会被自动删除；注意，临时节点不能有子节点；
持久顺序节点（PERSISTENT_SEQUENTIAL）：默认情况下，ZooKeeper 是不允许创建同名节点的，如果该节点是顺序节点，ZooKeeper 就会自动在节点路径末尾添加递增的序号；
临时顺序节点（EPHEMERAL_SEQUENTIAL）：顺序节点，但是只有在客户端连接有效时存在；

准确来说，节点的类型只有持久和临时两种，顺序节点是指在创建节点时可以指定一个顺序标志，让节点名称添加一个递增的序号，但是节点一旦创建好了，它要么是持久的，要么是临时的，只有这两种类型。这几种类型的节点虽然看上去很平常，但是它们正是实现 ZooKeeper 分布式协调服务的关键，如果再加上节点监听的特性，可以说是无所不能。节点监听（Watch）可以用于监听节点的变化，包括节点数据的修改或者子节点的增删变化，一旦发生变化，可以立即通知注册该 Watch 的客户端。我们在后面的例子中将会看出这些特性结合在一起的强大威力。譬如我们在执行 get 命令查询节点数据时指定一个 Watch，那么当该节点内容发生变动时，就会触发该 Watch，要注意的是 Watch 只能被触发一次，如果要一直获得该节点数据变动的通知，那么就需要在触发 Watch 时重新指定一个 Watch。只有节点的读操作（例如：get、ls、stat）可以注册 Watch，写操作（例如：set、create、delete）会触发 Watch 事件。

三、使用 ZooKeeper 客户端

接下来我们使用 ZooKeeper 客户端来体验下 ZooKeeper 的基本功能。如果是访问本地环境的 ZooKeeper 服务，直接运行 zkCli 脚本即可。如果是访问远程的 ZooKeeper 服务，则使用 -server 参数：

$ zkCli.sh -server 192.168.0.101:2181

如果成功连接，客户端会出现类似下面的命令提示符：

[zk: localhost:2181(CONNECTED) 0]

这时你就可以执行 ZooKeeper 命令了，譬如使用 help 查看可用命令列表：

[zk: localhost:2181(CONNECTED) 0] help
ZooKeeper -server host:port cmd args
        stat path [watch]
        set path data [version]
        ls path [watch]
        delquota [-n|-b] path
        ls2 path [watch]
        setAcl path acl
        setquota -n|-b val path
        history
        redo cmdno
        printwatches on|off
        delete path [version]
        sync path
        listquota path
        rmr path
        get path [watch]
        create [-s] [-e] path data acl
        addauth scheme auth
        quit
        getAcl path
        close
        connect host:port

从这个列表中，我们可以看到上面提到的几个基本命令：get、set、ls、create、delete 等。譬如我们通过 ls 命令查看根节点 / 的子节点：

[zk: localhost:2181(CONNECTED) 1] ls /
[zookeeper]

通过 create 命令创建新节点：

[zk: localhost:2181(CONNECTED) 2] create /data Hello
Created /data
[zk: localhost:2181(CONNECTED) 3] get /data
Hello
cZxid = 0xa
ctime = Sat Aug 04 14:03:51 CST 2018
mZxid = 0xa
mtime = Sat Aug 04 14:03:51 CST 2018
pZxid = 0xa
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 5
numChildren = 0

create 默认创建的是持久节点，可以指定参数 -e 创建临时节点或 -s 创建顺序节点。ZooKeeper 的基本命令都很简单，可以参考 ZooKeeper命令行操作。

使用客户端命令行管理 ZooKeeper 节点和数据只是 ZooKeeper 客户端的一种方式，实际上，ZooKeeper 还提供了另一种客户端交互方式，可以直接使用 telnet 或 nc 向 ZooKeeper 发送命令，用来获取 ZooKeeper 服务当前的状态信息。这些命令都是由四个字母组成，因此又叫做 四字命令（The Four Letter Words）。

譬如，下面通过 ruok（Are you OK?）命令查询 ZooKeeper 服务是否正常，ZooKeeper 返回 imok（I’m OK）表示服务状态正常。

$ echo ruok | nc localhost 2181
imok

四字命令按功能可以划分为四类：

服务状态相关：ruok、conf、envi、srvr、stat、srst、isro
客户连接相关：dump、cons、crst
节点监听相关：wchs、wchc、wchp
监控相关：mntr

关于四字命令的详细信息可以参考 ZooKeeper 官网手册 ZooKeeper Administrator's Guide。

四、ZooKeeper 常见功能实现

如果只是使用命令行对 ZooKeeper 上的数据做些增删改查，还不足以说明 ZooKeeper 有什么特别的，无非就是一个小型的文件系统而已，只有把它用于我们的分布式项目中，才能看出它真正的作用。

4.1 第一个 ZooKeeper 应用

我们先从最简单的代码开始，连接 ZooKeeper 并创建一个节点：

public static void main(String[] args) throws Exception {
    ZooKeeper zookeeper = new ZooKeeper("localhost:2181", 5000, null);
    zookeeper.create("/data", "Hello world".getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
    zookeeper.close();
}

上面的代码首先创建一个连接，连接超时时间设置为 5 秒，然后创建一个名为 /data 的持久节点（PERSISTENT），并写入数据 "Hello World"，最后关闭连接。上面的代码和 zkCli -server localhost:2181 create /data "Hello world" 命令是一样的。

实际上，这里的代码虽然简单的不能再简单了，但是却存在着一个 BUG，因为 new ZooKeeper() 只是向服务端发起连接，此时连接并没有创建成功，如果在连接创建之前调用了 zookeeper.create()，由于超时时间是 5 秒，如果在 5 秒内和服务端的连接还没有创建完成，此时就会抛出 ConnectionLossException：

Caused by: org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /data

这里正确的做法是使用 ZooKeeper 提供的 Watch 机制。上面在创建连接时 new ZooKeeper("localhost:2181", 5000, null)，这里的第三个参数可以指定一个实现 Watcher 接口的对象，Watcher 接口只有一个方法 void process(WatchedEvent watchedEvent)，这个方法会在连接创建成功的时候被调用。所以我们可以在 new ZooKeeper() 时设置一个 Watcher，然后通过 CountDownLatch.await() 阻塞程序执行，直到连接创建成功时，Watcher 的 process() 方法调用 CountDownLatch.countDown() 才开始执行下面的 create() 操作。下面是示例代码：

public class Simple implements Watcher {
    private CountDownLatch connectedSignal = new CountDownLatch(1);
    @Override
    public void process(WatchedEvent watchedEvent) {
        if (watchedEvent.getState() == Watcher.Event.KeeperState.SyncConnected) {
            connectedSignal.countDown();
        }
    }
    public void createNode() throws Exception {
        ZooKeeper zookeeper = new ZooKeeper("localhost:2181", 1000, this);
        connectedSignal.await();
        zookeeper.create("/data", "Hello world".getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
        zookeeper.close();
    }
    public static void main(String[] args) throws Exception {
        Simple simple = new Simple();
        simple.createNode();
    }
}

至此，我们可以成功连接 ZooKeeper 并创建节点了，对代码稍加改造就可以实现更多功能，譬如创建子节点，删除节点，修改节点数据等等。有了这些基础，接下来，就让我们来看看 ZooKeeper 可以实现哪些分布式高阶技巧。

4.2 统一命名服务（Name Service）

所谓命名服务，就是帮助我们对资源进行统一命名的服务，通常需要有一套完整的命名规则，既能够产生唯一的名称又便于人们识别和记住，通常情况下用树形的名称结构是一个理想的选择，树形的名称结构是一个有层次的目录结构，既对人友好又不会重复。使用命名服务可以更方便的对资源进行定位，比如计算机地址、应用提供的服务地址或者远程对象等。

想象一下 DNS，它就是一种命名服务，可以将域名转换为 IP 地址，这里的域名就是全局唯一的名称，方便人们记忆，而 IP 地址就是该名称对应的资源。再想象一下 JNDI，这也是一种命名服务，JNDI 的全称为 Java Naming and Directory Interface（Java 命名和目录接口），它是 J2EE 中重要的规范之一，标准的 J2EE 容器都提供了对 JNDI 规范的实现，它也是将有层次的目录结构关联到一定资源上。譬如我们在配置数据源时一般会在 JDBC 连接字符串中指定数据库的 IP 、端口、数据库名、用户名和密码等信息，这些信息如果散落在分布式应用的各个地方，不仅会给资源管理带来麻烦，比如当数据库 IP 发生变动时要对各个系统进行修改，而且数据库的用户名密码暴露在外，也存在安全隐患。使用 JNDI 可以方便的解决这两方面的问题。

在 ZooKeeper 中创建的所有节点都具有一个全局唯一的路径，其对应的节点可以保存一定量的信息，这个特性和命名服务不谋而合。所以如果你在分布式应用中需要用到自己的命名服务，使用 ZooKeeper 是个比较合适的选择。

4.3 配置管理（Configuration Management）

正如上面所说的数据库配置一样，在应用程序中一般还会用到很多其他的配置，这些配置往往都是写在某个配置文件中，程序在运行时从配置文件中读取。如果程序是单机应用，并且配置文件数量不多，变动也不频繁，这种做法倒没有什么大问题。但是在分布式系统中，每个系统都有大量的配置文件，而且某些配置项是相同的，如果这些配置项发生变动时，让运维人员在每台服务器挨个修改配置文件，这样的维护成本就太高了，不仅麻烦也容易出错。

配置管理（Configuration Management）在分布式系统中很常见，一般也叫做 发布与订阅，我们将所有的配置项统一放置在一个集中的地方，所有的系统都从这里获取相应的配置项，如果配置项发生变动，运维人员只需要在一个地方修改，其他系统都可以从这里获取变更。在 ZooKeeper 中可以创建一个节点，比如：/configuration，并将配置信息放在这个节点里，在应用启动的时候通过 getData() 方法，获取该节点的数据（也就是配置信息），并且在节点上注册一个 Watch，以后每次配置变动时，应用都会实时得到通知，应用程序获取最新数据并更新配置信息即可。

要实现配置管理的管理，我们首先实现配置数据的发布：

public class ConfigWriter {
    private ZooKeeper zookeeper;
    private String configPath;
    public ConfigWriter(ZooKeeper zookeeper, String configPath) {
        this.zookeeper = zookeeper;
        this.configPath = configPath;
    }
    public void writeConfig(String configData) throws KeeperException, InterruptedException {
        Stat stat = zookeeper.exists(configPath, false);
        if (stat == null) {
            zookeeper.create(configPath, configData.getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
        } else {
            zookeeper.setData(configPath, configData.getBytes(), -1);
        }
    }
    public static void main(String[] args) throws Exception {
        ZooKeeper zookeeper = new ZooKeeper("localhost:2181", 30000, null);
        ConfigWriter writer = new ConfigWriter(zookeeper, "/configuration");
        writer.writeConfig("Hello");
        zookeeper.close();
    }
}

先通过 exists() 方法判断 /configuration 节点是否存在，如果不存在，就使用 create() 方法创建一个并写入配置数据，如果已经存在，直接修改该节点的数据即可。每次配置变更时，我们就调用一次 updateConfig(zk, "/configuration", configData) 方法。然后我们再实现配置数据的订阅：

public class ConfigReader implements Watcher {
    private ZooKeeper zookeeper;
    private String configPath;
    public ConfigReader(ZooKeeper zookeeper, String configPath) {
        this.zookeeper = zookeeper;
        this.configPath = configPath;
    }
    @Override
    public void process(WatchedEvent watchedEvent) {
        if (watchedEvent.getType() == Watcher.Event.EventType.NodeDataChanged) {
            readConfig();
        }
    }
    public void readConfig() {
        try {
            byte[] data = zookeeper.getData(configPath, this, null/*stat*/);
            System.out.println(new String(data));
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    public static void main(String[] args) throws Exception {
        ZooKeeper zookeeper = new ZooKeeper("localhost:2181", 30000, null);
        ConfigReader reader = new ConfigReader(zookeeper, "/configuration");
        reader.readConfig();
        Thread.sleep(Long.MAX_VALUE);
    }
}

和上面的创建 ZooKeeper 连接一样，我们的 ConfigReader 类实现了 Watcher 接口，并在调用 getData() 方法获取配置数据时注册这个 Watch，这样可以在节点数据发生变动时得到通知，得到通知之后，我们重新获取配置数据，并重新注册 Watch。

4.4 集群管理（Group Membership）

在分布式系统中，我们常常需要将多台服务器组成一个集群，这时，我们就需要对这个集群中的服务器进行管理，譬如：我们需要知道当前集群中有多少台服务器，当集群中某台服务器下线时需要及时知道，能方便的向集群中添加服务器。利用 Zookeeper 可以很容易的实现集群管理的功能，实现方法很简单，首先我们创建一个目录节点 /groups，用于管理所有集群中的服务器，然后每个服务器在启动时在 /groups 节点下创建一个 EPHEMERAL 类型的子节点，譬如 /member-1、member-2 等，并在父节点 /groups 上调用 getChildren() 方法并设置 Watch，这个 Watch 会在 /groups 节点的子节点发生变化（增加或删除）时触发通知，由于每个服务器创建的子节点是 EPHEMERAL 类型的，当创建它的服务器下线时，这个子节点也会随之被删除，从而触发 Watch 通知，这样其它的所有服务器就知道集群中少了一台服务器，可以使用 getChildren() 方法获取集群的最新服务器列表，并重新注册 Watch。

我们实现一个最简单的集群管理程序：

public class GroupMember implements Watcher {
    private ZooKeeper zookeeper;
    private String groupPath;
    public GroupMember(ZooKeeper zookeeper, String groupPath) {
        this.zookeeper = zookeeper;
        this.groupPath = groupPath;
    }
    @Override
    public void process(WatchedEvent watchedEvent) {
        if (watchedEvent.getType() == Event.EventType.NodeChildrenChanged) {
            this.list();
        }
    }
    public void list() {
        try {
            List<String> members = zookeeper.getChildren(this.groupPath, this);
            System.out.println("Members: " + String.join(",", members));
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    public void join(String memberName) {
        try {
            String path = zookeeper.create(
                    this.groupPath + "/" + memberName, null, ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL);
            System.out.println("Created: " + path);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    public static void main(String[] args) throws Exception {
        ZooKeeper zookeeper = new ZooKeeper("localhost:2181", 30000, null);
        GroupMember member = new GroupMember(zookeeper, "/groups");
        member.join("member-" + new Random().nextInt(1000));
        member.list();
        Thread.sleep(Long.MAX_VALUE);
    }
}

程序启动时首先加入 /groups 集群，加入集群的方法是在 /groups 节点下创建一个 CreateMode.EPHEMERAL 类型的子节点。然后再获取该集群中的成员列表，同时我们注册了一个 Watch。我们每启动一个 GroupMember 实例，都会在 /groups 集群中添加一个成员，这将触发一个 NodeChildrenChanged 类型的事件，我们在 list() 方法中重新获取成员列表并注册 Watch。这样不仅可以监测到集群中有新成员加入，而且也可以对集群中成员的下线做监控。这里有一点要注意的是，当集群中有新成员加入时，Watch 可以及时通知，但有成员下线时，并不会及时通知，因为我们这里 new ZooKeeper() 时指定了连接的超时时间是 30 秒，ZooKeeper 只有在 30 秒超时之后才会触发 Watch 通知。

4.5 集群选主（Leader Election）

在上面的集群管理一节，我们看到了可以使用 EPHEMERAL 类型的节点，对集群中的成员进行管理和监控，其实集群管理除了成员的管理和监控功能之外，还有另一个功能，那就是：集群选主（Leader Election），也叫做 Leader 选举或 Master 选举。这个功能在分布式系统中往往很有用，比如，应用程序部署在不同的服务器上，它们都运行着相同的业务，如果我们希望某个业务逻辑只在集群中的某一台服务器上运行，就需要选择一台服务器出来作为主服务器。一般情况下，在一个集群中只有一台主服务器（Master 或 Leader），其他的都是从服务器（Slave 或 Follower）。我们刚刚已经在目录节点 /groups 下创建出一堆的成员节点 /member-1、member-2 了，那么怎么知道哪个节点才是 Master 呢？

实现方法很简单，和前面一样，我们还是为每个集群成员创建一个 EPHEMERAL 节点，不同的是，它还是一个 SEQUENTIAL 节点，这样我们就可以给每个成员编号，然后选择编号最小的成员作为主服务器。这样做的好处是，如果主服务器下线，这个编号的节点也会被删除，然后通知集群中所有的成员，这些成员中又会出现一个编号是最小的，继而被选择当作新的主服务器。

我们把集群管理的代码稍微改造一下，就可以实现集群选主的功能：

    public void list() {
        try {
            List<String> members = zookeeper.getChildren(this.groupPath, this);
            System.out.println("Members: " + String.join(",", members));
            members.sort(Comparator.naturalOrder());
            if (this.currentNode.equals(this.groupPath + "/" + members.get(0))) {
                System.out.println("I'm the master");
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    public void join(String memberName) {
        try {
            this.currentNode = zookeeper.create(
                    this.groupPath + "/" + memberName, null, ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL);
            System.out.println("Created: " + this.currentNode);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

我们在创建节点时，选择 CreateMode.EPHEMERAL_SEQUENTIAL 模式，并将创建的节点名称保存下来。使用 getChildren() 方法获取集群成员列表时，按序号排序，取序号最小的一个成员，如果和自己的节点名称一样，则可以认为自己就是主服务器。

上面介绍的这个方法可以动态的选出集群中的主服务器，所以又叫 动态选主，实际上，还有一种 静态选主 的方法，这个方法利用了 ZooKeeper 节点的全局唯一性，如果多个服务器同时创建 /master 节点，最终一定只有一个服务器创建成功，利用这个特性，谁创建成功，谁就是主服务器。这种方法非常简单粗暴，如果对可靠性要求不高，不需要考虑主服务器下线问题，可以考虑采用这种方法。

4.6 分布式锁（Locks）

在单个应用中，锁可以防止多个线程同时访问同一个资源，常用的编程语言都提供了锁机制很容易实现，但是在分布式系统中，要防止多个服务器同时访问同一个资源，就不好实现了。不过在上一节中，我们刚刚介绍了如何使用 ZooKeeper 来做集群选主，可以在多个服务器中选择一个服务器作为主服务器，这和分布式锁要求的多个服务器中只有一个服务器可以访问资源的概念是完全一样的。

我们介绍了两种集群选主的方法，刚好对应锁服务的两种类型：静态选主方法是让所有的服务器同时创建一个相同的节点 lock，最终只有一个服务器创建成功，那么创建成功的这个服务器就相当于获取了一个独占锁。动态选主方法是在某个目录节点 locks 下创建 EPHEMERAL_SEQUENTIAL 类型的子节点，譬如，lock-1、lock-2 等，然后调用 getChildren() 方法获取子节点列表，将这些子节点按序号排序，编号最小的即获得锁，同时监听目录节点变化；释放锁就是将该子节点删除即可，那么其他所有服务器都会收到通知，每个服务器检查自己创建的节点是不是序号最小的，序号最小的服务器再次获取锁，依次反复。

我们假设有 100 台服务器试图获取锁，这些服务器都会在目录节点 locks 上监听变化，每次锁的释放和获取，也就是子节点的删除和新增，都会触发节点监听，所有的服务器都会得到通知，但是节点新增并不会发生锁变化，节点删除也只有序号最小的那个节点可以获取锁，其他节点都不会发生锁变化，像这种有大量的服务器得到通知而只有很小的一部分服务器对通知做出响应的现象，有时候又被称为 羊群效应（Herd Effect），这无疑对 ZooKeeper 服务器造成了很大的压力。

为了解决这个问题，我们可以不用关注 locks 目录节点下的子节点变化（删除和新增），也就是说不使用 getChildren() 方法注册节点监听，而是只关注比自己节点小的那个节点的变化，我们通过使用 exists() 方法注册节点监听，这里有一副流程图说明了整个加锁的过程（图片来源）：

下面是关键代码，完整代码参见这里：

    public void lock() {
        try {
            String currentNode = zookeeper.create(
                    this.lockPath + "/lock-", null, ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL);
            List<String> members = zookeeper.getChildren(this.lockPath, false);
            members.sort(Comparator.naturalOrder());

            // 当前节点序号最小，成功获取锁
            String lowestNode = this.lockPath + "/" + members.get(0);
            if (currentNode.equals(lowestNode)) {
                return;
            }

            // 取序号比自己稍小一点的节点，对该节点注册监听，当该节点删除时获取锁
            String lowerNode = null;
            for (int i = 1; i < members.size(); i++) {
                String node = this.lockPath + "/" + members.get(i);
                if (currentNode.equals(node)) {
                    lowerNode = this.lockPath + "/" + members.get(i-1);
                    break;
                }
            }
            if (lowerNode != null && zookeeper.exists(lowerNode, this) != null) {
                latch.await();
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

4.7 栅栏和双栅栏（Barrier & Double Barrier）

栅栏（Barrier） 是用于阻塞一组线程执行的一种同步机制，只有当这组线程全部都准备就绪时，才开始继续执行，就好像赛马比赛，先要等所有的赛马都来到起跑线前准备就绪，然后才能开始比赛。如下图所示：

双栅栏的意思不言而喻，就是两道栅栏，第一道栅栏用于同步一组线程的开始动作，让一组线程同时开始，第二道栅栏用于同步一组线程的结束动作，让它们同时结束，这就好像在赛马比赛中，要等所有的赛马都跑到终点比赛才真正结束一样。

使用 ZooKeeper 实现栅栏很简单，和上面的集群选主和分布式锁类似，都是先创建一个目录节点 /barrier，然后每个线程挨个在这个节点下创建 EPHEMERAL_SEQUENTIAL 类型的子节点，譬如 node-1，node-2 等，表示这个线程已经准备就绪，然后调用 getChildren() 方法获取子节点的个数，并设置节点监听，如果节点个数大于等于所有的线程个数，则表明所有的线程都已经准备就绪，然后开始执行后续逻辑。Barrier 的实现可以参考 ZooKeeper 官方的开发者文档。

实际上这个算法还可以优化，使用 getChildren() 监听节点存在上文提到的羊群效应（Herd Effect）问题，我们可以在创建子节点时，根据子节点个数是否达到所有线程个数，来单独创建一个节点，譬如 /barrier/enter，表示所有线程都准备就绪，没达到的话就调用 exists() 方法监听 /barrier/enter 节点。这样只有在 /barrier/enter 节点创建时才需要通知所有线程，而不需要每加入一个节点都通知一次。双栅栏的算法可以采用同样的方法增加一个 /barrier/leave 节点来实现。

4.8 队列（Queue）

队列是一种满足 FIFO 规则的数据结构，在分布式应用中，队列经常用于实现生产者和消费者模型。使用 ZooKeeper 实现队列的思路是这样的：首先创建目录节点 /queue，然后生产者线程往该节点下写入 SEQUENTIAL 类型的子节点，比如 node-1、node-2 等，由于是顺序节点，ZooKeeper 可以保证创建的子节点是按顺序递增的。消费者线程则是一直通过 getChildren() 方法读取 /queue 节点的子节点，取序号最小的节点（也就是最先入队的节点）进行消费。这里我们要注意的是，消费者首先需要调用 delete() 删除该节点，如果有多个线程同时删除该节点，ZooKeeper 的一致性可以保证只会有一个线程删除成功，删除成功的线程才可以消费该节点，而删除失败的线程通过 getChildren() 的节点监听继续等待队列中新元素。

总结

通过这篇文章我们学习了 ZooKeeper 的基本知识，可以使用命令行对 ZooKeeper 进行管理和监控，并实现了 ZooKeeper 一些常见的功能。实际上 ZooKeeper 提供的机制非常灵活，除了本文介绍的几种常用应用场景，ZooKeeper 能实现的功能还有很多，可以参考 ZooKeeper Recipes and Solutions 和 Apache Curator Recipes。

本文介绍的 ZooKeeper 功能都是基于官方提供的原生 API org.apache.zookeeper 来实现的，但是原生的 API 有一个问题，就是太底层了，不方便使用，而且很容易出错。因此 Netflix 的 Jordan Zimmerman 开发了 Curator 项目，并在 GitHub 上采用 Apache 2.0 协议开源了。在生产环境推荐直接使用 Curator 而不是原生的 API，可以大大简化 ZooKeeper 的开发流程，可以参考 Apache Curator Getting Started。

本文偏重 ZooKeeper 的实践，通过本文的学习，对工作中遇到的常见场景应该基本能应付了。不过这篇文章缺少对其原理的深入分析，比如 ZooKeeper 的一致性是如何保证的，ZAB 协议和 Paxos 协议，恢复模式（选主）和广播模式（同步）是如何工作的等等，这些后面还需要继续学习。

参考

扫描二维码，在手机上阅读！

September 10, 2017

学习 Java 的调试技术

在软件开发的过程中，可以说调试是一项基本技能。调试的英文单词为 debug ，顾名思义，就是去除 bug 的意思。俗话说的好，编程就是制造 bug 的过程，所以 debug 的重要性毋庸置疑，如果能熟练掌握调试技能，也就可以很快的定位出代码中的 bug。要知道，看的懂代码不一定写的出代码，写的出代码不一定能调试好代码，为了能写出没有 bug 的代码，我们必须得掌握一些基本的调试技巧。

工欲善其事，必先利其器。无论你的开发工具是 IntelliJ IDEA 还是 Eclipse ，调试器都是标配。在遇到有问题的程序时，合理的利用调试器的跟踪和断点技巧，可以很快的定位出问题原因。虽然说合理利用日志也可以方便定位线上问题，但是日志并不是调试工具，不要在开发环境把 System.out.println 当作调试手段，掌握调试器自带的调试技能才是正道。

一、实战 IDEA 调试技巧

如果你是做 Java 开发的，相信你不会没有听过 IntelliJ IDEA ，和大多数 Java 开发者一样，我一开始的时候也是用 Eclipse 来进行开发，但是自从换了 IDEA 之后，就再也离不开它了，彻底变成了 IDEA 的忠实粉丝（不好意思，打一波广告。。）。不得不说，JetBrains 这家来自捷克的软件公司真的是良心企业，所出产品皆是精品，除了 IDEA，还有 WebStorm，PhpStorm，PyCharm 等，风格都是很类似的，一些类似的快捷键包括调试技巧也是通用的。

打开 IDEA 的调试面板，如下图所示，可以大致的将其分成五个部分：

单步跟踪
断点管理
求值表达式
堆栈和线程
变量观察

1.1 单步跟踪

说起调试，估计很多人第一反应就是对程序进行一步一步的跟踪分析，其实 IDEA 提供了很多快捷键来帮助我们跟踪程序，大抵可以列出下面几个技巧：

Show Execution Point

调试时往往需要浏览代码，对代码进行分析，有时候在浏览若干个源文件之后就找不到当前执行到哪了，可能很多人会使用 Navigate Back 来返回，虽然也可以返回去，但可能需要点多次返回按钮，相对来说使用这个技巧快速定位到当前调试器正在执行的代码行要更简便。

Step Over

这是最基本的单步命令，每一次都是执行一行代码，如果该行代码有方法会直接跳过，可以说真的是一步一个脚印。

Step In / Force Step In

Step Over 会跳过方法的执行，可以观察方法的返回值，但如果需要进到方法里面，观察方法的执行细节，则需要使用 Step In 命令了。另外，Step In 命令也会跳过 jdk 自带的系统方法，如果要跟踪系统方法的执行细节，需要使用 Force Step In 命令。关于单步的时候忽略哪些系统方法，可以在 IDEA 的配置项 Settings -> Build, Execution, Deployment -> Debugger -> Stepping 中进行配置，如下图所示。

Step Out

当使用 Step In 命令跟踪到一个方法的内部时，如果发现自己不想继续调这个方法了，可以直接把这个方法执行完，并停在调用该方法的下一行位置，这就是 Step Out 命令。

Drop to Frame

这一招可以说是调试器的一大杀器。在单步调试的时候，如果由于粗心导致单步过了头，没有看到关键代码的执行情况，譬如想定位下某个中间变量的值，这个时候如果能回到那行关键代码再执行一遍就好了，Drop to Frame 就提供了我们这个能力，它可以回到方法调用的地方（跟 Step Out 不一样，Step Out 是回到方法调用的下一行），让我们可以再调试一次这个方法，这一次可不要再粗心了。

Drop to frame 的原理其实也非常简单，顾名思义，它将堆栈的最上面一个栈帧删除（也就是当前正在执行的方法），让程序回到上一个栈帧（父方法），可以想见，这只会恢复堆栈中的局部变量，全局变量无法恢复，如果方法中有对全局变量进行操作的地方，是没有办法再来一遍的。

Run to Cursor / Force Run to Cursor

这两个命令在需要临时断点时非常有用，譬如已经知道自己想分析哪一行代码了，但又不需要下很多无谓的断点，可以直接使用该命令执行到某行，Force Run to Cursor 甚至可以无视所有断点，直接到达我们想分析的地方。

1.2 断点管理

断点是调试器的基础功能之一，可以让程序暂停在需要的地方，帮助我们进行分析程序的运行过程。在 IDEA 中断点管理如下图所示，合理使用断点技巧可以快速让程序停在我们想停的地方：

可以将断点分成两种类型：行断点指的是在特定的某行代码上暂停下来，而全局断点是在某个条件满足时停下来，并不限于停在固定的某一行，譬如当出现异常时暂停程序。

1.2.1 行断点

Suspend (All / Thread)
Condition

条件断点。这应该也是每个使用调试器的开发者都应该掌握的一个技巧，当遇到遍历比较大的 List 或 Map 对象时，譬如有 1000 个 Person 对象，你不可能每个对象都调一遍，你可能只想在 person.name = 'Zhangsan' 的时候让断点断下来，就可以使用条件断点，如下图所示：

Log message to console
Evaluate and log

当看到上面的 Suspend 这个选项的时候有的人可能会感到奇怪，我下一个断点不就是为了让程序停下来吗？还需要这个选项干什么？是不是有点多余？难道你下个断点却不想让程序停下来？在发现 Evaluate and log 这个技巧之前，我对这一点也感觉很奇怪，直到有一天我突然发现 Suspend Off + Evaluate and log 的配合真的是太有用了。前面有讲过，不要把 System.out.println 当作调试手段，因为你完全可以用这个技巧来打印所有你想打印的信息，而不需要修改你的源代码。

Remove once hit

一次性断点。上面介绍的 Run to Cursor 就是一次性断点的例子。

Instance filters
Class filters
Pass count

这几个我用的不是很多，但应该也是非常有用的技巧可以先记下来。在 IDEA 里每个对象都有一个实例ID，Instance filters 就是用于当断点处代码所处的实例和设定ID匹配则断下来。Pass count 则是在断点执行到第几次的时候暂停下来。

1.2.2 全局断点

Exception breakpoints
Method breakpoints
Field watchpoints

个人感觉这几个技巧都不是很常用，感兴趣的同学自己实验一把吧。

1.3 求值表达式

在一堆单步跟踪的按钮旁边，有一个不显眼的按钮，这个按钮就是 “求值表达式”。它在调试的时候很有用，可以查看某个变量的值，也可以计算某个表达式的值，甚至还可以计算自己的一段代码的值，这分别对应下面两种不同的模式：

表达式模式（Expression Mode）
代码片段模式（Code Fragment Mode）

这两个模式类似于 Eclipse 里面的 Expression View 和 Display View。在 Display View 里也可以编写一段代码来执行，确实非常强大，但是要注意的是，这里只能写代码片段，不能自定义方法，如下图：

1.4 堆栈和线程

这个没什么好说的，一个视图可以查看当前的所有线程，另一个视图可以查看当前的函数堆栈。在线程视图里可以进行 Thread dump，分析每个线程当前正在做什么；堆栈视图里可以切换栈帧，结合右边的变量观察区，可以方便的查看每个函数里的局部变量和参数。

线程视图
堆栈视图

1.5 变量观察

变量区和观察区可以合并在一起，也可以分开来显示（如下图所示），我比较喜欢分开来显示，这样局部变量、参数以及静态变量显示在变量区，要观察的表达式显示在观察区。观察区类似于求值表达式中的 Expression mode，你可以添加需要观察的表达式，在调试的时候可以实时的看到表达式的值。变量区的内容相对是固定的，随着左边的栈帧调整，值也会变得不同。在这里还可以修改变量原有的值。

二、使用 jdb 命令行调试

相信很多人都听过 gdb，这可以说是调试界的鼻祖，以前在学习 C/C++ 的时候，就是使用它来调试程序的。和 gdb 一样，jdb 也是一个命令行版的调试器，用于调试 Java 程序。而且 jdb 不需要安装下载，它是 JDK 自带的工具（在 JDK 的 bin 目录中，JRE 中没有）。

每研究一项新技术，我总是会看看有没有命令行版本的工具可以替代，在命令行下进行操作给人一种踏实的感觉，每一个指令，每一个参数，都清清楚楚的摆在那里，这相比较于图形界面的工具，可以学习更深层的知识，而不是把技术细节隐藏在图形界面之后，你可以发现命令行下的每一个参数，每一个配置，都是可以学习的点。

2.1 jdb 基本命令

在 jdb 中调试 Java 程序如下图所示，直接使用 jdb Test 命令加载程序即可。

运行完 jdb Test 命令之后，程序这时并没有运行起来，而是停在那里等待进一步的命令。这个时候我们可以想好在哪里下个断点，譬如在 main() 函数处下个断点，然后再使用 run 命令运行程序：

> stop in Test.main
正在延迟断点Test.main。
将在加载类后设置。
> run
运行Test
设置未捕获的 java.lang.Throwable
设置延迟的未捕获的 java.lang.Throwable
>
VM 已启动：设置延迟的断点：Test.main

可以看出在执行 run 命令之前，程序都还没有开始运行，这个时候的断点叫做“延迟断点”，当程序真正运行起来时，也就是 JVM 启动的时候，才将断点设置上。除了 stop in Class.Method 命令，还可以使用 stop at Class:LineNumber 的方式来设置断点。

main[1] stop at Test:25

在 jdb 中下断点，就没有 IDEA 中那么多名堂了，什么条件断点，什么 Instance filters 都不支持，只能乖乖的一步一步来。在断点处，可以使用 list 命令查看断点附近的代码，或者用 step 命令单步执行，print 或者 dump 打印变量或表达式的值，locals 命令查看当前方法中的所有变量，cont 命令继续执行代码。还有一些其他的命令就不多做介绍了，可以使用 help 查看所有的命令清单，或者参考 jdb 的官方文档。

2.2 探索 class 文件结构

在 jdb 中调试 Java 程序时，有可能源代码文件和 class 文件不在一起，这个时候需要指定源码位置：

# jdb -sourcepath path/to/source Test

如果不指定源码位置，在使用 list 命令时会提示找不到源码文件，如果真的没有源码文件，那么在 jdb 里完全就是瞎调了。我们知道 Java 代码在执行的时候，是以字节码的形式运行在 JVM 里的，可以猜测到，class 文件中必然有着和源码相关联的一些信息，类似于 C/C++ 语言的 obj 文件一样，要不然 list 命令怎么可以显示出当前正在执行的代码是哪一行呢？我们可以使用开源的 jclasslib 软件查看 class 文件里的内容，一个标准的 class 文件包含了下面这些信息：

基本信息
常量池
接口
属性
父类
字段
方法
- Code 属性
  - 行号属性
  - 局部变量表

如下图所示，其中最重要的一个部分就是 Code 属性，Code 属性下面有行号属性 LineNumberTable，这个 LineNumberTable 就是调试器用来关联字节码和源代码的关键。关于 class 文件，可以参考这篇文章《深入理解 Java 虚拟机》的学习笔记。

题外话：没有源码时如何调试？

如果没有源码，虽然在 jdb 里也可以用 step 来单步，但是没有办法显示当前正在运行的代码，这简直就是盲调。这个时候只能使用字节码调试工具了，常见的字节码调试器有：Bytecode Visualizer、JSwat Debugger、Java ByteCode Debugger (JBCD) 等等，参考这里。

三、关于远程调试

通过对 jdb 的学习，我们已经越来越接近 Java 调试器的真相了，但是还差最后一步。让我们先看看 Java 程序在 IDEA 里是如何被调试的，如果你有很强的好奇心，那么在 IDEA 里调试程序的时候可能已经发现了下面的秘密：

或者在调试 tomcat 的时候，也有类似的一串仿佛魔咒一般的参数：

这串魔咒般的参数像下面这样，一旦你理解了这串参数，你也就打破了 Java 调试器的魔咒，然后才能认识到 Java 调试器真正的面目：

"C:\Program Files\Java\jdk1.8.0_111\bin\java" -agentlib:jdwp=transport=dt_socket,address=127.0.0.1:20060,suspend=y,server=n Foo
Connected to the target VM, address: '127.0.0.1:20060', transport: 'socket'

这里面有两个关键点：

Java 程序在运行的时候带着 -agentlib 参数，这个参数用于指示 JVM 在启动时额外加载的动态库文件，-agentlib 参数和 -javaagent 不一样，这个库文件应该是由 C/C++ 编写的原生程序（JNI），类似于这里的 jdwp，在 Windows 上对应一个 jdwp.dll 库文件，在 Linux 上对应 jdwp.so 文件。那么这个 jdwp 库文件到底是做什么的呢？它后面的一串参数又是什么意思？
jdwp 的参数里貌似提到了 socket，并有 address=127.0.0.1:20060 这样的 IP 地址和端口号，而且下面的 Connected to the target VM 也似乎表示调试器连接到了这么一个网络地址，那么这个地址到底是什么呢？由于这里是本地调试，所以 IP 地址是 127.0.0.1 ，那么如果是远程调试的话，是不是这里也是支持的呢？

在 IDEA 的 Run/Debug Configuration 配置页面，你也可以添加一个远程调试，界面如下图，可以发现上面那串魔咒参数又出现了：

在真正开始远程调试之前，我们不妨带着这些疑问，来学习 Java 调试器的基本原理。

四、Java 调试原理及 JPDA 简介

在武侠世界里，天下武功可以分为两种：一种讲究招式新奇，出招时能出其不意，善于利用兵器的特性和自身的高妙手法攻敌不备；另一种讲究内功心法，就算是最最普通的招式，结合自身的深厚内力，出招时也能有雷霆之势。其实在技术的世界里，武功也可以分为两种：技巧和原理。上面讲的那么多，无论你是掌握了 IDEA 的所有调试技巧也好，还是记熟了 jdb 的所有命令也好，都只是招式上的变化，万变不离其宗，我们接下来就看看调试器的内功心法。

4.1 JPDA

我们知道，Java 程序都是运行在 JVM 上的，我们要调试 Java 程序，事实上就需要向 JVM 请求当前运行态的状态，并对 JVM 发出一定的指令，或者接受 JVM 的回调。为了实现 Java 程序的调试，JVM 提供了一整套用于调试的工具和接口，这套接口合在一起我们就把它叫做 JPDA（Java Platform Debugger Architecture，Java 平台调试体系）。这个体系为开发人员提供了一整套用于调试 Java 程序的 API，是一套用于开发 Java 调试工具的接口和协议。本质上说，它是我们通向虚拟机，考察虚拟机运行态的一个通道，一套工具。

JPDA 由三个相对独立的层次共同组成，而且规定了它们三者之间的交互方式。这三个层次由低到高分别是 Java 虚拟机工具接口（JVMTI），Java 调试线协议（JDWP）以及 Java 调试接口（JDI），如下图所示（图片来自 IBM developerWorks）：

这三个模块把调试过程分解成几个很自然的概念：调试者（debugger）和被调试者（debuggee），以及他们中间的通信器。被调试者运行于我们想调试的 Java 虚拟机之上，它可以通过 JVMTI 这个标准接口，监控当前虚拟机的信息；调试者定义了用户可使用的调试接口，通过这些接口，用户可以对被调试虚拟机发送调试命令，同时调试者接受并显示调试结果。在调试者和被调试者之间，调试命令和调试结果，都是通过 JDWP 的通讯协议传输的。所有的命令被封装成 JDWP 命令包，通过传输层发送给被调试者，被调试者接收到 JDWP 命令包后，解析这个命令并转化为 JVMTI 的调用，在被调试者上运行。类似的，JVMTI 的运行结果，被格式化成 JDWP 数据包，发送给调试者并返回给 JDI 调用。而调试器开发人员就是通过 JDI 得到数据，发出指令。详细的内容，可以参考 IBM developerWorks 上的一篇系列文章《深入 Java 调试体系》。

4.2 Connectors & Transport

到这里，我们已经知道了 jdwp 是调试器和被调试程序之间的一种通信协议。不过命令行参数 -agentlib:jdwp=transport=dt_socket,address=127.0.0.1:20060,suspend=y,server=n 中的 jdwp 貌似还不止于此。事实上，这个地方上 jdwp.dll 库文件把 JDI，JDWP，JVMTI 三部分串联成了一个整体，它不仅能调用本地 JVMTI 提供的调试能力，还实现了 JDWP 通信协议来满足 JVMTI 与 JDI 之间的通信。想要完全理解这串参数的意思，我们还需要学习两个概念：Connectors（连接器）和 Transport（传输）。

常见的连接器有下面 5 种，它指的是 JDWP 建立连接的方式：

Socket-attaching connector
Shared-memory attaching connector
Socket-listening connector
Shared-memory listening connector
Command-line launching connector

其中 attaching connector 和 listening connector 的区别在于到底是调试器作为服务端，还是被调试程序作为服务端。
传输指的是 JDWP 的通信方式，一旦调试器和被调试程序之间建立起了连接，他们之间就需要开始通信，目前有两种通信方式：Socket（套接字）和 Shared-memory（共享内存，只用在 Windows 平台）。

4.3 实战远程调试

通过上面的学习我们了解到，Java 调试器和被调试程序是以 C/S 架构的形式运行的，首先必须有一端以服务器的形式启动起来，然后另一段以客户端连接上去。如果被调试程序以服务端运行，必须加上下面的命令行参数（关于 jdwp 参数，可以参考 JavaSE 的文档）：

# java -agentlib:jdwp=transport=dt_socket,server=y,address=5005 Test
# java -agentlib:jdwp=transport=dt_shmem,server=y,address=javadebug Test

第一句是以 socket 通信方式 来启动程序，第二句是以 共享内存 的方式来启动程序，socket 方式需要指定一个端口号，调试器通过该端口号来连接它，共享内存方式需要指定一个连接名，而不是端口号。在程序运行起来之后，可以使用 jdb 的 -attach 参数将调试器和被调试程序连接起来：

# jdb -attach 5005
# jdb -attach javadebug

在 Windows 平台上，第一条命令会报这样的错：java.io.IOException: shmemBase_attach failed: The system cannot find the file specified，这是由于 jdb -attach 使用系统默认的传输来建立连接，而在 Windows 上默认的传输是 共享内存 。要想在 Windows 上使用 socket 方式来连接，要使用 jdb -connect 命令，只是命令的参数在写法上不太好记忆：

# jdb -connect com.sun.jdi.SocketAttach:hostname=localhost,port=5005
# jdb -connect com.sun.jdi.SharedMemoryAttach:name=javadebug

如果反过来，想让调试器以服务端运行，执行下面的命令：

# jdb -listen javadebug

然后 Java 程序通过下面的参数来连接调试器：

# java -agentlib:jdwp=transport=dt_shmem,address=javadebug, suspend=y Test
# java -agentlib:jdwp=transport=dt_socket,address=127.0.0.1:5005,suspend=y,server=n

最后我们再回过头来看一看 IDEA 打印出来的这串魔咒参数，可以大胆的猜测，IDEA 在调试的时候，首先以服务器形式启动调试器，并在 20060 端口监听，然后 Java 程序以 socket 通信方式连接该端口，并将 JVM 暂停等待调试。

"C:\Program Files\Java\jdk1.8.0_111\bin\java" -agentlib:jdwp=transport=dt_socket,address=127.0.0.1:20060,suspend=y,server=n Foo
Connected to the target VM, address: '127.0.0.1:20060', transport: 'socket'

如果在 IDEA 下进行远程调试，可以参考 IBM developerWorks 上的另一篇与调试相关的主题：使用 Eclipse 远程调试 Java 应用程序。

总结

这篇文章首先介绍了 IDEA 的一些常用调试技巧，然后通过使用 jdb 进行 Java 程序的调试，学习了 jdb 的常用命令，最后通过远程调试引出调试器原理的话题，对 JPDA、JVMTI、JDWP、JDI 等概念有了一个初步的认识。从招式到心法，由技巧到原理，逐步揭开了 Java 调试器的神秘面纱。对于开发人员来说，如果只懂招式，只会一些奇淫技巧，那么他只是把工具用得更得心应手而已，很难在技术上得到质的突破；而如果只懂心法，只沉浸于基本原理和理论，那么他只能做一个眼高手低的学院派，空有满腹大道理却无用武之地。我们更应该内外兼修，把招式和心法结合起来，融会贯通，方能成正果。

最后的最后，关于调试的话题不得不补充一句：调试程序是一个费时费力的过程，一旦需要调试来定位问题，说明代码的逻辑性和清晰性有问题，最好的代码是不需要调试的。所以，少一点调试，多一点单元测试，多一点重构，将代码写的更清晰才是最好的编程方式。

番外篇：关于调试器的测不准效应

在量子物理学中，有一个名词叫 测不准原理，又叫 不确定性原理，讲的是粒子的位置与动量不可同时被确定，位置的不确定性越小，则动量的不确定性越大，反之亦然。说白点就是，你如果要很准确的测量粒子的位置，那么就不能准确的测量粒子的动量；如果要很准确的测量粒子的动量，那么粒子的位置就测不准；正是由于测量本身，会导致系统受影响。

把这个现象套在调试器领域里，也有着类似的效果。由于调试器本身的干扰，程序已经不是以前的程序了。所以问题来了，在调试器下运行出来的结果，真的可信吗？下面是我想出来的一个有趣的例子，假设我们在第 4 行下一个断点，程序最后输出结果会是什么呢？

参考

扫描二维码，在手机上阅读！

August 30, 2015

修改 GRUB 文本模式的分辨率

最近将系统升级到了 Ubuntu 15.04 ，它的开机过程由 GRUB2 引导，我很喜欢将开机过程设置成文本模式，这样可以很清楚的看到它开机的时候都在干什么。设置文本模式其实很简单，只需打开 /etc/default/grub 文件，修改 GRUB_CMDLINE_LINUX_DEFAULT 参数为 text 即可：

#GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
GRUB_CMDLINE_LINUX_DEFAULT="text"

修改完后记得使用 update-grub2 更新：

sudo update-grub2

但是在重启的时候我们会发现文本模式的分辨率非常低（看上去应该是 640x480），字体显得非常大，看起来很不爽。Google 后发现很多人讲到这个问题，但是网上的很多信息已经过时了甚至是错误的，特此记录一下。

其实 GRUB 是支持设置文本分辨率的，也就是所谓的 framebuffer resolution ，这篇文章介绍了如何设置 framebuffer resolution 的技巧。设置方法是在 /etc/default/grub 文件中添加如下两行代码：

GRUB_GFXMODE=1024x768x32
GRUB_GFXPAYLOAD_LINUX=keep

注意的是，显卡需要支持 VBE （VESA BIOS Extensions），设置的分辨率必须在 VBE 允许的范围内。在老版本的 Ubuntu 中可以通过 hwinfo 来查看显卡支持的分辨率，但是 Ubuntu 15.04 中貌似已经废弃掉该工具了。可以通过重启机器，长按 Shift 键进入 GRUB 菜单，而后按 C 键进入 GRUB 命令行，使用 GRUB 自带的 vbeinfo 命令来查看你的显卡所有支持的分辨率。

另外网上有些资料说通过设置 GRUB_GFXMODE 和 GRUB_GFXPAYLOAD 两个参数来修改分辨率，但是经过我的测试似乎没有效果， GRUB_GFXPAYLOAD 这个参数在 Ubuntu 15.04 中也已经弃用了，所以应该使用 GRUB_GFXPAYLOAD_LINUX 参数。

参考

扫描二维码，在手机上阅读！

August 20, 2015

在 Windows 命令行下显示目录的大小

我们知道在 Linux 系统下使用 du 命令可以很方便的查看某个目录的大小，甚至也可以列出某个目录下的所有子目录的大小。这在查找大文件时非常方便，因为有时候我们会遇到这种情况，譬如，磁盘空间快满了，我们知道 /home/apps 目录非常大，而这个目录下面又有着几十个不同的子目录，我们希望能知道每个子目录的大小以方便我们找到是哪个目录最占空间，那么怎么能快速找到最占空间的子目录呢？

在 Linux 系统下，我们使用下面的 du 命令显示当前目录的总大小：

du -sh .

也可以像下面这样，显示当前目录下的所有一级子目录的大小：

du -h --max-depth=0 .

可以看到在 Linux 下是非常方便的，而在 Windows 下就没有原生的工具可以很方便的实现这一点了。Windows Sysinternals Suite 提供了一个类似于 Linux 下的 du 命令的小工具 Disk Usage，命令的语法稍微有些不同，你可以查看下这个工具的使用文档。

借助外界的工具肯定是可以实现这个功能的，但是也可以直接在 Windows 命令行下不依赖于第三方工具来实现，譬如，使用下面的 PowerShell 命令：

Get-ChildItem -Recurse | Measure-Object -Sum Length

Get-ChildItem 命令用于遍历目录下的所有子目录和文件，类似于 dir 命令，使用 -Recurse 参数可以实现递归遍历。
Measure-Object 命令常作用于管道，对管道的结果进行统计操作，譬如：计数、求和、平均数、最大数、最小数等等。

PowerShell 的命令总给人一种怪怪的感觉，不过它也提供了简写的语法：

ls -r | measure -s Length

看起来比上面的要舒服多了。或者直接在命令行 cmd 下执行：

powershell -noprofile -command "ls -r | measure -s Length"

如果不习惯 PowerShell 这种重量级的命令，也可以直接在命令行 cmd 下使用 for 命令实现，不过要借助一个中间变量，譬如将下面的代码复制到一个批处理文件中：

@echo off
set size=0
for /r %%x in (folder\*) do set /a size+=%%~zx
echo %size% Bytes

在 Windows 命令行下，for绝对是最复杂的命令，没有之一。让我们来解析下上面的那句命令：

for /r 表示递归的遍历一个目录下的所有文件。它的语法是这样：FOR /R [[drive:]path] %%parameter IN (set) DO command，所以其中的 %%x 是我们定义的一个参数，表示目录下的某个文件。注意，在批处理文件中必须要使用两个%%，如果是在命令行下尝试该命令的话，则只需要一个%就可以了。
do 之后的部分是我们针对每个参数（在这里也就是对每个文件）执行的操作。set 命令可以用于显示、设置或删除某个变量的值，set /a 用于对变量进行数学表达式运算（arithmetic expressions），在这里我们使用 += 来对文件大小进行累加。
最后一个是 %%~zx ，这里的 %%x 是就是上面的 x 参数，但是中间添加了 ~z 这样的特殊符号，这被称为参数扩展（Parameter Extensions），表示对应的文件大小，另外还有很多其他有用的扩展，如 ~n 表示不带扩展的文件名，~x 表示文件的扩展名，~t 表示文件的时间等等。和参数扩展类似的，还有两个与字符串变量相关的操作：字符串替换（Variable Replace）和字符串截取（Variable Substring），在 Windows 批处理中经常会遇到，也可以一起了解下。

不过要特别注意的是，在 Windows 的 cmd 下面，数字类型为 32 位的符号整型，所以最多支持到 2GB 大小的目录，超出 2GB 的结果可能会变成负数。所以最好的做法还是使用上面的 PowerShell 命令。

参考

扫描二维码，在手机上阅读！

分类 工具技巧 下的文章

分类

分类工具技巧下的文章