本章介绍如何使用NGINX Plus和NGINX开放源代理和负载平衡TCP和UDP流量。
目录
介绍
负载平衡是指跨多个后端服务器有效分布网络流量。
在版本5和更高版本中,NGINX可以代理和负载平衡TCP流量。TCP(传输控制协议)是用于许多流行的应用和服务的协议,例如LDAP,MySQL和RTMP。
在版本9和更高版本中,NGINX可以代理和负载平衡UDP流量。UDP(用户数据报协议)是许多流行的非事务性应用程序的协议,例如DNS,syslog和RADIUS。
要加载平衡HTTP流量,请参阅HTTP负载平衡一文。
先决条件
- 最新的
--with-stream
NGINX 开源采用配置标志或最新的NGINX Plus构建(无需额外的构建步骤) - 通过TCP或UDP进行通信的应用程序,数据库或服务
- 上游服务器,每个服务器运行应用程序,数据库或服务的同一实例
配置反向代理
首先,您需要配置反向代理,以便NGINX 可以将客户端的TCP连接或UDP数据报转发到上游组或代理服务器。
打开NGINX配置文件并执行以下步骤:
1、创建顶级stream {}
块:
stream {
...
}
2、server {}在顶层stream {}上下文中为每个虚拟服务器 定义一个或多个配置块。
3、在server {}每个服务器的配置块中,包括listen用于定义服务器侦听的IP地址和/或端口的指令。对于UDP流量,还包括udp参数。TCP是stream上下文的默认协议,因此没有tcp
参数listen指令:
stream {
server {
listen 12345;
...
}
server {
listen 53 udp;
...
}
...
}
4、包括proxy_pass
用于定义代理服务器的指令或服务器转发流量的上游组:
stream {
server {
listen 12345;
</span>#TCP traffic will be proxied to the <span style="color:#800000;">"</span><span style="color:#800000;">stream_backend</span><span style="color:#800000;">"</span><span style="color:#000000;"> upstream group
proxy_pass stream_backend;
}
server {
listen </span><span style="color:#800080;">12346</span><span style="color:#000000;">;
</span>#<span style="color:#000000;">TCP traffic will be proxied a proxied server
proxy_pass backend.example.com:</span><span style="color:#800080;">12346</span><span style="color:#000000;">;
}
server {
listen </span><span style="color:#800080;">53</span><span style="color:#000000;"> udp;
</span>#UDP traffic will be proxied to the <span style="color:#800000;">"</span><span style="color:#800000;">dns_servers</span><span style="color:#800000;">"</span><span style="color:#000000;"> upstream group
proxy_pass dns_servers;
}
...
}
5、或者,如果您的代理服务器有多个网络接口,您可以配置NGINX选择一个源IP地址连接到上游服务器。如果NGINX后面的代理服务器配置为接受来自特定IP网络或IP地址范围的连接,这可能很有用。
指定proxy_bind必需的网络接口的伪指令和IP地址:
stream {
...
server {
listen 127.0.0.1:12345;
proxy_pass backend.example.com:12345;
proxy_bind 127.0.0.1:12345;
}
}
6、或者,您可以调整两个内存缓冲区的大小,其中NGINX可以从客户端和上游连接中输入数据。如果存在小量的数据,则可以减少缓冲器,这可以节省存储器资源。如果存在大量数据,则可以增加缓冲区大小以减少套接字读/写操作的数量。一旦在一个连接上接收到数据,NGINX读取它并通过另一个连接转发它。缓冲区由指令proxy_buffer_size控制:
stream {
...
server {
listen 127.0.0.1:12345;
proxy_pass backend.example.com:12345;
proxy_buffer_size 16k;
}
}
配置TCP或UDP负载平衡
1、创建一组服务器,或流量将负载平衡的上游组。upstream {}
在顶层stream {}
上下文中定义一个或多个配置块,并为上游组设置名称,例如,stream_backend
对于TCP服务器和dns_servers
UDP服务器:
stream {
upstream stream_backend {
...
}
upstream dns_servers {
...
}
...
}
注意:确保上一个配置中proxy_pass
引用了上游组的名称。
2、使用上游服务器填充上游组。在upstream {}
块中,server
为每个上游服务器添加一个伪指令,指定其IP地址或主机名(可解析为多个IP地址)和必需的端口号。请注意,您不为每个服务器定义协议,因为它是由您在前面创建listen
的server
块中的伪指令中包含的参数为整个上游组定义的。
stream {
upstream stream_backend {
server backend1.example.com:12345;
server backend2.example.com:12345;
server backend3.example.com:12346;
...
}
upstream dns_servers {
server 192.168.136.130:53;
server 192.168.136.131:53;
...
}
...
}
配置上游组使用的负载分担方法。您可以指定以下方法之一:
round-robin
- 默认情况下,NGINX使用循环算法对流量进行负载均衡,将其顺序定向到配置的上游组中的服务器。因为它是默认方法,没有round-robin
指令; 只需upstream
在顶层stream
上下文中创建一个配置块并添加上server
一步中描述的指令。least_conn
- NGINX选择当前活动连接数较少的服务器。least_time
- NGINX选择平均延迟最小,活动连接数最少的服务器。最低平均延迟是基于以下参数中的哪一个包括在least_time
指令上计算的:connect
- 连接到上游服务器的时间first_byte
- 接收数据的第一个字节的时间last_byte
- 从服务器接收完整响应的时间
-
upstream stream_backend { least_time first_byte;
server backend1.example.com:</span><span style="color:#800080;">12345</span><span style="color:#000000;">; server backend2.example.com:</span><span style="color:#800080;">12345</span><span style="color:#000000;">; server backend3.example.com:</span><span style="color:#800080;">12346</span><span style="color:#000000;">;
}
hash
- NGINX基于用户定义的密钥选择服务器,例如源IP地址($remote_addr
):
upstream stream_backend {
hash $remote_addr;
server backend1.example.com:</span><span style="color:#800080;">12345</span><span style="color:#000000;">;
server backend2.example.com:</span><span style="color:#800080;">12345</span><span style="color:#000000;">;
server backend3.example.com:</span><span style="color:#800080;">12346</span><span style="color:#000000;">;
}
所述散列负载平衡方法还用于配置会话持久性。由于散列函数基于客户端IP地址,来自给定客户端的连接始终传递到同一服务器,除非服务器关闭或以其他方式不可用。指定一个可选consistent
参数以应用ketama一致性散列方法:
hash $remote_addr consistent;
或者,对于每个上游服务器,指定服务器特定的参数,包括最大连接数,服务器权重等:
upstream stream_backend {
hash $remote_addr consistent;
server backend1.example.com:12345 weight=5;
server backend2.example.com:12345;
server backend3.example.com:12346 max_conns=3;
}
upstream dns_servers {
least_conn;
server </span><span style="color:#800080;">192.168</span>.<span style="color:#800080;">136.130</span>:<span style="color:#800080;">53</span><span style="color:#000000;">;
server </span><span style="color:#800080;">192.168</span>.<span style="color:#800080;">136.131</span>:<span style="color:#800080;">53</span><span style="color:#000000;">;
...
}</span></span></pre>
另一种方法是将流量代理到单个服务器而不是上游组。如果您通过主机名标识服务器,并将主机名配置为解析为多个IP地址,则NGINX使用循环算法在IP地址之间对流量进行负载平衡。在这种情况下,必须在配置参数中指定服务器的端口号,proxy_pass
并且不能在IP地址或主机名之前指定协议:
stream {
...
server {
listen 12345;
proxy_pass backend.example.com:12345;
}
}
被动健康监控
如果尝试连接到上游服务器超时或导致错误,NGINX开源或NGINX Plus可以将服务器标记为不可用,并停止向其发送请求一段确定的时间。要定义NGINX认为上游服务器不可用的条件,请在指令中包含以下server
参数
fail_timeout
- 指定数量的连接尝试必须失败,服务器被认为不可用的时间量。此外,在标记它之后,NGINX认为服务器不可用的时间量。max_fails
- 在指定时间内发生的NGINX认为服务器不可用的失败尝试次数。
默认值为10
秒和1
尝试。因此,如果连接尝试在10秒内超时或至少出现一次失败,则NGINX将服务器标记为不可用10秒。该示例显示如何在30秒内将这些参数设置为2个故障:
upstream stream_backend {
server backend1.example.com:12345 weight=5;
server backend2.example.com:12345 max_fails=2 fail_timeout=30s;
server backend3.example.com:12346 max_conns=3;
}
主动健康监控
可以配置运行状况检查以测试各种故障类型。例如,NGINX Plus可以连续测试上游服务器的响应能力,避免出现故障的服务器。
怎么运行的
NGINX Plus向每个上游服务器发送特殊的健康检查请求,并检查满足特定条件的响应。如果无法建立与服务器的连接,则健康检查将失败,并认为服务器不正常。NGINX Plus不会将客户端连接代理到不正常的服务器。如果为一组服务器定义了几个运行状况检查,则任何一个检查的失败都足以使相应的服务器被视为不正常运行。
先决条件
- 您已在
stream
上下文中配置了上游服务器组,例如:
stream {
upstream stream_backend {
server backend1.example.com:</span><span style="color:#800080;">12345</span><span style="color:#000000;">;
server backend2.example.com:</span><span style="color:#800080;">12345</span><span style="color:#000000;">;
server backend3.example.com:</span><span style="color:#800080;">12345</span><span style="color:#000000;">;
}
}
- 您已配置将流量(在这种情况下为TCP连接)传递到服务器组的服务器:
server {
listen 12345;
proxy_pass stream_backend;
}
基本配置
- 指定共享内存区域 - 一个特殊区域,NGINX Plus工作进程共享关于计数器和连接的状态信息。将
zone
指令添加到上游服务器组,并指定区域名称和内存量:
stream {
upstream stream_backend {
zone stream_backend 64k;
server backend1.example.com:</span><span style="color:#800080;">12345</span><span style="color:#000000;">;
server backend2.example.com:</span><span style="color:#800080;">12345</span><span style="color:#000000;">;
server backend3.example.com:</span><span style="color:#800080;">12345</span><span style="color:#000000;">;
}
}
对上游组中的服务器启用运行状况检查。将health_check
和health_check_timeout
指令添加到代理到上游组的连接的服务器:
server {
listen 12345;
proxy_pass stream_backend;
health_check;
health_check_timeout 5s;
}
该health_check
指令启用运行状况检查功能,同时health_check_timeout
覆盖proxy_timeout
运行状况检查的值,对于运行状况检查,此超时需要显着缩短。
要对UDP流量启用运行状况检查,在health_check
指令中指定udp
启用UDP的运行状况检查的参数,以及包含用于验证服务器响应的测试match=
的相应match
块的名称的参数(请参阅微调UDP运行状况检查):
server {
listen 5053;
proxy_pass dns_servers;
health_check udp match=dns;
health_check_timeout 5s;
}
微调健康检查
默认情况下,NGINX Plus每5秒尝试连接一个上游服务器组中的每个服务器。如果无法建立连接,NGINX Plus认为健康检查失败,将服务器标记为不正常,并停止将客户端连接转发到服务器。
要更改默认行为,请在参数中包含health_check
参数:
interval
- NGINX Plus发送健康检查请求的频率(以秒为单位)(默认为5秒)passes
- 服务器必须响应以认为健康的连续运行状况检查的数量(默认值为1)fails
- 服务器必须无法响应以认为不正常的连续运行状况检查数(默认值为1)-
server { listen 12345; proxy_pass stream_backend; health_check interval=10 passes=2 fails=3; }
在该示例中,TCP运行状况检查之间的时间增加到10
秒,服务器在3
连续失败的运行状况检查后被认为不健康,并且服务器需要通过2
连续检查以再次被视为健康。
默认情况下,NGINX Plus会向块中server
指令指定的端口发送运行状况检查消息upstream
。您可以指定另一个端口进行运行状况检查,这在监视同一主机上许多服务的运行状况时尤其有用。要覆盖端口,请指定port
指令的health_check
参数:
server {
listen 12345;
proxy_pass stream_backend;
health_check port=8080;
}
uptream name {
server 192.168.0.21:80;
server 192.168.0.22:80;
check interval=3000 rise=2 fall=5 timeout=1000 type=http;
}
#上面配置的意思是,对name这个负载均衡条目中的所有节点,每个3秒检测一资,请求2资下正常则标记realserver状态为up,如果检测5次都失败,则标记realserver的状态为down,超时间为1秒。