[转帖]time_wait与close_wait

time,wait,close · 浏览次数 : 0

小编点评

**1. reliability 实现 TCP全双工连接的终止。** TIME_WAIT 状态用于确保发送方在对方接收 FIN 后等待接收方发送 ACK 时正确处理连接终止。如果对方在发送 ACK 时丢失了 FIN,发送方会重新发送 FIN,并处于 TIME_WAIT 状态,直到对方接收并处理了 FIN。 **2. 减少老重复分节在网络中的消逝。** TIME_WAIT 状态用于确保当老的重复分节在网络中消逝时,发送方不会重新发送 FIN。 **3. 避免大量的 close_wait。** TIME_WAIT 状态用于确保当服务器端fork许多子进程,在这些子进程中接收/发送时,父进程不会在收到 FIN 时立即关闭套接字。如果需要,可以设置 SO_REUSEADDR选项来允许服务器在以前建立的连接上再次使用相同的端口。 **4. 避免 close_wait。** 方法 1:使用 SO_KEEPALIVE 套接字选项。 方法 2:我们也可以自己写一个发送心跳包的线程,定期发送心跳包,如果对方关闭了套接字,则我们会收到 RST。

正文

https://www.cnblogs.com/zh-dream/p/13620175.html

 

为什么要有TIME_WAIT呢?

1.可靠地实现TCP全双工连接的终止。
A发送FIN到B,B收到FIN后发送ACK到A,然后再发送FIN到A,A最后发送ACK到B,之后进入到TIME_WAIT状态。如果A到B的ACK丢失了,B没有接到会怎样?这个时候A处于TIME_WAIT状态,B没有接到ACK将会重新发送FIN,然后A重新发送ACK。
2.使得老的重复分节在网络中消逝。
假设在IP1的端口1和IP2的端口2之间有一个TCP连接,我们关闭这个连接,过一会儿重连这个连接。需要知道的是TCP不允许已关闭连接的重复分节再出现,所以需要TIME_WAIT,使得这些重复分节彻底消逝。(TCP中是可靠的服务,当数据包丢失会重传,当有数据包迷路的情况下,如果不等待2MSL时,当客户端以同样地方式重新和服务建立连接后,上一次迷路的数据包这时可能会到达服务,这时会造成旧包被重新读取)

 
image.png

close_wait

close_wait产生的原因是当某一端发送FIN,本端接收到就进入close_wait状态,直到本端发送FIN。
所以说time_wait是主动关闭的一方会经历的状态,close_wait是被动关闭一方会经历的状态。

什么情况下会产生大量的close_wait呢?

当服务器端fork许多子进程,在这些子进程中接收/发送,父进程一直监听新的连接,sockfd套接字计数就会很大,如果客户端发送FIN过来,服务器端子进程调用close使sockfd引用计数减1(没有发送FIN给客户端),但是不会关闭这个套接字,这个时候就进入了close_wait状态。
或者是
对方发送FIN,我方忙于读或者写,没有关闭连接。

如何避免time_wait?

使用SO_REUSEADDR选项,
setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR, (const voidvoid )&opt, sizeof(opt));
SO_REUSEADDR允许启动一个监听服务器并捆绑其众所周知的端口,即使以前建立的将该端口用作他们的本地端口的连接仍存在。也就是说
允许某一个端口复用。*

如何避免close_wait?

主要思想是判断对方是否关闭了这个套接字。

方法1:使用SO_KEEPALIVE套接字选项。
1、client端连接正常,返回一个ACK.server端收到ACK后重置计时器,在2小时后在发送探测.如果2小时内连接上有数据传输,那么在该时间的基础上向后推延2小时发送探测包;
2、客户端异常关闭,或网络断开。client无响应,server收不到ACK,在一定时间(75秒)后重发keepalive packet, 并且重发一定次数(9次);
3、客户端曾经崩溃,但已经重启.server收到的探测响应是一个RST,server端终止连接。

方法2:我们也可以自己写一个发送心跳包的线程,定期发送心跳包,如果对方关闭了套接字,则我们会收到RST。

如果服务器出了异常,百分之八九十都是下面两种情况:

1.服务器保持了大量TIME_WAIT状态
2.服务器保持了大量CLOSE_WAIT状态
查看当前状态的命令: netstat -nat

 
 
0人点赞
 

与[转帖]time_wait与close_wait相似的内容:

[转帖]time_wait与close_wait

https://www.cnblogs.com/zh-dream/p/13620175.html 为什么要有TIME_WAIT呢? 1.可靠地实现TCP全双工连接的终止。A发送FIN到B,B收到FIN后发送ACK到A,然后再发送FIN到A,A最后发送ACK到B,之后进入到TIME_WAIT状态。如果

[转帖]性能案例-Linux下解决time_wait连接过多(Linux内核优化)

一、性能测试的主要概念和计算公式 系统吞度量要素: 一个系统的吞度量(承压能力)与request对CPU的消耗、外部接口、IO等等紧密关联。 单个reqeust 对CPU消耗越高,外部系统接口、IO影响速度越慢,系统吞吐能力越低,反之越高。 系统吞吐量几个重要参数:QPS(TPS)、并发数、响应时间

[转帖]TIME_WAIT和CLOSE_WAIT状态区别

在服务器的日常维护过程中,会经常用到下面的命令: netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 它会显示例如下面的信息: TIME_WAIT 814 CLOSE_WAIT 1 FIN_WAIT1 1 ESTA

[转帖]TIME_WAIT 过多导致的问题

https://www.cnblogs.com/byfboke/p/14431176.html 背景:由于秒杀业务需求,会有持续并发连接的情况 问题:鉴于成本问题,业务项目会有交叉部署的情况,某个服务的TIME_WAIT 网络连接数过多,导致了其他应用不可用 解决:基于三个层面考虑 1>调优系统网络

[转帖]TIME_WAIT和CLOSE_WAIT的区别

系统上线之后,通过如下语句查看服务器时,发现有不少TIME_WAIT和CLOSE_WAIT。 netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' TIME_WAIT 297 ESTABLISHED 53 CLOSE

[转帖]TIME_WAIT 过多导致的问题

https://www.cnblogs.com/byfboke/p/14431176.html 背景:由于秒杀业务需求,会有持续并发连接的情况 问题:鉴于成本问题,业务项目会有交叉部署的情况,某个服务的TIME_WAIT 网络连接数过多,导致了其他应用不可用 解决:基于三个层面考虑 1>调优系统网络

[转帖]TIME_WAIT连接过多解决办法

问题起因: 自己开发了一个服务器和客户端,通过短连接的方式来进行通讯,由于过于频繁的创建连接,导致系统连接数量被占用,不能及时释放。看了一下18888,当时吓到了。 现象: 1、外部机器不能正常连接SSH 2、内向外不能够正常的ping通过,域名也不能正常解析。 问题排查: 通过 netstat -

[转帖]关于TIME_WAIT优化

我们先看一下四次挥手过程 # netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' # netstat -tan | awk '{print $6}' | sort | uniq -c 通过此图先说明几个概念: TI

【转帖】SQUID TIME_WAIT值过高引起的服务器被拖慢

https://www.diewufeiyang.com/post/895.html 查看TCP的连接状态值: # netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' vi /etc/sysctl.conf 添加如

[转帖]tcp_tw_reuse、tcp_tw_recycle 使用场景及注意事项

linux TIME_WAIT 相关参数: net.ipv4.tcp_tw_reuse = 0 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭net.ipv4.tcp_tw_recycle = 0 表示开启TCP连接中TIME-WAIT socket