写程序,经常碰见这种情况,主要是有一方关闭socket,但是另外一方没有检测到,导致没有检测到的一方出现close_wait的情况.
eg:
[oracle10@rhel3 cc]$ netstat | grep 6800
tcp 55 0 rhel3:6800 192.168.1.35:34575 close_wait
tcp 1 0 rhel3:6800 rhel3:2176 close_wait
tcp 55 0 rhel3:6800 rhel3:2180 close_wait
tcp 1 0 rhel3:6800 rhel3:2174 close_wait
tcp 1 0 rhel3:6800 rhel3:2175 close_wait
tcp 55 0 rhel3:6800 192.168.1.35:32998 close_wait
************************
socket在关闭时的几个主要状态
************************
*time_wait* (faq 1578)
当一个socket进程结束后,相应的socket仍会保持time_wait状态4分钟。这样的目的是为了保证那些因某些原因在网络上传送很慢的包在这个scoket完全关闭之前到达。
这样后来使用同样的socket的进程不会收到本应发给前一个使用该socket的进程的数据包。
相关参数:
tcp_keepalive_interval
tcp_ip_abort_interval
tcp_close_wait_interval
*fin_wait_2* (faq 3285)
当server收到一个关闭tcp连接的请求时,它会发一个设置了fin位的packet给client。client会回应一个设置了ack位的 packet。然后,client会发送一个设置了fin位的packet给server,server回应一个ack,这个连接应关闭了。server 接收到client的ack,然后开始等待client的fin包的状态就是fin_wait_2。
在fin_wait_2状态,server不会往client发送数据和控制信息,它只是等待client的fin包。
相关参数:
tcp_fin_wait_2_flush_interval 系统将会flush out处于fin_wait_2状态的tcp连接的间隔,理论上最小值为6750ms。
*close_wait* (info 19137 )
tcp连接总处于close_wait状态是由于当tcp没有开始协议中的close阶段。
tcp连接中close_wait状态的发生是当server没有收到应用程序的close,但应用程序已经终止了。这可能是一个有问题的应用程序在关闭窗口并结束之后发出了fin包。有时候是当solaris系统缺少kernal,tcp,ip,libnsl 或 rpcbind等patch造成。
close_wait状态意味着连接的另一端已经关闭了,而本地端仍在等待应用程序关闭。一个不确定的tcp连接指示着存在应用一级的bug。
在收到一个从远端发来的fin之后,收到应用程序发出的close之前,tcp连接将从established状态变为close_wait状态, after
从close_wait-> last_ack的转换是在应用程序发出close时发生的。在转换过程中,tcp会安排(schedule)发送一个fin,这个fin将在保留的数据之后发出,如果接收端已经关闭了窗口可能会被延迟。
from : http://www.goodba.net/unix/secure/2-3.htm
-----------------------------------------------
一个client和一个server,两者之间建立了一个基于tcp的socket连接,在刚刚建立好连接后,尚未进行数据传输,server端应用程序突然crush掉了,现在立刻重启server端应用程序(假设间隔很短),一般情况下server端应用程序是无法启动的。请问是什么原因?
因为绑定的socket还处于close_wait状态,如果用setsockopt,设置so_reuseaddr,则不会出现这种情况
from :
------------------------------------------------
more information cu bbs :
阅读(4701) | 评论(0) | 转发(0) |