2011-06-05 136 views
-1

我有一个绑定两个端口:6961和6963的应用程序。它是一个客户端控制另一个客户端的客户端服务器客户端的应用程序。服务器守护进程的套接字停止工作

该应用程序运行良好,但在接受和关闭的连接看似随机的数量后,服务器拒绝通过套接字接收或发送数据。我可以与telnet建立连接,但是当我键入内容时,我不会回复回复。

我已经有多次服务器接受多达370个连接,直到它拒绝工作,但上次它只接受70个连接。

我不认为这与套接字的关闭有关,我认为这是我正确的做法。当我启动应用程序时,这是我的netstatlsof输出。但我还没有真正知道如何解释它们。我在Google上搜索时发现了这些。

$ sudo /etc/init.d/icontrold restart 
Stopping daemon 
Starting daemon 
$ sudo netstat | grep -E 696[13] 
tcp6  0  0 ::ffff:192.168.1.1:6963 ::ffff:192.168.1.:50005 TIME_WAIT 
tcp6  0  0 ::ffff:192.168.1.1:6963 ::ffff:192.168.1.:50759 ESTABLISHED 
tcp6  0  0 ::ffff:192.168.1.1:6963 ::ffff:192.168.1.:50758 TIME_WAIT 
tcp6  0  0 ::ffff:192.168.1.1:6963 ::ffff:192.168.1.:50764 FIN_WAIT2 
tcp6  0  0 ::ffff:192.168.1.1:6963 ::ffff:192.168.1.:50761 TIME_WAIT 
tcp6  0  0 ::ffff:192.168.1.1:6963 ::ffff:192.168.1.:50763 TIME_WAIT 
tcp6  0  0 ::ffff:192.168.1.1:6963 ::ffff:192.168.1.:50762 TIME_WAIT 
$ sudo lsof | grep icontrol 
icontrold 5765  root cwd  DIR  8,1 4096  884738 /home/ief2 
icontrold 5765  root rtd  DIR  8,1 4096   2/
icontrold 5765  root txt  REG  8,1 212372 5431298 /usr/sbin/icontrold 
icontrold 5765  root mem  REG  0,0     0 [heap] (stat: No such file or directory) 
icontrold 5765  root mem  REG  8,1 77808 5425003 /usr/lib/libz.so.1.2.3 
icontrold 5765  root mem  REG  8,1 9640  671771 /lib/tls/i686/cmov/libdl-2.4.so 
icontrold 5765  root mem  REG  8,1 1248904  671768 /lib/tls/i686/cmov/libc-2.4.so 
icontrold 5765  root mem  REG  8,1 40208  671760 /lib/libgcc_s.so.1 
icontrold 5765  root mem  REG  8,1 149284  671772 /lib/tls/i686/cmov/libm-2.4.so 
icontrold 5765  root mem  REG  8,1 888612 5425516 /usr/lib/libstdc++.so.6.0.8 
icontrold 5765  root mem  REG  8,1 95056  671782 /lib/tls/i686/cmov/libpthread-2.4.so 
icontrold 5765  root mem  REG  8,1 1268568 5458256 /usr/lib/i686/cmov/libcrypto.so.0.9.8 
icontrold 5765  root mem  REG  8,1 255648 5458257 /usr/lib/i686/cmov/libssl.so.0.9.8 
icontrold 5765  root mem  REG  8,1 105112  673124 /lib/ld-2.4.so 
icontrold 5765  root 0u  IPv6  16962    TCP *:6963 (LISTEN) 
icontrold 5765  root 1u  IPv6  16965    TCP *:6961 (LISTEN) 
icontrold 5765  root 4u  IPv6  16968    TCP 192.168.1.10:6963->192.168.1.4:50759 (ESTABLISHED) 
$ 

这是当服务器停止接受这两个命令的输出:

$ sudo lsof | grep icontrol 
icontrold 4645  root cwd  DIR  8,1 4096 7913473 /root 
icontrold 4645  root rtd  DIR  8,1 4096   2/
icontrold 4645  root txt  REG  8,1 212372 5431298 /usr/sbin/icontrold 
icontrold 4645  root mem  REG  0,0     0 [heap] (stat: No such file or directory) 
icontrold 4645  root mem  REG  8,1 77808 5425003 /usr/lib/libz.so.1.2.3 
icontrold 4645  root mem  REG  8,1 9640  671771 /lib/tls/i686/cmov/libdl-2.4.so 
icontrold 4645  root mem  REG  8,1 1248904  671768 /lib/tls/i686/cmov/libc-2.4.so 
icontrold 4645  root mem  REG  8,1 40208  671760 /lib/libgcc_s.so.1 
icontrold 4645  root mem  REG  8,1 149284  671772 /lib/tls/i686/cmov/libm-2.4.so 
icontrold 4645  root mem  REG  8,1 888612 5425516 /usr/lib/libstdc++.so.6.0.8 
icontrold 4645  root mem  REG  8,1 95056  671782 /lib/tls/i686/cmov/libpthread-2.4.so 
icontrold 4645  root mem  REG  8,1 1268568 5458256 /usr/lib/i686/cmov/libcrypto.so.0.9.8 
icontrold 4645  root mem  REG  8,1 255648 5458257 /usr/lib/i686/cmov/libssl.so.0.9.8 
icontrold 4645  root mem  REG  8,1 105112  673124 /lib/ld-2.4.so 
icontrold 4645  root 0u  IPv6  13679    TCP *:6963 (LISTEN) 
icontrold 4645  root 2u  IPv6  13683    TCP *:6961 (LISTEN) 
icontrold 4645  root 3u  IPv6  15276    TCP 192.168.1.10:6963->192.168.1.4:50730 (ESTABLISHED) 
icontrold 4645  root 4u  IPv6  13685    TCP 192.168.1.10:6963->192.168.1.4:50005 (ESTABLISHED) 
$ sudo netstat | grep 6963 
tcp6  0  0 ::ffff:192.168.1.1:6963 ::ffff:192.168.1.:50005 ESTABLISHED 
tcp6  9  0 ::ffff:192.168.1.1:6963 ::ffff:192.168.1.:50730 ESTABLISHED 

我没有得到一个想法从哪里开始寻找错误。

+0

无法用lsof和netstat输出回答,你可能有一个错误。把它烧到一个复制器并发布一些代码。如果你真的有**不知道从哪里开始,请在[valgrind](http://www.valgrind.org)下运行并修复它抱怨的任何内容。 – 2011-06-05 14:28:00

回答

0

你的代码很明显有一个bug,而你没有提供足够的信息。所以,开始分解你的代码并找出破坏的是什么。检查你传递给你的阻塞函数(select/poll/kqueue/whatever),并确保它是有道理的。如果没有,找出原因。

我希望你会发现你停下来等待一个你应该等待的句柄,但是当然你可能会有一个更有趣的错误。