Unix网络编程学习笔记之基于TCP套接字编程

网络 通信技术
基于TCP套接字,6种函数的介绍和使用方法以及部分扩充知识。

 1. socket函数

int socket(int family, int type,int protocol) 

成返回一个套接字描述符。错误返回-1

其中family指定协议族,一般IPv4为AF_INET, IPv6为AF_INET6。

其中type指定套接字类型,字节流:SOCK_STREAM. 数据报:SOCK_DGRAM。

一般情况下通过family和type的组合都可以唯一确定一个套接字类型。所以一般我们就把protocol设为0就可以了。

有时在某些特殊情况下,family和type的组合不是都是有效的,这时我们就要给protocol指定一些特殊的值了。

2. connect函数

int connect(int sockfd, const struct sockaddr * servaddr, socklen_t addrlen); 

连接服务器,其中servaddr是服务器的地址。

如果是TCP套接字,connect会触发三次握手。

从前文可以知道,当客户端接收到服务器端的对SYN的响应的时候,connect函数就返回,若客户端发送的SYN出错,或者响应的ACK出错都会引起connect函数出错。成功返回0,出错返回-1且errno被设置。

注意:如果connect出错,不能直接重新connect。必须要先关闭这个套接字,然后重新socket-connect。

3. bind函数

int bind(int sockfd, const struct sockaddr* servaddr, socklen_t addrlen)  

成功返回0,错误返回-1

为指定的套接字绑定一个本地的套接字地址。

(1) 一般服务器端需要绑定一个公开的端口号,而服务器端一般绑定Ip时是INADDR_ANY,意为当accept时,内核会从本地IP地址中选择一个本地IP赋值。这对于一台机器上有多个网络接口时,是很有影响的。

而通常机器只有一个网络接口,则我们也使用这种方式,是因为我们不必要写服务器本地的IP(硬编码),这样写使得我们的程序有好的移植性。

(2) 一般客户端socket函数之后就直接connect了,不进行bind,因为我们通常不需指定客户端的Ip和端口号。让内核自动赋值就可以了。

(3) IPv4中的INADDR_ANY通常为0,所以我们为其赋值时,是使用如下格式:

servaddr.sin_addr.s_addr=htonl(INADDR_ANY);

因为sin_addr是一个结构体,所以我们使用sin_addr.s_addr来使用其整数形式赋值。

4. listen函数

int listen(int sockfd, intbacklog)

成功返回0,错误返回-1

注意这里的listen并不是我们通常理解的监听的意思,因为套接字不是在这里阻塞的,而是在accept阻塞的。

Listen只做两件事:

(1) 把socket函数创建的套接字,设为被动套接字。因为socket函数默认创建主动套接字,主动套接字:是需要connect去主动连接的。

(2) 规定了内核应该为连接套接字排队的***个数。

内核是如何进行连接排队的?

 

 Unix网络编程学习笔记 基于TCP套接字编程

内核维护两个队列,未完成连接队列,已完成连接队列。

未完成连接队列:客户SYN到达后,就被放入未完成连接队列队尾。

已完成连接队列:客户完成了三次握手之后,就把它放入已完成队列队尾。

然后进程调用accept,就从已完成队列队首项返回给进程。

这里的疑问?服务器端不是一直在accept阻塞吗,怎么这里还提到进程调用accept这个说法?

因为这里的情况是在多个客户端几乎同时达到连接时,其中某一个连接发生的情况,因为我们写服务器端程序时,都是把accept写在一个循环内的,所以某个客户的SYN到达,可能这时并没有执行到accept,所以这里说等到进程调用accept时。也就是说,系统在已完成连接队列为空时,accept才会阻塞。

注意这里所说的backlog是两个队列之和,但实际情况下,一般内核允许排队的个数都要略大于这个值。

5. accept函数

int accept(int sockfd, struct sockaddr* cliaddr , socklen_t* addrlen)

成功返回描述符,错误返回-1

接受客户连接,如果已完成连接队列中有数据,则读取队头,返回一个已连接套接字描述符。如果已完成连接队列为空,则阻塞。

成功返回返回一个已连接套接字描述符,失败返回负值。

注意:第三个参数为整型的地址。因为accept函数是从内核得到的套接字。如果程序对客户端的套接字地址不感兴趣,则可以把后面两个参数都设为NULL。

一个服务器通常只有一个监听套接字,而为每个客户创建一个已连接套接字。

6. getsockname和getpeername

int getsockname(int sockfd, struct sockaddr* addr, socklen_t* addrlen)

返回和套接字描述符sockfd关联的本地套接字地址

int getpeername(int sockfd, struct sockaddr* addr, socklen_t* addrlen)  

返回和套接字描述符sockfd关联的对端套接字地址

显然这两个函数都是从内核中得到套接字地址,所以第三个参数是整型的地址。

注意:

(1) 一般客户端没有bind,所以在connect之后,才可以调用getsockname/getpeername。

(2) 一般服务器端bind端口之后,可以调用getsockname获取端口号。

一般服务器端bind的是通配地址,所以一般不可以获取监听套接字描述符的关联ip地址,而是获取已连接套接字描述符关联的ip地址。

(3) POSIX允许对未bind的套接字调用getsockname,所以该函数适合任何已打开的套接字描述符(即调用socket函数返回的套接字描述符都叫已打开的套接字描述符),只是不一定输出的是什么。

插入知识:

1. socket这几个函数都是一样的,成功返回0/描述符,失败返回-1。所以它们判断成功的条件都是一样的。

2. RST分组,RST分组是TCP在发生错误时发送的一种TCP分组。

产生RST的条件:

(1) 一个目的地为某端口的SYN到达,然后本机没有正在监听该端口的程序,此时本机就发送一个RST。

(2) TCP想要取消一个连接。

(3) TCP接受到一个不存在的连接的分组。即某个客户端没有连接,就往服务器发送数据,这时服务器就会给这个客户端发送RST。

其实RST的意思就是让对方重新连接的意思。

责任编辑:何妍 来源: CSDN博客
相关推荐

2014-12-11 09:20:30

TCP

2012-01-06 13:58:47

JavaTCP

2015-03-31 11:24:02

2015-10-16 09:33:26

TCPIP网络协议

2014-12-17 09:22:10

网络·安全技术周刊

2021-02-05 15:20:06

网络安全套接字命令

2021-03-14 18:22:23

套接字网络通信

2014-12-15 09:28:54

UDP

2009-03-10 13:59:41

C#套接字编程

2024-01-23 09:07:29

Unix哲学工具

2015-04-24 09:48:59

TCPsocketsocket编程

2012-09-24 15:13:50

C#网络协议TCP

2019-02-12 15:04:09

2019-09-18 20:07:06

AndroidTCP协议

2020-10-15 19:10:05

LinuxAPI函数

2013-12-27 13:39:23

Java套接字

2011-06-10 12:44:09

2024-08-13 08:27:24

PythonTCP协议网络编程

2010-07-19 16:47:54

Perl

2015-10-21 10:24:05

TCPIP网络协议
点赞
收藏

51CTO技术栈公众号