Unix网络编程学习笔记之基于TCP套接字编程-tcp网络编程

1. socket函数

int socket(int family, int type,int protocol)

成返回一个套接字描述符。错误返回-1

其中family指定协议族，一般IPv4为AF_INET, IPv6为AF_INET6。

其中type指定套接字类型，字节流：SOCK_STREAM. 数据报：SOCK_DGRAM。

一般情况下通过family和type的组合都可以唯一确定一个套接字类型。所以一般我们就把protocol设为0就可以了。

有时在某些特殊情况下，family和type的组合不是都是有效的，这时我们就要给protocol指定一些特殊的值了。

2. connect函数

int connect(int sockfd, const struct sockaddr * servaddr, socklen_t addrlen);

连接服务器，其中servaddr是服务器的地址。

如果是TCP套接字，connect会触发三次握手。

从前文可以知道，当客户端接收到服务器端的对SYN的响应的时候，connect函数就返回，若客户端发送的SYN出错，或者响应的ACK出错都会引起connect函数出错。成功返回0，出错返回-1且errno被设置。

注意：如果connect出错，不能直接重新connect。必须要先关闭这个套接字，然后重新socket-connect。

3. bind函数

int bind(int sockfd, const struct sockaddr* servaddr, socklen_t addrlen)

成功返回0，错误返回-1

为指定的套接字绑定一个本地的套接字地址。

(1) 一般服务器端需要绑定一个公开的端口号，而服务器端一般绑定Ip时是INADDR_ANY，意为当accept时，内核会从本地IP地址中选择一个本地IP赋值。这对于一台机器上有多个网络接口时，是很有影响的。

而通常机器只有一个网络接口，则我们也使用这种方式，是因为我们不必要写服务器本地的IP(硬编码)，这样写使得我们的程序有好的移植性。

(2) 一般客户端socket函数之后就直接connect了，不进行bind，因为我们通常不需指定客户端的Ip和端口号。让内核自动赋值就可以了。

(3) IPv4中的INADDR_ANY通常为0，所以我们为其赋值时，是使用如下格式：

servaddr.sin_addr.s_addr=htonl(INADDR_ANY);

因为sin_addr是一个结构体，所以我们使用sin_addr.s_addr来使用其整数形式赋值。

4. listen函数

int listen(int sockfd, intbacklog)

成功返回0，错误返回-1

注意这里的listen并不是我们通常理解的监听的意思，因为套接字不是在这里阻塞的，而是在accept阻塞的。

Listen只做两件事：

(1) 把socket函数创建的套接字，设为被动套接字。因为socket函数默认创建主动套接字，主动套接字：是需要connect去主动连接的。

(2) 规定了内核应该为连接套接字排队的***个数。

内核是如何进行连接排队的?

内核维护两个队列，未完成连接队列，已完成连接队列。

未完成连接队列：客户SYN到达后，就被放入未完成连接队列队尾。

已完成连接队列：客户完成了三次握手之后，就把它放入已完成队列队尾。

然后进程调用accept，就从已完成队列队首项返回给进程。

这里的疑问?服务器端不是一直在accept阻塞吗，怎么这里还提到进程调用accept这个说法?

因为这里的情况是在多个客户端几乎同时达到连接时，其中某一个连接发生的情况，因为我们写服务器端程序时，都是把accept写在一个循环内的，所以某个客户的SYN到达，可能这时并没有执行到accept，所以这里说等到进程调用accept时。也就是说，系统在已完成连接队列为空时，accept才会阻塞。

注意这里所说的backlog是两个队列之和，但实际情况下，一般内核允许排队的个数都要略大于这个值。

5. accept函数

int accept(int sockfd, struct sockaddr* cliaddr , socklen_t* addrlen)

成功返回描述符，错误返回-1

接受客户连接，如果已完成连接队列中有数据，则读取队头，返回一个已连接套接字描述符。如果已完成连接队列为空，则阻塞。

成功返回返回一个已连接套接字描述符，失败返回负值。

注意：第三个参数为整型的地址。因为accept函数是从内核得到的套接字。如果程序对客户端的套接字地址不感兴趣，则可以把后面两个参数都设为NULL。

一个服务器通常只有一个监听套接字，而为每个客户创建一个已连接套接字。

6. getsockname和getpeername

int getsockname(int sockfd, struct sockaddr* addr, socklen_t* addrlen)

返回和套接字描述符sockfd关联的本地套接字地址

int getpeername(int sockfd, struct sockaddr* addr, socklen_t* addrlen)

返回和套接字描述符sockfd关联的对端套接字地址

显然这两个函数都是从内核中得到套接字地址，所以第三个参数是整型的地址。

注意：

(1) 一般客户端没有bind，所以在connect之后，才可以调用getsockname/getpeername。

(2) 一般服务器端bind端口之后，可以调用getsockname获取端口号。

一般服务器端bind的是通配地址，所以一般不可以获取监听套接字描述符的关联ip地址，而是获取已连接套接字描述符关联的ip地址。

(3) POSIX允许对未bind的套接字调用getsockname，所以该函数适合任何已打开的套接字描述符(即调用socket函数返回的套接字描述符都叫已打开的套接字描述符)，只是不一定输出的是什么。

插入知识：

1. socket这几个函数都是一样的，成功返回0/描述符，失败返回-1。所以它们判断成功的条件都是一样的。

2. RST分组，RST分组是TCP在发生错误时发送的一种TCP分组。

产生RST的条件：

(1) 一个目的地为某端口的SYN到达，然后本机没有正在监听该端口的程序，此时本机就发送一个RST。

(2) TCP想要取消一个连接。

(3) TCP接受到一个不存在的连接的分组。即某个客户端没有连接，就往服务器发送数据，这时服务器就会给这个客户端发送RST。

其实RST的意思就是让对方重新连接的意思。