根据数据传输方式的不同,基于网络协议的套接字一般分为TCP套接字和UDP套接字。
因为TCP套接字是面向连接的,因此又称基于流(stream)的套接字。TCP 是 Transmission Control Protocol(传输控制协议)的简写,意为“对数据传输过程的控制”。
下图给出了TCP服务器端默认的函数调用顺序,绝大部分TCP服务器端都按照该顺序调用。
调用 socket 函数创建套接字,声明并初始化地址信息结构体变量;调用 bind 函数向套接字分配地址。这 222 个阶段之前都已讨论过,下面讲解之后的几个过程。
我们已调用 bind 函数给套接字分配了地址,接下来就要通过调用 listen 函数进入等待连接请求状态。只有调用了 listen 函数,客户端才能进入可发出连接请求的状态。换言之,这时客户端才能调用 connect 函数(若提前调用将发生错误)。
#include int listen(int sockfd, int backlog);// 成功时返回0,失败时返回-1
// sockfd:希望进入等待连接请求状态的套接字文件描述符,传递的描述符套接字参数称为服务器端套接字(监听套接字)
// backlog:连接请求等待队列的长度,若为5,则队列长度为5,表示最多使5个连接请求进入队列
“服务器端处于等待连接请求状态”是指,客户端请求连接时,受理连接前一直使请求处于等待状态。下图给出了这个过程。
由上图可知作为 listen 函数的第一个参数传递的文件描述符套接字的用途。客户端连接请求本身也是从网络中接收到的一种数据,而要想接收就需要套接字。此任务就由服务器端套接字完成。服务器端套接字是接收连接请求的一名门卫或一扇门。
客户端如果向服务器端询问:“请问我是否可以发起连接?”服务器端套接字就会亲切应答:“您好!当然可以,但系统正忙,请到等候室排号等待,准备好后会立即受理您的连接。”同时将连接请求请到等候室。调用 listen 函数即可生成这种门卫(服务器端套接字),listen 函数的第二个参数决定了等候室的大小。等候室称为连接请求等待队列,准备好服务器端套接字和连接请求等待队列后,这种可接收连接请求的状态称为等待连接请求状态。
listen 函数的第二个参数值与服务器端的特性有关,像频繁接收请求的 Web 服务器端至少应为 151515。另外,连接请求队列的大小始终根据实验结果而定。
调用 listen 函数后,若有新的连接请求,则应按序受理。受理请求意味着进入可接受数据的状态。也许各位已经猜到进入这种状态所需部件,当然是套接字!大家可能认为可以使用服务器端套接字,但服务器端套接字是做门卫的。如果在与客户端的数据交换中使用门卫,那谁来守门呢?因此需要另外一个套接字,但没必要亲自创建。accept 函数将自动创建套接字,并连接到发起请求的客户端。
#include int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);// 成功时返回创建的套接字文件描述符,失败时返回-1
// sockfd:服务器端套接字的文件描述符
// addr:保存发起连接请求的客户端地址信息的变量地址值,调用函数后向传递来的地址变量参数填充客户端地址信息
// addrlen:第二个参数addr结构体的长度,但是存有长度的变量地址。函数调用完成后,该变量即被填入客户端地址长度
accept 函数受理连接请求等待队列中待处理的客户端连接请求。函数调用成功时,accept 函数内部将产生用于数据 I/O 的套接字,并返回其文件描述符。需要强调的是,套接字是自动创建的,并自动与发起连接请求的客户端建立连接。下图展示了 accept 函数调用过程。
上图展示了“从等待队列中取出 111 个连接请求,创建套接字并完成连接请求”的过程。服务器端单独创建的套接字与客户端建立连接后进行数据交换。
下面分析之前未理解透的 HelloWorld 服务器端程序代码 hello_server.c。
#include
#include
#include
#include
#include
#include void error_handling(char *message);int main(int argc, char *argv[])
{int serv_sock;int clnt_sock;struct sockaddr_in serv_addr;struct sockaddr_in clnt_addr;socklen_t clnt_addr_size;char message[] = "Hello World!";if (argc != 2){printf("Usage : %s \n", argv[0]);exit(1);}// 服务器端实现过程中先要创建套接字。第28行创建套接字,但此时的套接字尚非真正的服务器端套接字。serv_sock = socket(PF_INET, SOCK_STREAM, 0);if (serv_sock == -1){error_handling("socket() error");}// 为了完成套接字地址分配,初始化结构体变量并调用bind函数。memset(&serv_addr, 0, sizeof(serv_addr));serv_addr.sin_family = AF_INET;serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);serv_addr.sin_port = htons(atoi(argv[1]));if (bind(serv_sock, (struct sockaddr*) &serv_addr, sizeof(serv_addr)) == -1){error_handling("bind() error");}// 调用listen函数进入等待连接请求状态。连接请求等待队列的长度设置为5。此时的套接字才是服务器端套接字。if (listen(serv_sock, 5) == -1){error_handling("listen() error");}clnt_addr_size = sizeof(clnt_addr);// 调用accept函数从队头取1个连接请求与客户端建立连接,并返回创建的套接字文件描述符。// 另外,调用accept函数时若等待队列为空,则accept函数不会返回,直到队列中出现新的客户端连接。clnt_sock = accept(serv_sock, (struct sockaddr*) &clnt_addr, &clnt_addr_size);if (clnt_sock == -1){error_handling("accept() error");}// 调用write函数向客户端传输数据,调用close函数关闭连接。write(clnt_sock, message, sizeof(message));close(clnt_sock);close(serv_sock);return 0;
}void error_handling(char *message)
{fputs(message, stderr);fputc('\n', stderr);exit(1);
}
接下来讲解客户端的实现顺序,这要比服务器端简单许多。因为创建套接字和请求连接就是客户端的全部内容,如下图所示。
与服务器端相比,区别就在于“请求连接”,它是创建客户端套接字后向服务器端发起的连接请求。服务器端调用 listen 函数后创建连接请求等待队列,之后客户端即可请求连接。那如何发起连接请求呢?通过调用 connect 函数完成。
#include int connect(int sockfd, struct sockaddr *servaddr, socklen_t addrlen);// 成功时返回0,失败时返回-1
// sockfd:客户端套接字文件描述符
// servaddr:保存目标服务器端地址信息的变量地址值
// addrlen:以字节为单位传递已传递给第二个结构体参数servaddr的地址变量长度
客户端调用 connect 函数后,发生以下情况之一才会返回(完成函数调用):
需要注意,所谓的“接收连接”并不意味着服务器端调用 accept 函数,其实是服务器端把连接请求信息记录到等待队列。因此 connect 函数返回后并不立即进行数据交换。
问:客户端套接字地址信息在哪?
实现服务器端必经过程之一就是给套接字分配IP和端口号。但客户端实现过程中并未出现套接字地址分配,而是创建套接字后立即调用 connect 函数。难道客户端套接字无需分配IP和端口?
当然不是!网络数据交换必须分配IP和端口。
既然如此,那客户端套接字何时、何地、如何分配地址呢?
客户端的IP地址和端口在调用 connect 函数时自动分配,无需调用标记的 bind 函数进行分配。
下面分析之前未理解透的 HelloWorld 客户端程序代码 hello_client.c。
#include
#include
#include
#include
#include
#include void error_handling(char *message);int main(int argc, char* argv[])
{int sock;struct sockaddr_in serv_addr;char message[30];int str_len;if (argc != 3){printf("Usage : %s \n", argv[0]);exit(1);}// 创建准备连接服务器端的套接字,此时创建的是TCP套接字。sock = socket(PF_INET, SOCK_STREAM, 0);if (sock == -1){error_handling("socket() error");}// 结构体变量serv_addr中初始化IP和端口信息。初始化值为目标服务器端套接字的IP和端口信息。memset(&serv_addr, 0, sizeof(serv_addr));serv_addr.sin_family = AF_INET;serv_addr.sin_addr.s_addr = inet_addr(argv[1]);serv_addr.sin_port = htons(atoi(argv[2]));// 调用connect函数向服务器端发送连接请求if (connect(sock, (struct sockaddr*) &serv_addr, sizeof(serv_addr)) == -1){error_handling("connect() error!");}// 完成连接后,接收服务器端传输的数据str_len = read(sock, message, sizeof(message) - 1);if (str_len == -1){error_handling("read() error!");}printf("Message from server: %s\n", message);// 接收数据后调用close函数关闭套接字,结束与服务器端的连接close(sock);return 0;
}void error_handling(char *message)
{fputs(message, stderr);fputc('\n', stderr);exit(1);
}
前面讲解了TCP服务器端和客户端的实现顺序,实际上二者并非相互独立,它们之间的交互过程如下图所示。
上图的总体流程整理如下:服务器端创建套接字后连续调用 bind、listen 函数进入等待状态,客户端通过调用 connect 函数发起连接请求。需要注意的是,客户端只能等到服务器端调用 listen 函数后才能调 connect 函数。同时要清楚,客户端调用 connect 函数前,服务器端有可能率先调用 accept 函数。当然,此时服务器端在调用 accept 函数时进入阻塞(blocking)状态,直到客户端调 connect 函数为止。