TCP 粘包、拆包属于网络底层问题,在数据链路层、网络层、传输层都有可能出现。

日常的网络应用开发大多数在传输层出现,而 UDP 是由消息保护边界的,不会发生粘包、拆包问题,只发生在 TCP 协议中。

假设客户端向服务端发送了两个连续的数据包 Packet1、Packet2;

在这个过程中可能会出现 3 种情况:

  • 正常:两个数据包逐一分开发送
  • 粘包:两个包一同发送,
  • 拆包:Server 接收到不完整的或多出一部分的数据包

如下图所示:

tcp

粘包/拆包的原因

发生 TCP 粘包或拆包有很多原因,现列出常见的几点:

  1. 要发送的数据大于 TCP 发送缓冲区剩余空间大小,将会发生拆包。
  2. 待发送数据大于 MSS(最大报文长度),TCP 在传输前将进行拆包。
  3. 要发送的数据小于 TCP 发送缓冲区的大小,TCP 将多次写入缓冲区的数据一次发送出去,将会发生粘包。
  4. 接收数据端的应用层没有及时读取接收缓冲区中的数据,将发生粘包。

粘包、拆包解决办法

TCP 本身是面向流的,作为网络服务器,如何从这源源不断涌来的数据流中拆分出或者合并出有意义的信息呢?通常会有以下一些常用的方法:

  1. 发送端给每个数据包添加包首部,首部中应该至少包含数据包的长度,这样接收端在接收到数据后,通过读取包首部的长度字段,便知道每一个数据包的实际长度了。
  2. 发送端将每个数据包封装为固定长度(不够的可以通过补 0 填充),这样接收端每次从接收缓冲区中读取固定长度的数据就自然而然的把每个数据包拆分开来。
  3. 在数据包之间设置边界,如添加特殊符号,这样,接收端通过这个边界就可以将不同的数据包拆分开。