两台主机通信，如何保证数据不丢失？

计算机网络入门

小白：你知道吗？数据在传输的时候是分割成一小块一小块传输的，我们把这一小块的数据称之为一个分组。我们在传输这块分组的时候，主要面临两个问题。

1、这个分组在传输的过程中，由于在信道传输过程中，收到干扰，导致这个分组到达目的地之后出现了差错，例如分组里面的二进制位1变成了0，0变成了1。

2、分组还没传输到目的地，就丢失了，我们也把这种情况称之为丢包。

接下来我们先来谈谈第一种情况吧，即分组传到目的地之后出现了差错。

情况一：分组出差错时的处理

这里我们先假设计算机A给计算机B发送分组数据

在这里插入图片描述
一禅：如果没有差错的话，计算机B就给计算机A发送一个ACK分组，告诉对方，数据正确无误。如果出现差错的话，就给对方发送一个NAK分组，告诉对方，分组数据出现了差错。

当计算机A收到接受方的反馈之后，如果收到的是ACK分组，那么就继续发送下一个分组数据。如果收到的是NAK分组，那么就重新传输这个分组。

在这里插入图片描述

小白：这时就会出现了混乱，就相当于两个人A,B在对话。

A : 传输给你一个分组

B :你发的是啥，可以重发一次吗？

A :你发的又是啥？可以重发一次吗？

B :你发的又是啥？可以重发一次吗

……

进去无限混乱之中
在这里插入图片描述

小白：法子倒是不错，不过如果分组出现大量差错，会让校验码变的很难设计的,而且校验码属于与正文内容无关的数据，占了太多比特位的话，会降低传输效率。还有其他法子吗？

小白：我们可以给每个分组添加一个序号啊，这样就可以知道是重传的分组还是新的分组了。

如果B收到的分组没出差错，这时又收到一个序号相同的分组，这时B就知道这个分组是属于重传的分组了，这时B就把这个重传的分组丢弃。
在这里插入图片描述

情况二：分组丢失时的问题处理

在这里插入图片描述
一禅：哈哈，我知道怎么解决，可以采取和分组差错类似的方法，如果A迟迟没有收到B的反馈，A就可以认为这个分组丢失了，重新发送。

所以我们每次发送分组的时候，需要给该分组设置一个定时器
在这里插入图片描述
小白：脑子转的挺快啊。不过你知道吗？我们上面谈的那些，都是A发送一个分组，收到B的反馈之后，再发送下一个分组。你不觉得这种方法很浪费信道的资源吗？

这里先说明一下，如果同时发送多个分组时，最需要处理的问题就是接受方收到分组时，并非按照顺序收到分组的，有可能序号小的分组先达到，这时就会出现了乱序。

回退N步协议(GBN)

在回退N步法中允许发送多个分组而不需要等待确认，但它也受限于在流水线中未确认的分组数不能超过某个最大允许数N。如下图，我们将基序号定义为最早的未确认分组的序号，将下一个序号(nextseqnum)定义为最小的未使用序号(即下一个待发送分组)。

在这里插入图片描述
此时我们可以将序号分成4段。在[0, base-1]段内的序号对应已发送并且已经确认的分组序号，[base,nextseqnum]段内对应已经发送但未确认的分组序号，[nextseqnum, base+N-1]段内表示即将要被发送的分组序号。而那些大于base+N的序号目前还不能使用，直到当前流水线中未被确认的分组得到确认，窗口整体向右移动之后，才能够被使用。

所以，我们常把N称之为窗口长度，由于窗口在序号范围内移动，也被GBN协议称之为滑动窗口协议。

对于GBN协议，计算机A(发送方)需要响应以下两个事件：
1、收到一个ACK：在GBN协议中，对序号为n的分组的确认采取累计确认的方式。也就是说，当A收到序号为n的分组时，表明分组n以及n之前的分组已经被B正确接受了。

2、超时事件：当久久没有收到ACK时，A就认为它发送的分组已经丢失了，这时A会重传所有已发送但还未被确认的分组。这个时候需要注意的是，并不是为每个分组设置一个定时器，而是在序号[base,nextseqnum-1]中，设置一个定时器，当base发送的那一刻，就开始计时，当收到一个ACK时，则刷新重新开始计时。

计算机B(接收方)则需要处理一下事件：

如果一个序号为n的分组被正确收到，并且按序(所谓按序就是指n-1的分组也已经收到了)，则B为分组n发送一个ACK，否则，丢弃该分组，并且为最近按序接收的分组重新发送ACK。

接收方的这种处理方式，意味着如果n被正确交付，则意味着比n小的所有分组也被正确交付了。
在这里插入图片描述

小白：你这个想法其实也是挺不错的，不过如果分组n-1丢失了，那么按照GBN的重传规则，这时n-1和n都会被重传，这时之前缓存的n就没啥用了。而且，我们如果把n丢弃了，那么我们就不需要缓存任何失序的分组了，这样可以让我们的设计更加简单哦。