CategoryResourceRepost/极客时间专栏/从0打造音视频直播系统/WebRTC 1对1通话/13 | 在WebRTC中如何控制传输速率呢?.md
louzefeng d3828a7aee mod
2024-07-11 05:50:32 +00:00

134 lines
12 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<audio id="audio" title="13 | 在WebRTC中如何控制传输速率呢" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/7d/09/7d0ef03b4e281386f928c140ee080309.mp3"></audio>
在上一篇[《12 | RTCPeerConnection音视频实时通讯的核心》](https://time.geekbang.org/column/article/116324)一文中我向你介绍了RTCPeerConnection 对象是如何在端与端之间建立连接的,以及音视频数据又是如何通过它进行传输的。而本文则更进一步,向你介绍如何使用 RTCPeerConnection 来控制音视频数据的传输速率。
通过 RTCPeerConnection 进行传输速率的控制实际上还是蛮简单的一件事儿,但在学习相关知识的时候,你不仅要能知其然,还要知其所以然。对于本文来讲,就是你不但要学习如何控制传输速率,同时还应该清楚为什么要对传输速率进行控制。
其实,之所以要进行传输速率的控制,是因为它会对**音视频服务质量**产生比较大的影响,对于音视频服务质量这部分知识,接下来我就与你一起做详细探讨。
## 在WebRTC处理过程中的位置
在此之前,我们依旧先来看看本文的内容在整个 WebRTC 处理过程中的位置。
<img src="https://static001.geekbang.org/resource/image/0b/c5/0b56e03ae1ba9bf71da6511e8ffe9bc5.png" alt="">
通过上图你可以知道,本文所讲的内容仍然属于**传输**的范畴。
## 音视频服务质量
像上面所说的,虽然通过 RTCPeerConnection 在端与端之间建立连接后,音视频数据可以互通了,但你还应对传输速率有所控制。之所以要对传输速率进行控制,主要是为了提高音视频服务质量。
举个简单的例子,假设你的带宽是 1Mbps你想与你的朋友进行音视频通话使用的视频分辨率为720P帧率是15帧/秒,你觉得你们通话时的音视频质量会好吗?
咱们来简单计算一下根据经验值帧率为15帧/秒、分辨率为720P的视频每秒钟大约要产生1.21.5Mbps的流量。由此可知,你和你朋友在 1M 带宽的网络上进行通话,那通话质量一定会很差。因为你的“马路”就那么宽,却要跑超出它宽度的数据,这样超出带宽的数据会被直接丢弃掉,从而造成大量视频帧无法解码,所以最终效果一定会很差。
由此可知,如果你不对音视频传输速率进行限制的话,它一定会对音视频服务质量产生严重的影响。除了传输速率,还有哪些因素会对音视频质量产生影响呢?下面我从网络质量和数据两个方面列举了一些对音视频服务质量产生影响的因素:
- **网络质量**,包括物理链路的质量、带宽的大小、传输速率的控制等;
- **数据**,包括音视频压缩码率、分辨率大小、帧率等。
以上这些因素都会对音视频的服务质量产生影响。有这么多因素会对音视频服务质量产生影响,那在真实的场景中,你该怎么去区分它们呢?或者说怎么判断服务质量是不是由于传输速率问题引起的呢?
要想判断出是哪些因素引起的音视频服务质量变差,你就必须要知道这些因素的基本原理,下面我们就简要地对这些因素做些介绍。
### 1. 物理链路质量
物理链路质量包括三个方面,即丢包、延迟和抖动。下面我们来看看它们是怎样影响服务质量的吧!
- **丢包**。这个比较好理解,如果物理链路不好,经常出现丢包,这样就会造成接收端无法组包、解码,从而对音视频服务质量产生影响。
- **延迟**。指通信双方在传输数据时数据在物理链路上花费的时间比较长。对于实时通信来说200ms 以内的延迟是最好的这样通话双方的感觉就像是在面对面谈话如果延迟是在500 ms 以内,通话双方的体验也还不错,有点像打电话的感觉;如果延迟达到 800ms还能接受但有明显的迟滞现像但如果延迟超过 1秒那就不是实时通话了
- **抖动**。指的是数据一会儿快、一会儿慢,很不稳定。如果不加处理的话,你看到的视频效果就是一会儿快播了、一会儿又慢动作,给人一种眩晕的感觉,时间长了会非常难受。不过对于 WebRTC来讲它通过内部的 JitterBuffer可以简单地理解为一块缓冲区就能很好地解决该问题。
### 2. 带宽大小
带宽大小指的是每秒钟可以传输多少数据。比如 1M 带宽它表达的是每秒钟可以传输1M个 bit 位,换算成字节就是 1Mbps/8 = 128KBps也就是说 1M 带宽实际每秒钟只能传输 128K个Byte。
当带宽固定的情况下,如何才能让数据传输得更快呢?**答案是充分利用带宽**。这句话有点抽象,它实际的含义是**把带宽尽量占满,但千万别超出带宽的限制**。这里还是以 1M 带宽为例,如果每秒都传输 1M 的数据,这样传输数据的速度才是最快,多了、少了都不行。每秒传输的数据少了,就相当于有 100 辆车,本来每次可以走 10 辆10趟就走完了可你却让它一次走1辆这样肯定慢而每秒传输多了就会发生网络拥塞就像每天上下班堵车一样你说它还能快吗
### 3. 传输速率
在实时通信中,与传输速率相关的有两个码率:音视频压缩码率和传输控制码率。
**音视频压缩码率**指的是单位时间内音视频被压缩后的数据大小,或者你可以简单地理解为压缩后每秒的采样率。它与视频的清晰度是成反比的,也就是**压缩码率越高,清晰度越低**。我们可以做个简单的对比,你应该清楚音视频编码被称为**有损压缩**,所谓的有损压缩就是数据被压缩后,就无法再还原回原来的样子;而与有损压缩对应的是**无损压缩**,它是指数据解压后还能还原回来,像我们日常中用到的 Zip、RAR、GZ等这些压缩文件都是无损压缩。对于有损压缩你设备的压缩码率越高它的损失也就越大解码后的视频与原视频的差别就越大。
**传输码率**是指对网络传输速度的控制。举个例子,假设你发送的每个网络包都是 1500 字节,如果每秒钟发 100个包它的传输码率是多少呢即 100*1.5K = 150K 字节,再换算成带宽的话就是 150KB * 8 = 1.2M。但如果你的带宽是 1M那每秒钟发 100 个包肯定是多了,这个时候就要控制发包的速度,把它控制在 1M 以内,并尽量地接近 1M这样数据传输的速度才是最快的。
当然,如果你的压缩码率本来就很小,比如每秒钟只有 500kbps而你的带宽是 1Mbps那你还有必要对传输码率进行控制吗换句话说一条马路可以一起跑 10辆车但你现在只有 3辆显然你就没必要再控制同时发车的数量了。
### 4. 分辨率与帧率
你应该很清楚,视频的**分辨率**越高视频就越清晰但同时它的数据量也就越大。我们还是来简单计算一下对于1帧未压缩过的视频帧如果它的分辨率是 1280 * 720存储成 RGB 格式,则这一帧的数据为 1280 * 720 * 3 * 83表示 R、G、B 三种颜色8表示将Byte换算成 bit约等于 22Mb而存成 YUV420P 格式则约等于11Mb即1280 * 720 * 1.5 * 8。
按照上面的公式计算,如果你把视频的分辨率降到 640 * 360则这一帧的数据就降到了原来的1/4这个效果还是非常明显的。所以**如果你想降低码率,最直接的办法就是降分辨率**。
当然,对**帧率**的控制也一样可以起到一定的效果。比如原来采集的视频是 30帧/秒,还以分辨率是 1280 * 720 为例之前1帧的数据是 22M那30帧就是 22 * 30=660Mb。但如果改为15 帧/秒,则数据就变成了 330Mb直接减少了一半。
但了解音视频压缩原理的同学应该知道,通过减少帧率来控制码率的效果可能并不明显,因为在传输数据之前是要将原始音视频数据进行压缩的,在同一个 GOPGroup Of Picture除了 I/IDR帧外B 帧和 P帧的数据量是非常小的。因此**减少帧率的方式就没有降低分辨率方式效果明显了**。
到这里我已经向你介绍了在WebRTC实时通信中对音视频质量产生影响的因素有哪些以及这些因素对音视频服务质量产生影响的基本原理了解这些原理会更有利于你判断音视频服务质量变差的原因从而决定是否要使用控制传输速率的方法来解决音视频服务质量的问题。
那接下来我们言归正转,看一下在 WebRTC 中具体该如何控制传输速率。
## 传输速率的控制
通过上面的介绍,我想你现在应该很清楚,**可以通过以下两种方式来控制传输速率**。第一种是通过**压缩码率**这种“曲线救国”的方式进行控制;第二种则是更直接的方式,通过控制**传输速度**来控制速率。
第二种方式虽说很直接,但是也存在一些弊端。假设你有 10M 的数据要发送而传输的速度却被限制为5kbps那它就只能一点一点地传。**需要注意的是由于WebRTC是实时传输当它发现音视频数据的延迟太大且数据又不能及时发出去时它会采用主动丢数据的方法以达到实时传输的要求**。
所以说控制传输速率虽然有两种方式但实际上WebRTC只允许我们使用第一种压缩码率的方式来主动控制速率而第二种方式是它在底层自己控制的为了保障实时性一旦数据无法及时发送出去的话就会进行主动丢包。
了解了上面这些知识之后下面我们就来看看在WebRTC下如何才能控制视频流的码率。具体操作如下面代码所示
```
....
var vsender = null; //定义 video sender 变量
var senders = pc.getSenders(); //从RTCPeerConnection中获得所有的sender
//遍历每个sender
senders.forEach( sender =&gt; {
if(sender &amp;&amp; sender.track.kind === 'video'){ //找到视频的 sender
vsender = sender;
}
});
var parameters = vsender.getParameters(); //取出视频 sender 的参数
if(!parameters.encodings){ //判断参数里是否有encoding域
return;
}
//通过 在encoding中的 maxBitrate 可以限掉传输码率
parameters.encodings[0].maxBitrate = bw * 1000;
//将调整好的码率重新设置回sender中去这样设置的码率就起效果了。
vsender.setParameters(parameters)
.then(()=&gt;{
console.log('Successed to set parameters!');
}).catch(err =&gt; {
console.error(err);
})
...
```
上面的代码中,首先从 RTCPeerConnection中获取视频的发送者即kind为 video的sender然后取出 sender 中的 parameters 对象,其中的 maxBitrate 属性就是用于控制传输码率的将你期望的最大码率设置好后再将parameters 对象设置回去这样WebRTC就可以控制某路流的码率大小了。
通过上面的代码你还可以看出,在 WebRTC 中速率的控制是使用压缩码率的方法来控制的而不是直接通过传输包的多少来控制的。从另外一个角度你也可以得到这样的结论因为maxBitrate属性来自于 sender 的 encoding 对象,而 encoding 对象就是进行编码时使用的参数。
## 小结
通过本文的讲解,你应该可以看出在 WebRTC 中控制传输速率其实是非常简单的事情,只要向 RTCPeerConnection 中的 sender 设置一个最大码率就可以控制某一路流的传输速率了。
另外,在本文中我还向你简要介绍了物理链路的质量、带宽的大小、码率、分辨率和帧率这几个影响音视频服务质量的重要因素,并详细分析了每个因素是如何影响到音视频服务质量的。
这里需要注意的是在WebRTC中通过上述的方式只能对每一路音视频流进行码率的控制而不能进行整体的统一控制。所以如果你的应用同时存在多路音视频流而你又想控制一个总的码率就只能一路一路地控制了。
## 思考时间
实际上在WebRTC中除了通过 sender 的 maxBitrate 控制码率外,还可以通过 SDP 来控制传输速率,你是否可以找到这个方法呢?
欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程。感谢阅读,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给更多的朋友。