omniture

七牛云發(fā)布直播云解決方案 處理環(huán)節(jié)技術詳解

2016-08-26 19:49 9751
七牛云于 6 月底發(fā)布了一個針對視頻直播的實時流網絡 LiveNet 和完整的直播云解決方案,很多開發(fā)者對這個網絡和解決方案的細節(jié)和使用場景非常感興趣。

北京2016年8月26日電 /美通社/ -- 隨著互聯網用戶消費內容和交互方式的升級,支撐這些內容和交互方式的基礎設施也正在悄悄發(fā)生變革。手機設備拍攝視頻能力和網絡的升級催生了大家對視頻直播領域的關注,吸引了很多互聯網創(chuàng)業(yè)者或者成熟企業(yè)進入該領域。

七牛云于 6 月底發(fā)布了一個針對視頻直播的實時流網絡 LiveNet 和完整的直播云解決方案,很多開發(fā)者對這個網絡和解決方案的細節(jié)和使用場景非常感興趣。

結合七牛實時流網絡 LiveNet 和直播云解決方案的實踐,我們將用七篇文章,更系統化地介紹當下大熱的視頻直播各環(huán)節(jié)的關鍵技術,幫助視頻直播創(chuàng)業(yè)者們更全面、深入地了解視頻直播技術,更好地技術選型。本篇我們將詳解處理環(huán)節(jié)的技術問題,比如常見視頻處理功能如美顏、視頻水印、濾鏡、連麥等等。

視頻或者音頻完成采集之后得到原始數據,為了增強一些現場效果或者加上一些額外的效果,我們一般會在將其編碼壓縮前進行處理,比如打上時間戳或者公司 Logo 的水印,祛斑美顏和聲音混淆等處理。在主播和觀眾連麥場景中,主播需要和某個或者多個觀眾進行對話,并將對話結果實時分享給其他所有觀眾,連麥的處理也有部分工作在推流端完成。

一、開放式設計 

處理圖解
處理圖解

如上圖所示,處理環(huán)節(jié)中分為音頻和視頻處理,音頻處理中具體包含混音、降噪和聲音特效等處理,視頻處理中包含美顏、水印、以及各種自定義濾鏡等處理。對于七牛這樣的直播云服務來說,為了滿足所有客戶的需求,除了要提供這些標準處理功能之外,我們還需要將該模塊設計成可自由接入自定義處理功能的方式。

二、常見視頻處理功能

1. 美顏 

都說80% 的主播沒有美顏根本沒法看,美顏是直播產品中最常見的功能之一。最近準備在香港上市的美圖公司的主打產品就是美顏相機和美拍,有媒體戲稱其會沖擊化妝品行業(yè),其實就是美顏的效果的功勞,讓美女主播們不化妝也可以自信的直播,而美顏相機的用戶則可以拍出更好的自己。

美顏的主要原理是通過“磨皮+美白”來達到整體美顏的效果。磨皮的技術術語是去噪,也即對圖像中的噪點進行去除或者模糊化處理,常見的去噪算法有均值模糊、高斯模糊和中值濾波等。當然, 由于臉部的每個部位不盡相同,臉上的雀斑可能呈現出眼睛黑點的樣子,對整張圖像進行“去噪”處理的時候不需要將眼睛也去掉,因此這個環(huán)節(jié)中也涉及到人臉和皮膚檢測技術。

七牛直播云提供的 iOS 和 Android 推流 SDK 中內置了美顏功能,可以根據自己的需要選擇開關美顏功能,并且能夠自由調節(jié)包括美顏,美白,紅潤等在內的參數。其中 iOS 端 SDK PLCameraStreamingKit 的參數設置如下:

1)按照默認參數開啟或關閉美顏:

-(void)setBeautifyModeOn:(BOOL)beautifyModeOn;

2)設置美顏程度,范圍為 0 ~ 1:

-(void)setBeautify:(CGFloat)beautify;

3)設置美白程度,范圍為 0 ~ 1

-(void)setWhiten:(CGFloat)whiten;

4)設置紅潤程度,范圍為 0 ~ 1

-(void)setRedden:(CGFloat)redden;

2. 視頻水印 

水印是圖片和視頻內容中常見的功能之一,它可用于簡單是版權保護,或者進行廣告設置。處于監(jiān)管的需求,國家相關部門也規(guī)定視頻直播過程中必須打上水印,同時直播的視頻必須錄制存儲下來保存一定的時間,并在錄制的視頻上打上水印。

視頻水印包括播放器水印和視頻內嵌水印兩種方式可供選擇,對于播放器水印來說,如果沒有有效的防盜措施,對于沒有播放鑒權的推流,客戶端拿到直播流之后可以在任何一個不帶水印的播放器里面播放,因此也就失去了視頻保護的能力。綜合考慮云端錄制對于水印的需求,我們一般會選擇“視頻內嵌水印”的方式打水印。

七牛直播云提供的 iOS 和 Android 推流 SDK 中也內置了水印功能,可以根據自己的需要添加水印或移除水印,并且能夠自由設置水印的大小和位置。其中 iOS 端 SDK PLCameraStreamingKit 的參數設置如下:

1)添加水印

-(void)setWaterMarkWithImage:(UIImage *)wateMarkImage position:(CGPoint)position; 

該方法將為直播流添加一個水印,水印的大小由 wateMarkImage 的大小決定,位置由 position 決定,需要注意的是這些值都是以采集數據的像素點為單位的。例如我們使用AVCaptureSessionPreset1280x720 進行采集,同時 wateMarkImage.size 為 (100, 100) 對應的origin 為 (200, 300),那么水印的位置將在大小為 1280x720 的采集畫幅中位于 (200, 300) 的位置,大小為 (100, 100)。

2)移除水印

-(void)clearWaterMark;

3. 濾鏡 

除了上面提到的美顏和水印之外,視頻中還有很多其它的處理效果也在這個環(huán)節(jié)完成。七牛直播云提供的 SDK 在開放性設計基礎之上,通過數據源回調接口,可以支持各種自定義濾鏡的接入。

為了實現豐富的濾鏡效果,在 iOS 端可以考慮使用 GPUImage 這個庫,這是一個開源的基于GPU的圖片或視頻的處理框架,內置了多達120多種常見的濾鏡效果。有了它,添加實時的濾鏡只需要簡單地添加幾行代碼,還可以基于這個庫自己寫算法實現更豐富端效果。GPUImage 地址:https://github.com/BradLarson/GPUImage

除了 iOS 端之外,Android 也有 GPUImage 這個庫的移植:https://github.com/CyberAgent/android-gpuimage

同時,Google 官方也開源了一個偉大的庫,覆蓋了 Android 上面很多多媒體和圖形圖像相關的處理:https://github.com/google/grafika

4. 連麥

處理圖解
處理圖解

連麥是互動直播中常見的需求,其流程如上圖所示。主播和部分觀眾之間可以進行實時互動,然后將互動結果實時播放給其他觀眾觀看。基于以上業(yè)務需求,我們很容易想到基于單向直播原理,在主播端和連麥觀眾端進行雙向推流和雙向播流的方式互動,然后在服務端將兩路推流合成一路推送給其他觀眾。但 RTMP 帶來的延遲決定了這種方式無法做到用戶可接受的互動直播。實際上,互動直播的主要技術難點在于:

1)低延遲互動:保證主播和互動觀眾之間能夠實時互動,兩者之間就像電話溝通,因此必須保證兩者能在秒級以內聽到對方的聲音,看到對方的視頻;

2)音畫同步:互動直播中對音畫同步的需求和單向直播中類似,只不過互動直播中的延遲要求更高,必須保證在音視頻秒級傳輸情況下的秒級同步。

3)音視頻實時合成:其他觀眾需要實時觀看到對話結果,因此需要在客戶端或者服務端將畫面和聲音實時合成,然后以低成本高品質的方式傳輸觀眾端。

在視頻和電話會議領域,目前比較成熟的方案是使用思科或者 WebEx 的方案,但這些商用的方案一不開源,二比較封閉,三成本比較高。對于互動人數比較少的互動直播,目前市場上比較成熟的方案是使用基于 WebRTC 的實時通訊方案。

處理圖解
處理圖解

上圖是一個基于 WebRTC 協議實現多方實時通訊的示意圖,本地用戶(主播)和遠程用戶(連麥觀眾)之間的連接通過 RTCPeerConnection API 管理,這個 API 包裝了底層流管理和信令控制相關的細節(jié)?;谠摲桨缚梢暂p松實現多人(14 人以下)的多方實時通信。

當然,在通信人數少的情況下,其復雜度相對簡單,如 2 人情況下。但人數增多至 4 人之后,其可選的網絡結構就增多了,可以每個點之間形成自組織網絡的方式通信,也可以以 1 人為中心形成星型通信網絡,還可以讓大家都通過一個集中式的服務端進行通信。

作為一個高性能、可伸縮的直播基礎服務提供商,七牛直播云經過評估選擇了以主播為中心形成星形通信網絡,支持主播和多個觀眾之間的互動質量。同時,為了保證合成后的音視頻實時傳輸到其他觀眾端,這里采用經過改造的 UDP 協議傳輸:

1. 通過 UDP 降低傳輸延遲。

2. 在 UDP 之上進行傳輸控制,保證用戶互動體驗 QoS。

在下一篇連載中,將詳細介紹編碼和封裝,敬請期待。

為了讓大家能夠將技術理論快速應用到實踐開發(fā)中,七牛云聯合慕課網特別制作了一期課程,專門針對移動直播應用開發(fā),供大家學習參考:http://www.imooc.com/learn/707

消息來源:七牛云
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯網、科技、媒體、通訊企業(yè)的經營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection