關於語音傳送接收方法和裝置發明專利正式釋出

北京時間，6月1日，三星電子申請專利：

《語音傳送方法和裝置以及語音接收方法和裝置、電子裝置》

，正式釋出！

該專利的釋出旨在解決現有技術中，終端傳送和接收語音時進行取樣率轉換的效果較差，無法向用戶提供優質的聽覺體驗。此外，此項專利的核心特點是基於神經網路的語音傳送方法和裝置以及語音接收方法和裝置。

語音傳送/接收方法

一方面，該專利提供一種語音傳送方法，包括利用第一特徵提取網路從輸入的語音訊號中提取低頻特徵資訊，並將所述的低頻特資訊所對應的語音訊號傳送給接收端等。透過上述操作可降低基於AI的降取樣過程中的低頻資訊的損失，同時給語音接收裝置更多的資訊以及在語音接收裝置獲得更好的升取樣效能。

另一方面，提供語音接收方法：將所述語音接收發送端傳送的語音訊號，利用第二特徵提取網路從接收到的語音訊號中提取低頻特徵資訊並回復高頻特徵資訊，輸出包含所述低頻特徵資訊和所述高頻特徵資訊的語音訊號。

語音傳送/接收裝置

在語音傳送裝置方面包括：低頻特徵資訊提取單元，被配置為利用第一特徵提取網路從輸入的語音訊號中提取低頻資訊；以及傳送單元，被配置為將與所述低頻特徵資訊對應的語音訊號傳送給接收端。而在語音接收裝置方面包括：接收單元，被配置為接收所述接收端傳送的語音訊號；高頻特徵資訊恢復單元，被配置為利用第二特徵提取網路從接收到的語音訊號中提取低頻特徵資訊並恢復高頻特徵資訊；輸出單元，被配置為輸出包含所述低頻特徵資訊和所述高頻特徵資訊的語音訊號。

X-net 網路架構

該專利還提出了一種適用於語音通話的聯合 Scale Down 和 Scale Up 的網路架構——X-net，可在語音通話中充分利用裝置上的降取樣的行為來提升語音通話質量。模型的訓練採用兩步訓練方法。另外，Scale Down 和 Scale Up 網路分別部署在傳送端和接收端，以完成語音訊號的降取樣和升取樣（頻寬擴充套件）。

電子裝置

該專利所提供的電子裝置包括儲存器和處理器。儲存器中儲存有計算機程式；處理器用於在執行所述計算機程式時執行所述的語音傳送方法和/或語音接收方法。

講師招募

LiveVideoStackCon 2021 北京站