語音

1/4ページ

Voice Conversion 專案筆記(含從VCC 2016匿名比賽深挖的各前沿方法效能對比)

voice conversion 基本架構: voice conversion 任務主要由兩個步驟構成,特徵提取與特徵引數轉換,對於這兩個步驟,都有相應的常用的技術,這兩個步驟中常用的技術各種排列組合,就產生了眾多VC系統,以下做小彙總。 STEP1:Feature extraction     S […]

貝葉斯公式的理解

作者:知乎使用者 連結:https://www.zhihu.com/question/21134457/answer/169523403來源:知乎著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。 最近我自己在學習一些關於機器學習的東西,目前學到了貝葉斯統計這一塊,我覺得很感興趣, […]

語音訊號中的特徵提取

一.語音的產生簡介 1.1   發音器官     人體的語音是由人體的發音器官在大腦的控制下做生理運動產生的。人體發音器官由三部分組成:肺和氣管、喉、聲道。 肺是語音產生的能源所在。氣管連線著肺和喉,是肺與聲道的聯絡通道。喉是由一個軟骨和肌肉組成的複雜系統,其中包含著重要的發音器官——聲帶。聲帶為產 […]

純軟的SIP語音伺服器API

以前的語音伺服器如呼叫中心、IVR等應用,一般是用語音板卡完成,如三匯和東進的數字卡,模擬卡。如今軟交換是趨勢,有的運營商甚至可以提供基於IMS的sip中繼,再使用語音卡就不合適了。純軟的語音系統,部署起來也簡單,只要弄一臺普通的PC或伺服器就可以,錄音也存放在該機器上。 我們自己開發的SIP協議棧 […]

SIP伺服器提供REST格式的API並新增分段錄音

底層的API要用較為複雜的狀態機,開發起來有一定難度。REST即Http Json方式,相對容易整合。 新增分段錄音,即在錄音時進行VAD(活動語音檢測),檢測到開始說話,上報一個訊息,說話中檢測到足夠長的停頓,再上報一個訊息,並另起一個新錄音檔案。 分段錄音應用於智慧互動(AI),偵聽到說話可打斷 […]

Python如何實現文字轉語音

準備 我測試使用的Python版本為2.7.10,如果你的版本是Python3.5的話,這裡就不太適合了。 使用Speech API 原理 我們的想法是藉助微軟的語音介面,所以我們肯定是要進行呼叫 相關的介面。所以我們需要安裝pywin32來幫助我們完成這一個底層的互動。 示例程式碼 import […]