語音文字到語音
語音合成是人類語音的人工製作。用於此目的的計算機系統稱為語音合成器,可以在軟體或硬體產品中實現。文字到語音轉換 (TTS) 系統將普通語言文字轉換為語音;其他系統將符號語言表示(如語音轉錄)呈現到語音中。[1] 合成語音可以通過連接存儲在資料庫中的錄製語音片段來創建。系統存儲的語音單元的大小不同;存儲手機或二元電話的系統提供最大的輸出範圍,但可能不夠清晰。對於特定的使用域,存儲整個單詞或句子允許高品質的輸出。或者,合成器可以合併聲帶模型和其他人類語音特徵,以創建一個完全"合成"的語音輸出。[2] 語音合成器的品質是由它與人的聲音的相似性和理解能力來判斷的。可理解的文本到語音視頻程式允許有視覺障礙或閱讀障礙的人在家裡的計算機上收聽書面作品。自20世紀90年代初以來,許多計算機操作系統都包括語音合成器。
典型 TTS 系統的概述
自動公告 功能表0:00 一個合成的聲音宣佈抵達瑞典的火車。 播放此檔時遇到問題?請參閱媒體説明。
微軟山姆示例 功能表0:00 微軟WindowsXP的默認語音合成器的聲音說:「快速棕色狐狸跳過懶惰的狗1,234,567,890次。蘇伊" 播放此檔時遇到問題?請參閱媒體説明。 文本到語音系統(或"引擎")由兩部分組成:[3] 前端和前端。前端有兩個主要任務。首先,它將包含數位和縮寫等符號的原始文本轉換為與寫出的單詞等效的文本。此過程通常稱為文本規範化、預處理或標記化。然後前端為每個單詞分配音標,並將文本劃分並標記成專業單位,如短語、子句和句子。將音文本轉錄分配給單詞的過程稱為文本到電話或石墨到電話轉換。音質轉錄和假資訊共同是前端輸出的符號語言表示形式。後端\mdash;通常被稱為合成器—然後將符號語言表示轉換為聲音。在某些系統中,此部分包括目標演算法的計算(音高輪廓、音質持續時間),[4],然後強加給輸出語音。
版本歷史記錄
- 版本 1.0 發佈於 2013-10-06
軟體細節
- 軟體分類: 音訊和多媒體 > 音訊檔案播放器
- 發佈者: Phelipe Maia
- 軟體性質: 免費
- 價格: N/A
- 版本: 1.0
- 作業系統: android