TTS所用的關鍵技術就是語音合成。早期的TTS一般采用專用的語音芯片實現,主要用在家用電器或兒童語音玩具中。早期的TTS語音芯片存在一些問題,例如:發音生硬,對多音字容易判讀錯誤,導致發音錯,是使用者造成誤解。而現在隨著科技技術的發展,深圳奧爾偉業TTS語音芯片則是采用真人發音,軟件輔助修改的算法,讓語言的自然度大大提高。這個是怎么做到的呢?
首先是找專業的,普通話發音標準的人進行漢字的發音采集。然后將這個語音庫存入語音語音芯片。
其次芯片在根據輸入的文字去自動判別語氣,語調,還有多音字的識別。對源語音庫的波形進行聲調和幅度的調整,生成波形輸出的語音芯片的語音專用DA最終推動喇叭生成聲音
而基于微機應用的TTS一般用純軟件實現,主要包括以下幾部分:
●文本分析-對輸入文本進行語言學分析,逐句進行詞匯的、語法的和語義的分析,以確定句子的低層結構和每個字的音素的組成,包括文本的斷句、字詞切分、多音字的處理、數字的處理、縮略語的處理等。
●語音合成-把處理好的文本所對應的單字或短語從語音合成庫中提取,把語言學描述轉化成言語波形。
●韻律處理-合成音質(Qualityof Synthetic Speech)是指語音合成系統所輸出的語音的質量,一般從清晰度(或可懂度)、自然度和連貫性等方面進行主觀評價。清晰度是正確聽辨有意義詞語的百分率;自然度用來評價合成語音音質是否接近人說話的聲音,合成詞語的語調是否自然; 連貫性用來評價合成語句是否流暢。
要合成出高質量的語音,所采用的算法是極為復雜的,因此對機器的要求也非常高。算法的復雜度決定了目前微機并發進行多通道TTS的系統容量。
深圳奧爾偉業【音樂IC供應商】www.daohang52.com。