在面對電話這個(gè)工具的時(shí)候,人們習(xí)慣于使用語音來進(jìn)行操作,而0-9的數(shù)字鍵和*鍵、#鍵已經(jīng)難以表達(dá)現(xiàn)在越來越多的信息內(nèi)容了。因此,在日常生活中,各種復(fù)雜的電話菜單不是讓我們感到迷茫就是急不可耐,真想給電話接上鼠標(biāo)鍵盤。語音識別技術(shù)則能使整個(gè)電話菜單扁平化,進(jìn)入系統(tǒng)以后,用戶可以說出他的指令,進(jìn)入其中任何一級菜單。1999年,Evans Group Research對使用各種語音系統(tǒng)的250個(gè)用戶進(jìn)行調(diào)查,發(fā)現(xiàn)對于語音界面和按鍵式系統(tǒng),有83%的用戶更傾向于前者。
語音合成(Text To Speech),簡稱TTS技術(shù),是將任意文本實(shí)時(shí)的轉(zhuǎn)換為自然語音的一項(xiàng)技術(shù),它涉及聲學(xué)、語言學(xué)、數(shù)字信號處理技術(shù)、多媒體技術(shù)等多個(gè)學(xué)科技術(shù),是中文信息處理領(lǐng)域的一項(xiàng)前沿技術(shù)。解決的主要問題就是如何將文本狀態(tài)的文字信息轉(zhuǎn)化為可聽的聲音信息。使以往只能用眼睛看的文字信息,也可以用耳朵來聽。