中文語音處理在數(shù)字助聽器系統(tǒng)的開發(fā)設計
一.中文語音技術處理原理
中文語音處理策略的英文詞有 “Chinese speech processing strategy” 或 “Chinese speech recognition”, ( 中文語音識別 ) 和 “hearing aid algorithm” ( 助聽器算法 ) 等。其中, algorithm ,即 “ 算法 ” 一詞使用較多,尤其涉及到數(shù)字助聽器的開發(fā), “ 算法 ” 代表了某一特殊技術的核心。 “ 算法 ” 可以被簡單地看作為實現(xiàn)某些特定信號處理功能的指令序列。中文語音特征可以通過算法研究來形成的。數(shù)字信號處理器和算法構成了數(shù)字助聽器的 DSP 線路。包含多通道動態(tài)范圍壓縮、噪音衰減等處理,設計助聽器的算法的主要目標是利用中文語音處理技術,即使在不同的聽音環(huán)境中,須確保言語被聽見并聆聽舒適。同時,利用數(shù)字助聽器改善漢語可懂度,使有聽力損失的中國患者能更容易地理解漢語。
漢語是聲調(diào)單字語言,聲調(diào)是漢語的重要語音特征之一。聲調(diào)特征主要體現(xiàn)在嗓音基頻隨時間變化的模式上。 Eady 技術 (1982) 曾考察過聲調(diào)語言 — 漢語的基頻模式與重音語言 — 英語有什么不同。漢語的聲調(diào)在詞語中具有辯意作用,在生活實踐當中,大家也都能體會到聲調(diào)有助于我們聽懂別人的話,而 “ 南腔北調(diào) ” 常表示不易聽懂和不大好懂和不大好聽的意思。
對于連續(xù)言語來說,長時間平均的正、負顫動因數(shù),各種語言和男女發(fā)音人是差不多的。只是負顫動總是比正顫動大,而且出現(xiàn)頻率也較高。 Eady 的測量結果表明,漢語的說話速度要比英語慢一些。這可能是由于說漢語時,說話人要花更大的努力在每一個音節(jié)上來控制聲帶運動,也就是說聲調(diào)語言的音節(jié)喉運動控制有較大的語言學負荷,因而花的時間就多一些。結果就表現(xiàn)為說話慢一些。
因此,聲調(diào)信息主要存在于基頻隨時間的變化中,強度變化對聲調(diào)信息有補償作用,以及清輔音的存在與否對聲調(diào)清晰度是有一定的影響的。
1 原理 (Principles)
本文介紹一種可應用于數(shù)字助聽器的提高漢語可懂度的語音處理方法,其目標是使以漢語為母語的聽殘人士能更容易地理解語言。增強言語可懂度的思路來源于人們的實踐經(jīng)驗;叵胍幌,當你為使一個有聽力障礙的人更容易聽懂自己說話時所采用的方法:你不僅僅要提高音量,而且還要改變發(fā)音方式,說得更慢和更清晰。一些研究表明清楚地讀無意義的語句,比在日常會話句子,大約能提高 17% 的單詞可懂度。這里所謂說得更清晰是指強調(diào)言語信號中的某些暗示,這些暗示有許多不同的形式,如特定音段的持續(xù)時間,元音的共振峰位置或者音素之間的過渡等。
不是所有人都會簡單地、方便地對聽力損失患者 “ 清楚地 ” 講話。因此,我們要采用言語增強的方法就是在說話人和聽話人中間構造一個處理模型,該模型能強調(diào)并突出語句中的特定成分,使語句聽起來更清晰。
一切語音之所以能夠表達意義,是由于各個音之間存在區(qū)別。這些區(qū)別產(chǎn)生于聲腔內(nèi)部的器官和肌肉等活動決定的發(fā)音方法和發(fā)音部位的差異,同時又表現(xiàn)為語音的聲學特征的差異。本文提出的言語增強的方法正是通過對語音信號的重構來強化這些差異。所謂重構是指對語音信號中不同性質(zhì)的信號進行識別并有針對性地予以處理,強調(diào)其中對人的感知起作用的特征,從而達到提高言語清晰度的目的。該方法可以簡單地概括為:放大輔音、強調(diào)重音和突出聲調(diào)。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
2 石藥集團的陽謀
-
10 科源制藥并購“大戲”深解
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市