侵權投訴
訂閱
糾錯
加入自媒體

中文語音處理在數(shù)字助聽器系統(tǒng)的開發(fā)設計

  一.中文語音技術處理原理

  中文語音處理策略的英文詞有 “Chinese speech processing strategy” 或 “Chinese speech recognition”, ( 中文語音識別 ) 和 “hearing aid algorithm” ( 助聽器算法 ) 等。其中, algorithm ,即 “ 算法 ” 一詞使用較多,尤其涉及到數(shù)字助聽器的開發(fā), “ 算法 ” 代表了某一特殊技術的核心。 “ 算法 ” 可以被簡單地看作為實現(xiàn)某些特定信號處理功能的指令序列。中文語音特征可以通過算法研究來形成的。數(shù)字信號處理器和算法構成了數(shù)字助聽器的 DSP 線路。包含多通道動態(tài)范圍壓縮、噪音衰減等處理,設計助聽器的算法的主要目標是利用中文語音處理技術,即使在不同的聽音環(huán)境中,須確保言語被聽見并聆聽舒適。同時,利用數(shù)字助聽器改善漢語可懂度,使有聽力損失的中國患者能更容易地理解漢語。

  漢語是聲調(diào)單字語言,聲調(diào)是漢語的重要語音特征之一。聲調(diào)特征主要體現(xiàn)在嗓音基頻隨時間變化的模式上。 Eady 技術 (1982) 曾考察過聲調(diào)語言 — 漢語的基頻模式與重音語言 — 英語有什么不同。漢語的聲調(diào)在詞語中具有辯意作用,在生活實踐當中,大家也都能體會到聲調(diào)有助于我們聽懂別人的話,而 “ 南腔北調(diào) ” 常表示不易聽懂和不大好懂和不大好聽的意思。

  對于連續(xù)言語來說,長時間平均的正、負顫動因數(shù),各種語言和男女發(fā)音人是差不多的。只是負顫動總是比正顫動大,而且出現(xiàn)頻率也較高。 Eady 的測量結果表明,漢語的說話速度要比英語慢一些。這可能是由于說漢語時,說話人要花更大的努力在每一個音節(jié)上來控制聲帶運動,也就是說聲調(diào)語言的音節(jié)喉運動控制有較大的語言學負荷,因而花的時間就多一些。結果就表現(xiàn)為說話慢一些。

  因此,聲調(diào)信息主要存在于基頻隨時間的變化中,強度變化對聲調(diào)信息有補償作用,以及清輔音的存在與否對聲調(diào)清晰度是有一定的影響的。

  1  原理 (Principles)

  本文介紹一種可應用于數(shù)字助聽器的提高漢語可懂度的語音處理方法,其目標是使以漢語為母語的聽殘人士能更容易地理解語言。增強言語可懂度的思路來源于人們的實踐經(jīng)驗;叵胍幌,當你為使一個有聽力障礙的人更容易聽懂自己說話時所采用的方法:你不僅僅要提高音量,而且還要改變發(fā)音方式,說得更慢和更清晰。一些研究表明清楚地讀無意義的語句,比在日常會話句子,大約能提高 17% 的單詞可懂度。這里所謂說得更清晰是指強調(diào)言語信號中的某些暗示,這些暗示有許多不同的形式,如特定音段的持續(xù)時間,元音的共振峰位置或者音素之間的過渡等。

  不是所有人都會簡單地、方便地對聽力損失患者 “ 清楚地 ” 講話。因此,我們要采用言語增強的方法就是在說話人和聽話人中間構造一個處理模型,該模型能強調(diào)并突出語句中的特定成分,使語句聽起來更清晰。

  一切語音之所以能夠表達意義,是由于各個音之間存在區(qū)別。這些區(qū)別產(chǎn)生于聲腔內(nèi)部的器官和肌肉等活動決定的發(fā)音方法和發(fā)音部位的差異,同時又表現(xiàn)為語音的聲學特征的差異。本文提出的言語增強的方法正是通過對語音信號的重構來強化這些差異。所謂重構是指對語音信號中不同性質(zhì)的信號進行識別并有針對性地予以處理,強調(diào)其中對人的感知起作用的特征,從而達到提高言語清晰度的目的。該方法可以簡單地概括為:放大輔音、強調(diào)重音和突出聲調(diào)。

<上一頁  1  2  3  4  5  6  7  8  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號