進入XMS | 求助 |
整合視訊與音訊分析的口語表訓練系統
(by 系統管理者, 2012-02-14 12:56:15)

整合視訊與音訊分析的口語表訓練系統

子題一:廣電新聞播報品質電腦化評估系統之研發

子題二:新聞主播面部動作與表情的量化分析與比較

  • 計畫成員:廖文宏

「廣電新聞播報品質電腦化評估系統之研發」計畫,主要是利用數位語音處理技術,將聲波數位化後進行處理與分析,從中擷取有意義的信號特徵 (acoustic features) ,計算與播音品質相關之參數(包含 speaking rate, pitch, timbre, breathiness, loudness 等),並發掘聲波中物理特性與知覺特徵間的關聯性,以建立相關參數權重對應關係,進而將播報品質的評判標準加以量化,以建立一套客觀的電腦化自動評分系統,其介面如圖一所示。必須說明的是,原本目標希望開發與文本內容無關之評分規則,但由於對應之知覺特徵 (perceptual features) 必須透過大量資料收集、分析並進行資料採掘(data mining)後方可正確定義;另一方面,照稿唸也符合新聞播報之習慣,因此該計畫仍採固定文本之比對模式,較類似前述語言輔助學習之作法。

「新聞主播面部動作與表情的量化分析與比較」計畫,乃利用電腦視覺及影像處理技術(包含人臉偵測、Active Appearance Models、Optical Flow等),即時定位播報者的五官特徵點,再依各點的座標位置計算主播表情變化和身體搖晃情形(如圖二),並與專業人士訂立之規則比對,藉此評比播報者的表現,透過客觀數據之呈現,除可明確指出播報者表情與肢體語言之優缺點,應用於專業課程將可有效提高傳播教育的品質。