音情報処理 Speech Processing
 
◇ 担当教員 Instructor : 猿渡 洋(Hiroshi Saruwatari / さるわたり ひろし)、 川波 弘道(Hiromichi Kawanam / かわなみ ひろみち)
◇ 単位数 Credits : 1単位 ◇ 選択・必修 Required/Elective : 選択 ◇ 講義室 Room : L2
◇ 講義スタイル Style : 講義/公開
◇ 開講時期 Quarter : Ⅱ期 火曜1限

◇ 授業目的 Course goals :  音声を例にあげて、時系列の周波数分析や自己回帰モデルのような時系列信号処理の基礎知識の習得をはかる。また、音声認識を例に上げて、時間軸非線型マッチングのアルゴリズムについて述べ、時系列マッチングアルゴリズムの理解をはかる。さらに、HMM(隠れマルコフモデル)による音声認識について、EMアルゴリズムによる学習過程の理解をはかる。同じEMアルゴリズムによる統計的言語モデルについての理解をはかる。
◇ 授業内容 Course description : 音声情報処理の基礎的な技術について,基本的な手法・アルゴリズムを中心に講義を行う.とくに,音声の性質の理解,統計的な音声認識へのアプローチに重点をおいて説明する.今期の授業では,EMアルゴリズム(Expectation-Maximization Algorithm)を中心にすえて,音声認識以外の分野への適用についても触れる.
具体的な項目を以下に記す.

・音声学基礎(音韻・音素体系,音韻特徴,スペクトログラム)
Fundamentals of phonetics (phonology, characteristics of speech, spectrogram)
・音声信号処理(DFT,LPC分析)
Speech signal processing (DFT, LPC analysis)
・音声合成
Speech synthesis
パターンマッチングによる音声認識(時間軸非線形マッチング(DTW),スペクトル距離尺度)
Speech recognition by pattern matching (DTW, Spectral distance measure)
・統計的音声認識(EMアルゴリズム,HMM,統計的言語モデル)
Statistical speech recognition (EM algorithm, HMM, statistical language model)

【担当予定】

第1-4回: 猿渡 音声信号処理 (Speech signal processing)
第5-7回: 川波 音声学基礎, 音声合成,パターンマッチングによる音声認識,統計的音声認識(EMアルゴリズム,HMM,言語モデル) (Fundamentals of phonetics, Speech synthesis, Pattern matching, Statistical speech recognition (EM algorithm, HMM, statistical language model))
第8回: 質疑, 試験 (Discussion and examination)

◇ 教科書 Textbook : 特になし。講義ノートを配布する。
◇ 参考書 Reference materials : 1. 鹿野、中村、伊勢、音声・音情報のディジタル信号処理、昭晃堂
2. 鹿野、伊藤、河原、武田、山本、音声認識システム、オーム社、2001年
3. R. Darbin et al., Biological sequence analysis, Cambridge Univ. Press, 1998
◇ 履修条件 Prerequisites : 特になし。
◇ 成績評価 Grading : 成績評価は、毎時間行なう小演習(ときにはレポート)と最終試験(資料持込可)による。具体的には、小演習50%と最終試験50%の評価点と、最終試験のみの評価点の良い方で判断する。一部のレポートを試験に含めることがある。
◇ オフィスアワー Office Hours : 猿渡:(B614)月曜日5限・木曜日5限。その他、空いているときは何時でも。
川波:(B613)月曜日5限・木曜日5限。その他、空いているときは何時でも。
◇ 配布資料 Handouts : 現在、配布資料はありません。