Miyazawa’s Pukiwiki
HTSによるHMM音声合成
はすでに存在します。
開始行:
#access
#analog
*HMM音声合成ツールキット HTS [#p0da6774]
#contents
**HTSとは [#t671ede2]
-[[名古屋工業大学徳田・李研究室:http://www.sp.nitech.ac.j...
-HTS(修正HTK)+SPTK(('''[[NII講演 統計的手法に基づいた...
--HTKからの修正点
---ストリーム依存のコンテキストクラスタリング
---状態継続長モデルとクラスタリング
---F0モデリングのための状態出力確率
--感情音声合成, 話者適応, モーフィング, 歌声合成 など.
--言語に依存したコードは無い(どんな言語でも・歌唱音も合...
--LPC, LSP, COC, 単位選択音声合成(CHATR), HMM音声合成(HTS...
--さまざまな企業で使われている((ただし、多様な音声が合成...
**関連リンク [#eda08465]
-[[徳田先生のページ:http://www.sp.nitech.ac.jp/~tokuda/in...
-[[HMM-based Speech Synthesis System (HTS) - Home:http://...
-[[hts_engine API:http://hts-engine.sourceforge.net/]]
--ランタイムエンジン hts_engine だけはHTKと独立しているの...
-[[HMM音声合成ツールキットの概要:http://www.sp.nitech.ac....
-[[HMM音声合成ツールキット ver. 2.0:http://www.sp.nitech....
-[[Open JTalk:http://open-jtalk.sourceforge.net/]]
--[[Open JTalk デモ:http://www.sp.nitech.ac.jp/demo/open_...
-'''[[NII講演 統計的手法に基づいた音声合成 ―原理と最近の...
-[[MMDAgent:http://www.itmedia.co.jp/news/articles/1009/2...
*Linux(Debian GNU/Linux 6.0((注:Debian GNU/Linux 4.0 で...
-ここでは、64bit((32bitコンピュータの場合、ActiveTclのダ...
-なお、以下の説明ではホームディレクトリのパスを ''$HOME''...
**Cコンパイラのインストール [#wd299b4b]
-[[C/C++開発環境/Linux(Debian GNU/Linux 6.0)にCコンパ...
**必要なファイルのダウンロードとインストール [#h155bc58]
-&color(red){[[サンプルの音響モデルや辞書を使って音声合成...
-以下でダウンロードした各ファイルは解凍して((.tar.gz形式...
--HTK-3.4.1.tar.gz と HDecode-3.4.1.tar.gz は解凍すると h...
***hts_engine_API [#jd6fa8d8]
-[[hts_engine API:http://hts-engine.sourceforge.net/]]
--Source Code より hts_engine_API-1.06.tar.gz をダウンロ...
--2012/4/4 時点のバージョン : version 1.06
-hts_engine APIをコンパイルします。((./configure --prefix...
#geshi(bash){{
mkdir $HOME/HTS/hts_engine_API
cd $HOME/HTS/hts_engine_API-1.06
chmod 777 $HOME/HTS/hts_engine_API-1.06/*
./configure --prefix=$HOME/HTS/hts_engine_API/
make
make install
}}
***Open JTalk [#we2af101]
-Open JTalk
--HTSを使ったHMMテキスト音声合成システム(HTSのデモアプリ)
--[[Open JTalk:http://open-jtalk.sourceforge.net/]] の So...
--2012/4/4 時点のバージョン : 1.05
-Open JTalk サンプル音響モデル
--[[Open JTalk:http://open-jtalk.sourceforge.net/]] より ...
--2012/04/04 現在のファイル名は hts_voice_nitech_jp_atr50...
-Open JTalkをコンパイルします。
#geshi(bash){{
mkdir $HOME/HTS/open_jtalk/
cd $HOME/HTS/open_jtalk-1.05
chmod 777 $HOME/HTS/open_jtalk-1.05/*
./configure --with-hts-engine-header-path=$HOME/HTS/hts_e...
make
make install
}}
--辞書ファイルはすでにこの中に入っているようです。((ただ...
***HTKとHTS [#pae9f37a]
-HTK 基本セット
--[[ここ:http://shower.human.waseda.ac.jp/~m-kouki/pukiwi...
--HTK-3.4.1 以降のバージョンでないとHTSのパッチが当たりま...
-HTK Speech Recognition Toolkit
--[[ここ:http://htk.eng.cam.ac.uk/prot-docs/hdecode.shtml...
-HTS(HTKのパッチとして配布)
--[[HMM-based Speech Synthesis System (HTS) - Home:http:/...
---Download にある README、Document、Source code をダウン...
---2012/4/4 時点のバージョン : HTS-2.2_for_HTK-3.4.1.tar....
-はじめに、HTSのパッチを当てます。
--HTS-2.2_for_HTK-3.4.1 内の INSTALL (テキストファイル)の...
++同じディレクトリ内にある HTS-2.2_for_HTK-3.4.1.patch を...
#geshi(bash){{
cp $HOME/HTS/HTS-2.2_for_HTK-3.4.1/HTS-2.2_for_HTK-3.4.1....
}}
++htkディレクトリに移動して、以下を実行
#geshi(bash){{
cd $HOME/HTS/htk
patch -p1 -d . < HTS-2.2_for_HTK-3.4.1.patch
}}
---&ref(patch_log.txt); のように出たら、成功です。
-HTKをコンパイルします。
#geshi(bash){{
chmod 777 $HOME/HTS/htk/*
./configure --prefix=$HOME/HTS/htk/
make
make install
}}
--コンパイルに成功したら、$HOME/HTS/htk 内に実行ファイル...
--%%[[ここ:http://shower.human.waseda.ac.jp/~m-kouki/puki...
***SPTK [#j458a50d]
-[[SPTK:http://sp-tk.sourceforge.net/]]
--Speech Signal Processing Toolkit (SPTK)
--2012/4/4 時点の最新バージョン SPTK-3.5.tar.gz をダウン...
-SPTKをコンパイルします。
#geshi(bash){{
mkdir $HOME/HTS/SPTK
cd $HOME/HTS/SPTK-3.5
chmod 777 $HOME/HTS/SPTK-3.5/*
./configure --prefix=$HOME/HTS/SPTK/
make
make install
}}
***OpenFst [#j15438b8]
-[[OpenFst:http://www.openfst.org/]]
--重み付き有限状態トランスデューサー (WFST) を扱うライブ...
--Download より openfst-1.3.1.tar.gz をダウンロードしまし...
--2012/4/4 時点のバージョン : Version 1.3.1
-OpenFstをコンパイルします。
#geshi(bash){{
mkdir $HOME/HTS/openfst/
cd $HOME/HTS/openfst-1.3.1
chmod 777 $HOME/HTS/openfst-1.3.1/*
./configure --prefix=$HOME/HTS/openfst/
make
make install
}}
--最初に実行したときは、./configure の時点で「compiler ca...
***ActiveTcl [#b3d10b7e]
-[[ActiveTcl:http://downloads.activestate.com/ActiveTcl/]]
--F0解析(Tcl/Tk の中のgetf0)、デモプログラムで使用
--64bit版 ActiveTcl8.4.19.6.295590-linux-x86_64 をダウン...
---マニュアルによれば ActiveTcl 8.5. 以降は該当プログラム...
-ActiveTclをコンパイルします。
#geshi(bash){{
mkdir $HOME/HTS/ActiveTcl
cd $HOME/HTS/ActiveTcl8.4.19.6.295590-linux-x86_64
chmod 777 $HOME/HTS/ActiveTcl8.4.19.6.295590-linux-x86_64/*
chmod 777 $HOME/HTS/ActiveTcl8.4.19.6.295590-linux-x86_64...
chmod 777 $HOME/HTS/ActiveTcl8.4.19.6.295590-linux-x86_64...
sh install.sh
(指示に従って操作、インストールディレクトリは (ホームディ...
}}
***Festival [#a23b8ad5]
-[[Festival:http://www.cstr.ed.ac.uk/projects/festival/]]
--テキスト解析器([[参考:http://d.hatena.ne.jp/masaking/2...
--[ download ] > In Europe より festival-2.1-release.tar....
---&color(red){''注'':以下のマニュアルでは、2012/04/04現...
-[[インストールマニュアル:http://festvox.org/docs/manual-...
#geshi(bash){{
mv $HOME/HTS/festival $HOME/HTS/festival_source
mkdir $HOME/HTS/festival/
cd $HOME/HTS/festival_source
chmod 777 $HOME/HTS/festival_source/*
./configure --prefix=$HOME/HTS/festival/
make
make install
}}
--&color(red){つくりかけ。うまくいきません。};
--&color(red){[[Festival install/音声合成ソフトウェアイン...
---[[SIOD: Scheme in One Defun:http://people.delphiforums...
---以下のエラー。
slibu.c:1031: error: conflicting types for `lchmod'
/usr/include/sys/stat.h:261: error: previous declaration...
make[2]: *** [slibu.o] error 1
---関係ありそうな掲示板 → [[1:http://webcache.googleuserc...
**サンプルデータを使った音声合成(HMMテキスト音声合成シス...
-はじめに、[[hts_engine APIのインストール:http://shower.h...
-サンプル音響モデルを適用
--hts_voice_nitech_jp_atr503_m001-1.04 の中身を $HOME/HTS...
#geshi(bash){{
cp $HOME/HTS/hts_voice_nitech_jp_atr503_m001-1.04/* $HOME...
}}
--なお音響モデルを自分で構築する方法は、[[音響モデルの学...
-話す内容のテキストを作る
#geshi(bash){{
cd $HOME/HTS/open_jtalk/bin
emacs input.txt
(適当な文字列を作る)
}}
--サンプル &ref(input.txt);
---文字コードは EUC にしてください。
-サンプルプログラムを実行してみます。
--$HOME/HTS/open_jtalk/bin で以下を実行(参考:[[Open JTa...
#geshi(bash){{
cd $HOME/HTS/open_jtalk/bin
./open_jtalk -td tree-dur.inf -tf tree-lf0.inf -tm tree-m...
}}
--[[引数の詳細(「OpenJTalkを使ってみる」):http://www.lo...
---これらの引数は hts_engine が要求しているもの(音響モデ...
--同じディレクトリに output.wav ができます。
--サンプル &ref(output.wav);
**音響モデルの学習 [#y8096a4a]
-HTSの音響モデルの学習を行う(話者依存学習)方法について。
-はじめに、[[Festival以外のプログラムを全てインストール:h...
***デモプログラムを試す [#a350a8c1]
-[[ここ:http://hts.sp.nitech.ac.jp/?Download]] から、Spea...
--解凍して、中にある INSTALL に従ってインストール
#geshi(bash){{
cd $HOME/HTS/HTS-demo_NIT-ATR503-M001
chmod 777 $HOME/HTS/HTS-demo_NIT-ATR503-M001/*
./configure --with-tcl-search-path=$HOME/HTS/ActiveTcl/bi...
make
}}
---引数の詳細 &ref(help_HTS-demo_NIT-ATR503-M001.txt);
---「doesn't support snack」エラーが出たときは、libsnack2...
--学習が開始される。
---表示されるテキスト(20ファイルのみで試した例): &ref(r...
---"Extracting f0" フェイズで「Unable to open mixer /dev/...
---"Extracting MGC coefficients" と "Extracting f0" のフ...
--上が完了してもHTKの学習(scripts/Training.pl)が完了し...
#geshi(bash){{
cd $HOME/HTS/HTS-demo_NIT-ATR503-M001
chmod 777 scripts/*
scripts/Training.pl scripts/Config.pm
}}
---/HTS-demo_NIT-ATR503-M001/data/labels/gen 以下のラベル...
---OpenJTalk で読める形式(hts_engine API の入力形式)の...
---&color(red){ここで作った音響モデルを [[OpenJTalk に読...
//***手動で学習させる((本セクションの記述は菊池研究室の宮...
**音響モデルの適応 [#m3850131]
-&color(red){''【ご注意】以下は最後までできていません。''};
-はじめに、[[全てのプログラムをインストール:http://shower...
-[[ここ:http://hts.sp.nitech.ac.jp/?Download]] から、Spea...
--STRAIGHTおよびMATLABの実行環境がない場合は、HTS-demo_CM...
--解凍して、中にある INSTALL に従ってインストール
//*謝辞 [#n7098cc3]
//-本マニュアルの執筆は菊池研究室の宮島崇浩研究員と協力し...
終了行:
#access
#analog
*HMM音声合成ツールキット HTS [#p0da6774]
#contents
**HTSとは [#t671ede2]
-[[名古屋工業大学徳田・李研究室:http://www.sp.nitech.ac.j...
-HTS(修正HTK)+SPTK(('''[[NII講演 統計的手法に基づいた...
--HTKからの修正点
---ストリーム依存のコンテキストクラスタリング
---状態継続長モデルとクラスタリング
---F0モデリングのための状態出力確率
--感情音声合成, 話者適応, モーフィング, 歌声合成 など.
--言語に依存したコードは無い(どんな言語でも・歌唱音も合...
--LPC, LSP, COC, 単位選択音声合成(CHATR), HMM音声合成(HTS...
--さまざまな企業で使われている((ただし、多様な音声が合成...
**関連リンク [#eda08465]
-[[徳田先生のページ:http://www.sp.nitech.ac.jp/~tokuda/in...
-[[HMM-based Speech Synthesis System (HTS) - Home:http://...
-[[hts_engine API:http://hts-engine.sourceforge.net/]]
--ランタイムエンジン hts_engine だけはHTKと独立しているの...
-[[HMM音声合成ツールキットの概要:http://www.sp.nitech.ac....
-[[HMM音声合成ツールキット ver. 2.0:http://www.sp.nitech....
-[[Open JTalk:http://open-jtalk.sourceforge.net/]]
--[[Open JTalk デモ:http://www.sp.nitech.ac.jp/demo/open_...
-'''[[NII講演 統計的手法に基づいた音声合成 ―原理と最近の...
-[[MMDAgent:http://www.itmedia.co.jp/news/articles/1009/2...
*Linux(Debian GNU/Linux 6.0((注:Debian GNU/Linux 4.0 で...
-ここでは、64bit((32bitコンピュータの場合、ActiveTclのダ...
-なお、以下の説明ではホームディレクトリのパスを ''$HOME''...
**Cコンパイラのインストール [#wd299b4b]
-[[C/C++開発環境/Linux(Debian GNU/Linux 6.0)にCコンパ...
**必要なファイルのダウンロードとインストール [#h155bc58]
-&color(red){[[サンプルの音響モデルや辞書を使って音声合成...
-以下でダウンロードした各ファイルは解凍して((.tar.gz形式...
--HTK-3.4.1.tar.gz と HDecode-3.4.1.tar.gz は解凍すると h...
***hts_engine_API [#jd6fa8d8]
-[[hts_engine API:http://hts-engine.sourceforge.net/]]
--Source Code より hts_engine_API-1.06.tar.gz をダウンロ...
--2012/4/4 時点のバージョン : version 1.06
-hts_engine APIをコンパイルします。((./configure --prefix...
#geshi(bash){{
mkdir $HOME/HTS/hts_engine_API
cd $HOME/HTS/hts_engine_API-1.06
chmod 777 $HOME/HTS/hts_engine_API-1.06/*
./configure --prefix=$HOME/HTS/hts_engine_API/
make
make install
}}
***Open JTalk [#we2af101]
-Open JTalk
--HTSを使ったHMMテキスト音声合成システム(HTSのデモアプリ)
--[[Open JTalk:http://open-jtalk.sourceforge.net/]] の So...
--2012/4/4 時点のバージョン : 1.05
-Open JTalk サンプル音響モデル
--[[Open JTalk:http://open-jtalk.sourceforge.net/]] より ...
--2012/04/04 現在のファイル名は hts_voice_nitech_jp_atr50...
-Open JTalkをコンパイルします。
#geshi(bash){{
mkdir $HOME/HTS/open_jtalk/
cd $HOME/HTS/open_jtalk-1.05
chmod 777 $HOME/HTS/open_jtalk-1.05/*
./configure --with-hts-engine-header-path=$HOME/HTS/hts_e...
make
make install
}}
--辞書ファイルはすでにこの中に入っているようです。((ただ...
***HTKとHTS [#pae9f37a]
-HTK 基本セット
--[[ここ:http://shower.human.waseda.ac.jp/~m-kouki/pukiwi...
--HTK-3.4.1 以降のバージョンでないとHTSのパッチが当たりま...
-HTK Speech Recognition Toolkit
--[[ここ:http://htk.eng.cam.ac.uk/prot-docs/hdecode.shtml...
-HTS(HTKのパッチとして配布)
--[[HMM-based Speech Synthesis System (HTS) - Home:http:/...
---Download にある README、Document、Source code をダウン...
---2012/4/4 時点のバージョン : HTS-2.2_for_HTK-3.4.1.tar....
-はじめに、HTSのパッチを当てます。
--HTS-2.2_for_HTK-3.4.1 内の INSTALL (テキストファイル)の...
++同じディレクトリ内にある HTS-2.2_for_HTK-3.4.1.patch を...
#geshi(bash){{
cp $HOME/HTS/HTS-2.2_for_HTK-3.4.1/HTS-2.2_for_HTK-3.4.1....
}}
++htkディレクトリに移動して、以下を実行
#geshi(bash){{
cd $HOME/HTS/htk
patch -p1 -d . < HTS-2.2_for_HTK-3.4.1.patch
}}
---&ref(patch_log.txt); のように出たら、成功です。
-HTKをコンパイルします。
#geshi(bash){{
chmod 777 $HOME/HTS/htk/*
./configure --prefix=$HOME/HTS/htk/
make
make install
}}
--コンパイルに成功したら、$HOME/HTS/htk 内に実行ファイル...
--%%[[ここ:http://shower.human.waseda.ac.jp/~m-kouki/puki...
***SPTK [#j458a50d]
-[[SPTK:http://sp-tk.sourceforge.net/]]
--Speech Signal Processing Toolkit (SPTK)
--2012/4/4 時点の最新バージョン SPTK-3.5.tar.gz をダウン...
-SPTKをコンパイルします。
#geshi(bash){{
mkdir $HOME/HTS/SPTK
cd $HOME/HTS/SPTK-3.5
chmod 777 $HOME/HTS/SPTK-3.5/*
./configure --prefix=$HOME/HTS/SPTK/
make
make install
}}
***OpenFst [#j15438b8]
-[[OpenFst:http://www.openfst.org/]]
--重み付き有限状態トランスデューサー (WFST) を扱うライブ...
--Download より openfst-1.3.1.tar.gz をダウンロードしまし...
--2012/4/4 時点のバージョン : Version 1.3.1
-OpenFstをコンパイルします。
#geshi(bash){{
mkdir $HOME/HTS/openfst/
cd $HOME/HTS/openfst-1.3.1
chmod 777 $HOME/HTS/openfst-1.3.1/*
./configure --prefix=$HOME/HTS/openfst/
make
make install
}}
--最初に実行したときは、./configure の時点で「compiler ca...
***ActiveTcl [#b3d10b7e]
-[[ActiveTcl:http://downloads.activestate.com/ActiveTcl/]]
--F0解析(Tcl/Tk の中のgetf0)、デモプログラムで使用
--64bit版 ActiveTcl8.4.19.6.295590-linux-x86_64 をダウン...
---マニュアルによれば ActiveTcl 8.5. 以降は該当プログラム...
-ActiveTclをコンパイルします。
#geshi(bash){{
mkdir $HOME/HTS/ActiveTcl
cd $HOME/HTS/ActiveTcl8.4.19.6.295590-linux-x86_64
chmod 777 $HOME/HTS/ActiveTcl8.4.19.6.295590-linux-x86_64/*
chmod 777 $HOME/HTS/ActiveTcl8.4.19.6.295590-linux-x86_64...
chmod 777 $HOME/HTS/ActiveTcl8.4.19.6.295590-linux-x86_64...
sh install.sh
(指示に従って操作、インストールディレクトリは (ホームディ...
}}
***Festival [#a23b8ad5]
-[[Festival:http://www.cstr.ed.ac.uk/projects/festival/]]
--テキスト解析器([[参考:http://d.hatena.ne.jp/masaking/2...
--[ download ] > In Europe より festival-2.1-release.tar....
---&color(red){''注'':以下のマニュアルでは、2012/04/04現...
-[[インストールマニュアル:http://festvox.org/docs/manual-...
#geshi(bash){{
mv $HOME/HTS/festival $HOME/HTS/festival_source
mkdir $HOME/HTS/festival/
cd $HOME/HTS/festival_source
chmod 777 $HOME/HTS/festival_source/*
./configure --prefix=$HOME/HTS/festival/
make
make install
}}
--&color(red){つくりかけ。うまくいきません。};
--&color(red){[[Festival install/音声合成ソフトウェアイン...
---[[SIOD: Scheme in One Defun:http://people.delphiforums...
---以下のエラー。
slibu.c:1031: error: conflicting types for `lchmod'
/usr/include/sys/stat.h:261: error: previous declaration...
make[2]: *** [slibu.o] error 1
---関係ありそうな掲示板 → [[1:http://webcache.googleuserc...
**サンプルデータを使った音声合成(HMMテキスト音声合成シス...
-はじめに、[[hts_engine APIのインストール:http://shower.h...
-サンプル音響モデルを適用
--hts_voice_nitech_jp_atr503_m001-1.04 の中身を $HOME/HTS...
#geshi(bash){{
cp $HOME/HTS/hts_voice_nitech_jp_atr503_m001-1.04/* $HOME...
}}
--なお音響モデルを自分で構築する方法は、[[音響モデルの学...
-話す内容のテキストを作る
#geshi(bash){{
cd $HOME/HTS/open_jtalk/bin
emacs input.txt
(適当な文字列を作る)
}}
--サンプル &ref(input.txt);
---文字コードは EUC にしてください。
-サンプルプログラムを実行してみます。
--$HOME/HTS/open_jtalk/bin で以下を実行(参考:[[Open JTa...
#geshi(bash){{
cd $HOME/HTS/open_jtalk/bin
./open_jtalk -td tree-dur.inf -tf tree-lf0.inf -tm tree-m...
}}
--[[引数の詳細(「OpenJTalkを使ってみる」):http://www.lo...
---これらの引数は hts_engine が要求しているもの(音響モデ...
--同じディレクトリに output.wav ができます。
--サンプル &ref(output.wav);
**音響モデルの学習 [#y8096a4a]
-HTSの音響モデルの学習を行う(話者依存学習)方法について。
-はじめに、[[Festival以外のプログラムを全てインストール:h...
***デモプログラムを試す [#a350a8c1]
-[[ここ:http://hts.sp.nitech.ac.jp/?Download]] から、Spea...
--解凍して、中にある INSTALL に従ってインストール
#geshi(bash){{
cd $HOME/HTS/HTS-demo_NIT-ATR503-M001
chmod 777 $HOME/HTS/HTS-demo_NIT-ATR503-M001/*
./configure --with-tcl-search-path=$HOME/HTS/ActiveTcl/bi...
make
}}
---引数の詳細 &ref(help_HTS-demo_NIT-ATR503-M001.txt);
---「doesn't support snack」エラーが出たときは、libsnack2...
--学習が開始される。
---表示されるテキスト(20ファイルのみで試した例): &ref(r...
---"Extracting f0" フェイズで「Unable to open mixer /dev/...
---"Extracting MGC coefficients" と "Extracting f0" のフ...
--上が完了してもHTKの学習(scripts/Training.pl)が完了し...
#geshi(bash){{
cd $HOME/HTS/HTS-demo_NIT-ATR503-M001
chmod 777 scripts/*
scripts/Training.pl scripts/Config.pm
}}
---/HTS-demo_NIT-ATR503-M001/data/labels/gen 以下のラベル...
---OpenJTalk で読める形式(hts_engine API の入力形式)の...
---&color(red){ここで作った音響モデルを [[OpenJTalk に読...
//***手動で学習させる((本セクションの記述は菊池研究室の宮...
**音響モデルの適応 [#m3850131]
-&color(red){''【ご注意】以下は最後までできていません。''};
-はじめに、[[全てのプログラムをインストール:http://shower...
-[[ここ:http://hts.sp.nitech.ac.jp/?Download]] から、Spea...
--STRAIGHTおよびMATLABの実行環境がない場合は、HTS-demo_CM...
--解凍して、中にある INSTALL に従ってインストール
//*謝辞 [#n7098cc3]
//-本マニュアルの執筆は菊池研究室の宮島崇浩研究員と協力し...
ページ名:
既存のページ名で編集する