Miyazawa’s Pukiwiki
コーパス加工用プログラム
はすでに存在します。
開始行:
#access
#analog
*コーパス加工 [#k60f1106]
#contents
**日本語話し言葉コーパス(CSJ)((Maekawa K. (2003). Corpu...
***ディレクトリをサーチして必要なファイル(WAVとSEG)のパ...
-[[SearchWavPassCSJ.java:http://shower.human.waseda.ac.jp...
-/raid0/share/CSJ 以下の女性音声(F系)のリストを取得して...
$ java SearchWavPassCSJ /raid0/share/CSJ F searchWavFile...
--第一引数は /home/CSJ/disc3 などとしてもいいです。指定し...
--第二引数には「M(男性)」か「F(女性)」を指定してくだ...
--対話音声(D00~ではじまるデータ)は取得しません。
-ローパスフィルタをかけて出力するには
--'''[[LowPassFilter.m:http://shower.human.waseda.ac.jp/~...
$ java SearchWavPassCSJ /raid0/share/CSJ F searchWavFile...
--第四引数は、ローパスフィルタの周波数
--第五引数は、アンプの大きさ
***ディレクトリをサーチしてXMLファイルのパスを取得する [#...
-[[SearchXMLPassCSJ.java:http://shower.human.waseda.ac.jp...
-/home/CSJ 以下の女性音声(F系)のリストを取得して、xmlfi...
$ java SearchXMLPassCSJ /home/CSJ F xmlfilelist.txt
--第一引数は /home/CSJ/disc3 などとしてもいいです。指定し...
--第二引数には「M(男性)」か「F(女性)」を指定してくだ...
--対話音声(D00~ではじまるデータ)は取得しません。
***WAVファイルをコピーして、ひとつのディレクトリに集める ...
-'''[[CopyWav.java:http://shower.human.waseda.ac.jp/~m-ko...
$ java CopyWav searchWavFilePassCSJ.txt speechwav copyWa...
$ copyWavCSJ.sh
--speechwav ディレクトリにまとめてコピーされます。
--CopyWav の第4引数は、「最初から何秒をコピーするか」です。
***音素別WAVファイルを作成 [#jf6b0396]
-[[ディレクトリをサーチして必要なファイル(WAVとSEG)のパ...
-母音ごとに分割する
--分割対象となる母音のリストを作成します。
$ emacs vowellist.txt
--vowellist.txt
a
i
u
---seg ファイルで a, i, u に一致する音素のみを切り出す設...
--[[SearchSegmentCSJ.java:http://shower.human.waseda.ac.j...
--長さ 0.07秒以上の母音を全て、1母音あたり120個を上限とし...
$ java SearchSegmentCSJ 0.07 120 searchWavFilePassCSJ.tx...
segmentscript segmentwav searchSegmentCSJ.sh all
$ sh searchSegmentCSJ.sh
---シェルスクリプトファイルは segmentscript ディレクトリ...
---SearchSegmentCSJ の第8引数は、「何秒目以降を解析対象に...
***WAVファイルと音素別WAVファイルを作成(新しい形式) [#u...
-&color(red){2008.12.05 新しい分析方法(WAVデータと音素別...
-[[ディレクトリをサーチして必要なファイル(WAVとSEG)のパ...
-[[WAVファイルを数値データに変換(フォルマント):http://s...
java MakeWavFormant2 searchWavFilePassCSJF.txt segmenttx...
***アクセント核とブレイクインデックスをまとめて音節単位で...
-&color(red){フィラーなどカッコで囲まれた短単位は取り出し...
-はじめに、[[IPUの開始・終了時間およびノイズマスク区間の...
-続いて以下を実行します。
--[[BindWordBrakeCSJ.java:http://shower.human.waseda.ac.j...
---ソース中に直に書かれているパスを書き換えて下さい。
---BreakIndexに1,2,3を含んでいない単語を、前の単語と結合...
--以下が出力例です。
---[[bind.csv:http://shower.human.waseda.ac.jp/~m-kouki/p...
-応用例 → '''[[CSJのアクセント核のある音節+後続音節 など...
***イントネーション境界以外の母音のリストを取得する [#tc1...
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
***アクセント核を持たない名詞・形容詞のリストを作成する [...
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
***IPUの開始・終了時間およびノイズマスク区間の有無を取得...
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
***音素の開始・終了時間を取得する [#k0d2ee8b]
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
***話者情報を取得する [#y59def02]
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
***CSJ付属のTextGridファイルを解析する [#v7f64f08]
-[[Praat/Praatスクリプトの書き方:http://shower.human.wase...
**現代日本語書き言葉均衡コーパス(BCCWJ) [#l0ad517c]
***短単位ごとに情報を出力する [#w511c0fc]
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
**TIMIT Acoustic-Phonetic Continuous Speech Corpus ((show...
***DR3ディレクトリをサーチして必要なファイル(WAVとPHN)...
-[[SearchWavPassTIMIT.java:http://shower.human.waseda.ac....
java SearchWavPassTIMIT /share/timit/TIMIT/TRAIN/DR3 sea...
***WAVファイルをコピーして、ひとつのディレクトリに集める ...
-'''[[CopyWavTIMIT.java:http://shower.human.waseda.ac.jp/...
$ java CopyWavTIMIT searchWavFilePassTIMIT.txt speechwav...
$ copyWavTIMIT.sh
--speechwav ディレクトリにまとめてコピーされます。
--TIMITのWAVはヘッダ情報がないため、SOXでヘッダ情報を指定...
***音素別WAVファイルを作成 [#xedd544a]
-[[参考:http://shower.human.waseda.ac.jp/~m-kouki/pukiwik...
-DR3の音素ラベルをCSJ_SEG形式に変換
--[[SearchWavPassTIMIT.java:http://shower.human.waseda.ac...
--[[ConvertTimitSeg.java:http://shower.human.waseda.ac.jp...
java SearchWavPassTIMIT /share/timit/TIMIT/TRAIN/DR3 sea...
java ConvertTimitSeg searchWavFilePassTIMIT.txt
--各フォルダに自動的にSEGファイルを追加します。
-音声を母音ごとに分割する
--英語母音のリスト [[vowellist_eng.txt:http://shower.hum...
--[[SearchSegmentTIMIT.java:http://shower.human.waseda.ac...
--長さ 0.07秒以上の母音を、1母音あたり100個を上限として、...
java SearchSegmentTIMIT 0.07 100 searchWavFilePassTIMIT....
segmentscript segmentwav searchSegmentTIMIT.sh all
sh searchSegmentTIMIT.sh
--SearchSegmentTIMIT.java の SearchSegmentCSJ.java との違...
**The OGI Multilanguage Telephone Speech Corpus 1.2(CSLU...
***特定言語のディレクトリをサーチして必要なファイル(WAV...
-[[SearchWavPassCSLU.java:http://shower.human.waseda.ac.j...
java SearchWavPassCSLU /share/CSLU searchWavFilePassCSLU...
--第二引数「1」:セグメントファイルのパスは出力しない(セ...
-ローパスフィルタをかけて出力するには
--'''[[LowPassFilter.m:http://shower.human.waseda.ac.jp/~...
$ java SearchWavPassCSLU /share/CSLU searchWavFilePassCS...
***WAVファイルをコピーして、ひとつのディレクトリに集める ...
-'''[[CopyWav.java:http://shower.human.waseda.ac.jp/~m-ko...
$ java CopyWav searchWavFilePassCSLU.txt speechwav copyW...
$ copyWavCSLU.sh
--speechwav ディレクトリにまとめてコピーされます。
***音素別WAVファイルを作成 [#o4426d02]
-CSLUのspanishをサーチして必要なファイル(WAVとPTLOLA)の...
--[[SearchWavPassCSLU.java:http://shower.human.waseda.ac....
java SearchWavPassCSLU /share/CSLU searchWavFilePassCSLU...
---第二引数「0」:セグメントファイルの存在するファイルの...
-音素ラベルをCSJ_SEG形式に変換
--[[ConvertCSLUSeg.java:http://shower.human.waseda.ac.jp/...
java ConvertCSLUSeg searchWavFilePassCSLU.txt
--各フォルダに自動的にSEGファイルを追加します。
-音声を母音ごとに分割する
--スペイン語母音のリスト [[vowellist_spn.txt:http://show...
--[[SearchSegmentCSLU.java:http://shower.human.waseda.ac....
--長さ 0.07秒以上の母音を、1母音あたり100個を上限として、...
java SearchSegmentCSLU 0.07 100 searchWavFilePassCSLU.tx...
segmentscript segmentwav searchSegmentCSLU.sh all
sh searchSegmentCSLU.sh
--CSLUのファイル名には拡張子以外の「.」がありますが、この...
--&color(red){母音「&」もシェルスクリプトのエラーが出ます...
**MULTEXT 多言語韻律データベース((shower の /share/Multex...
***特定言語のディレクトリをサーチして必要なファイル(WAV...
-'''[[SearchDatabase.java:http://shower.human.waseda.ac.j...
--メインメソッド中に、各言語のデータベースの位置を直書き...
--'''[[run_SearchDatabase.sh:http://shower.human.waseda.a...
***元音声のMFCC解析+元音声の単語別分割 [#c48d4279]
-'''[[run_SearchDatabase.sh:http://shower.human.waseda.ac...
***元音声のMFCC解析結果をMATLABで使える形に変換 [#u8be3d11]
-'''[[MakeMfcTxtFusionMulText.java:http://shower.human.wa...
--データは mfctxtdata_matlab ディレクトリに格納されます。
**総合 [#v315fdf5]
-上記のコーパス別処理が完了しているとします。
***WAVファイルを数値データに変換(MFCC) [#bd1fe7aa]
-対象となるWAVファイル群が特定のディレクトリに入っている...
--HTKにパスが通っていなければ、通します。
PATH=$PATH:/home/m-kouki/HTK-CSJ/bin.linux/
export PATH
--MFCC解析の設定ファイルを作ります。
emacs config.hcopy
---'''[[config.hcopy:http://shower.human.waseda.ac.jp/~m-...
-MFCC解析を行なって、テキスト形式で出力します。
--'''[[MakeWavMfcc.java:http://shower.human.waseda.ac.jp/...
--speechwav ディレクトリ内の、ファイル名に「.wav」を含む...
$ java MakeWavMfcc speechwav speechtxt makeWavMfcc.sh ma...
$ sh makeWavMfcc.sh
---speechtxt ディレクトリ内に、テキスト形式のMFCCファイル...
---評価データを作る場合は、ファイル名に「_a.wav」を含むフ...
-MATLABで読み込める形に整形します。
--'''[[ConvertMfcc.java:http://shower.human.waseda.ac.jp/...
java ConvertMfcc speechtxt speechtxt_matlab
---speechtxt_matlabに、変換後のファイル(名前は同じ)が出...
***WAVファイルを数値データに変換(フォルマント) [#k29326...
-対象となるWAVファイル群が特定のディレクトリに入っている...
-フォルマント解析を行なって、テキスト形式で出力します。
--'''[[MakeWavFormant.java:http://shower.human.waseda.ac....
--'''[[speechAnalysis.m:http://shower.human.waseda.ac.jp/...
--'''[[speechSignal.m:http://shower.human.waseda.ac.jp/~m...
--speechwav ディレクトリ内の、ファイル名に「.wav」を含む...
$ java MakeWavFormant speechwav speechtxtFormant .wav
---speechtxtFormant ディレクトリ内に、テキスト形式のフォ...
---評価データを作る場合は、ファイル名に「_a.wav」を含むフ...
***音素別WAVファイルを数値データに変換(MFCC) [#y15371d5]
-MFCC解析を行なって、テキスト形式で出力します。
--'''[[MakeWavMfcc.java:http://shower.human.waseda.ac.jp/...
--segmentwav ディレクトリ内の、ファイル名に「_母音名_」を...
$ java MakeWavMfcc segmentwav segmenttxt_a makeWavMfcc.s...
$ sh makeWavMfcc.sh
$ java MakeWavMfcc segmentwav segmenttxt_i makeWavMfcc.s...
$ sh makeWavMfcc.sh
$ java MakeWavMfcc segmentwav segmenttxt_u makeWavMfcc.s...
$ sh makeWavMfcc.sh
$ java MakeWavMfcc segmentwav segmenttxt_e makeWavMfcc.s...
$ sh makeWavMfcc.sh
$ java MakeWavMfcc segmentwav segmenttxt_o makeWavMfcc.s...
$ sh makeWavMfcc.sh
---segmenttxt ディレクトリ内に、テキスト形式のMFCCファイ...
-MATLABで読み込める形に整形します。
--'''[[BindingMfcc.java:http://shower.human.waseda.ac.jp/...
--タイプ1:各ファイルの全ての行を出力して統合
java BindingMfcc speechtxt bindingMfcc.txt before all 100
---各ファイルの全ての行を取り出して、最初から100行分を連...
---ファイルごとに長さ(行数)が異なることに注意してくださ...
--タイプ2:1つのファイルにつき、ある行数分だけ出力して統合
$ java BindingMfcc segmenttxt_a bindingMfcc_a.txt middle...
$ java BindingMfcc segmenttxt_i bindingMfcc_i.txt middle...
$ java BindingMfcc segmenttxt_u bindingMfcc_u.txt middle...
$ java BindingMfcc segmenttxt_e bindingMfcc_e.txt middle...
$ java BindingMfcc segmenttxt_o bindingMfcc_o.txt middle...
---各ファイルの中央5行分だけ取り出して、最初から100行分を...
---音素別に切り出したファイルなどの場合、これで定常部を取...
--タイプ3:第六引数にキーワードを指定して、キーワードを含...
---'''[[SearchBindingSegment.java:http://shower.human.was...
java SearchBindingSegment segmenttxtMfccM vowellist.txt ...
searchBindingSegment.sh middle all 100
sh searchBindingSegment.sh
終了行:
#access
#analog
*コーパス加工 [#k60f1106]
#contents
**日本語話し言葉コーパス(CSJ)((Maekawa K. (2003). Corpu...
***ディレクトリをサーチして必要なファイル(WAVとSEG)のパ...
-[[SearchWavPassCSJ.java:http://shower.human.waseda.ac.jp...
-/raid0/share/CSJ 以下の女性音声(F系)のリストを取得して...
$ java SearchWavPassCSJ /raid0/share/CSJ F searchWavFile...
--第一引数は /home/CSJ/disc3 などとしてもいいです。指定し...
--第二引数には「M(男性)」か「F(女性)」を指定してくだ...
--対話音声(D00~ではじまるデータ)は取得しません。
-ローパスフィルタをかけて出力するには
--'''[[LowPassFilter.m:http://shower.human.waseda.ac.jp/~...
$ java SearchWavPassCSJ /raid0/share/CSJ F searchWavFile...
--第四引数は、ローパスフィルタの周波数
--第五引数は、アンプの大きさ
***ディレクトリをサーチしてXMLファイルのパスを取得する [#...
-[[SearchXMLPassCSJ.java:http://shower.human.waseda.ac.jp...
-/home/CSJ 以下の女性音声(F系)のリストを取得して、xmlfi...
$ java SearchXMLPassCSJ /home/CSJ F xmlfilelist.txt
--第一引数は /home/CSJ/disc3 などとしてもいいです。指定し...
--第二引数には「M(男性)」か「F(女性)」を指定してくだ...
--対話音声(D00~ではじまるデータ)は取得しません。
***WAVファイルをコピーして、ひとつのディレクトリに集める ...
-'''[[CopyWav.java:http://shower.human.waseda.ac.jp/~m-ko...
$ java CopyWav searchWavFilePassCSJ.txt speechwav copyWa...
$ copyWavCSJ.sh
--speechwav ディレクトリにまとめてコピーされます。
--CopyWav の第4引数は、「最初から何秒をコピーするか」です。
***音素別WAVファイルを作成 [#jf6b0396]
-[[ディレクトリをサーチして必要なファイル(WAVとSEG)のパ...
-母音ごとに分割する
--分割対象となる母音のリストを作成します。
$ emacs vowellist.txt
--vowellist.txt
a
i
u
---seg ファイルで a, i, u に一致する音素のみを切り出す設...
--[[SearchSegmentCSJ.java:http://shower.human.waseda.ac.j...
--長さ 0.07秒以上の母音を全て、1母音あたり120個を上限とし...
$ java SearchSegmentCSJ 0.07 120 searchWavFilePassCSJ.tx...
segmentscript segmentwav searchSegmentCSJ.sh all
$ sh searchSegmentCSJ.sh
---シェルスクリプトファイルは segmentscript ディレクトリ...
---SearchSegmentCSJ の第8引数は、「何秒目以降を解析対象に...
***WAVファイルと音素別WAVファイルを作成(新しい形式) [#u...
-&color(red){2008.12.05 新しい分析方法(WAVデータと音素別...
-[[ディレクトリをサーチして必要なファイル(WAVとSEG)のパ...
-[[WAVファイルを数値データに変換(フォルマント):http://s...
java MakeWavFormant2 searchWavFilePassCSJF.txt segmenttx...
***アクセント核とブレイクインデックスをまとめて音節単位で...
-&color(red){フィラーなどカッコで囲まれた短単位は取り出し...
-はじめに、[[IPUの開始・終了時間およびノイズマスク区間の...
-続いて以下を実行します。
--[[BindWordBrakeCSJ.java:http://shower.human.waseda.ac.j...
---ソース中に直に書かれているパスを書き換えて下さい。
---BreakIndexに1,2,3を含んでいない単語を、前の単語と結合...
--以下が出力例です。
---[[bind.csv:http://shower.human.waseda.ac.jp/~m-kouki/p...
-応用例 → '''[[CSJのアクセント核のある音節+後続音節 など...
***イントネーション境界以外の母音のリストを取得する [#tc1...
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
***アクセント核を持たない名詞・形容詞のリストを作成する [...
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
***IPUの開始・終了時間およびノイズマスク区間の有無を取得...
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
***音素の開始・終了時間を取得する [#k0d2ee8b]
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
***話者情報を取得する [#y59def02]
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
***CSJ付属のTextGridファイルを解析する [#v7f64f08]
-[[Praat/Praatスクリプトの書き方:http://shower.human.wase...
**現代日本語書き言葉均衡コーパス(BCCWJ) [#l0ad517c]
***短単位ごとに情報を出力する [#w511c0fc]
-[[コーパスのXML解析:http://shower.human.waseda.ac.jp/~m-...
**TIMIT Acoustic-Phonetic Continuous Speech Corpus ((show...
***DR3ディレクトリをサーチして必要なファイル(WAVとPHN)...
-[[SearchWavPassTIMIT.java:http://shower.human.waseda.ac....
java SearchWavPassTIMIT /share/timit/TIMIT/TRAIN/DR3 sea...
***WAVファイルをコピーして、ひとつのディレクトリに集める ...
-'''[[CopyWavTIMIT.java:http://shower.human.waseda.ac.jp/...
$ java CopyWavTIMIT searchWavFilePassTIMIT.txt speechwav...
$ copyWavTIMIT.sh
--speechwav ディレクトリにまとめてコピーされます。
--TIMITのWAVはヘッダ情報がないため、SOXでヘッダ情報を指定...
***音素別WAVファイルを作成 [#xedd544a]
-[[参考:http://shower.human.waseda.ac.jp/~m-kouki/pukiwik...
-DR3の音素ラベルをCSJ_SEG形式に変換
--[[SearchWavPassTIMIT.java:http://shower.human.waseda.ac...
--[[ConvertTimitSeg.java:http://shower.human.waseda.ac.jp...
java SearchWavPassTIMIT /share/timit/TIMIT/TRAIN/DR3 sea...
java ConvertTimitSeg searchWavFilePassTIMIT.txt
--各フォルダに自動的にSEGファイルを追加します。
-音声を母音ごとに分割する
--英語母音のリスト [[vowellist_eng.txt:http://shower.hum...
--[[SearchSegmentTIMIT.java:http://shower.human.waseda.ac...
--長さ 0.07秒以上の母音を、1母音あたり100個を上限として、...
java SearchSegmentTIMIT 0.07 100 searchWavFilePassTIMIT....
segmentscript segmentwav searchSegmentTIMIT.sh all
sh searchSegmentTIMIT.sh
--SearchSegmentTIMIT.java の SearchSegmentCSJ.java との違...
**The OGI Multilanguage Telephone Speech Corpus 1.2(CSLU...
***特定言語のディレクトリをサーチして必要なファイル(WAV...
-[[SearchWavPassCSLU.java:http://shower.human.waseda.ac.j...
java SearchWavPassCSLU /share/CSLU searchWavFilePassCSLU...
--第二引数「1」:セグメントファイルのパスは出力しない(セ...
-ローパスフィルタをかけて出力するには
--'''[[LowPassFilter.m:http://shower.human.waseda.ac.jp/~...
$ java SearchWavPassCSLU /share/CSLU searchWavFilePassCS...
***WAVファイルをコピーして、ひとつのディレクトリに集める ...
-'''[[CopyWav.java:http://shower.human.waseda.ac.jp/~m-ko...
$ java CopyWav searchWavFilePassCSLU.txt speechwav copyW...
$ copyWavCSLU.sh
--speechwav ディレクトリにまとめてコピーされます。
***音素別WAVファイルを作成 [#o4426d02]
-CSLUのspanishをサーチして必要なファイル(WAVとPTLOLA)の...
--[[SearchWavPassCSLU.java:http://shower.human.waseda.ac....
java SearchWavPassCSLU /share/CSLU searchWavFilePassCSLU...
---第二引数「0」:セグメントファイルの存在するファイルの...
-音素ラベルをCSJ_SEG形式に変換
--[[ConvertCSLUSeg.java:http://shower.human.waseda.ac.jp/...
java ConvertCSLUSeg searchWavFilePassCSLU.txt
--各フォルダに自動的にSEGファイルを追加します。
-音声を母音ごとに分割する
--スペイン語母音のリスト [[vowellist_spn.txt:http://show...
--[[SearchSegmentCSLU.java:http://shower.human.waseda.ac....
--長さ 0.07秒以上の母音を、1母音あたり100個を上限として、...
java SearchSegmentCSLU 0.07 100 searchWavFilePassCSLU.tx...
segmentscript segmentwav searchSegmentCSLU.sh all
sh searchSegmentCSLU.sh
--CSLUのファイル名には拡張子以外の「.」がありますが、この...
--&color(red){母音「&」もシェルスクリプトのエラーが出ます...
**MULTEXT 多言語韻律データベース((shower の /share/Multex...
***特定言語のディレクトリをサーチして必要なファイル(WAV...
-'''[[SearchDatabase.java:http://shower.human.waseda.ac.j...
--メインメソッド中に、各言語のデータベースの位置を直書き...
--'''[[run_SearchDatabase.sh:http://shower.human.waseda.a...
***元音声のMFCC解析+元音声の単語別分割 [#c48d4279]
-'''[[run_SearchDatabase.sh:http://shower.human.waseda.ac...
***元音声のMFCC解析結果をMATLABで使える形に変換 [#u8be3d11]
-'''[[MakeMfcTxtFusionMulText.java:http://shower.human.wa...
--データは mfctxtdata_matlab ディレクトリに格納されます。
**総合 [#v315fdf5]
-上記のコーパス別処理が完了しているとします。
***WAVファイルを数値データに変換(MFCC) [#bd1fe7aa]
-対象となるWAVファイル群が特定のディレクトリに入っている...
--HTKにパスが通っていなければ、通します。
PATH=$PATH:/home/m-kouki/HTK-CSJ/bin.linux/
export PATH
--MFCC解析の設定ファイルを作ります。
emacs config.hcopy
---'''[[config.hcopy:http://shower.human.waseda.ac.jp/~m-...
-MFCC解析を行なって、テキスト形式で出力します。
--'''[[MakeWavMfcc.java:http://shower.human.waseda.ac.jp/...
--speechwav ディレクトリ内の、ファイル名に「.wav」を含む...
$ java MakeWavMfcc speechwav speechtxt makeWavMfcc.sh ma...
$ sh makeWavMfcc.sh
---speechtxt ディレクトリ内に、テキスト形式のMFCCファイル...
---評価データを作る場合は、ファイル名に「_a.wav」を含むフ...
-MATLABで読み込める形に整形します。
--'''[[ConvertMfcc.java:http://shower.human.waseda.ac.jp/...
java ConvertMfcc speechtxt speechtxt_matlab
---speechtxt_matlabに、変換後のファイル(名前は同じ)が出...
***WAVファイルを数値データに変換(フォルマント) [#k29326...
-対象となるWAVファイル群が特定のディレクトリに入っている...
-フォルマント解析を行なって、テキスト形式で出力します。
--'''[[MakeWavFormant.java:http://shower.human.waseda.ac....
--'''[[speechAnalysis.m:http://shower.human.waseda.ac.jp/...
--'''[[speechSignal.m:http://shower.human.waseda.ac.jp/~m...
--speechwav ディレクトリ内の、ファイル名に「.wav」を含む...
$ java MakeWavFormant speechwav speechtxtFormant .wav
---speechtxtFormant ディレクトリ内に、テキスト形式のフォ...
---評価データを作る場合は、ファイル名に「_a.wav」を含むフ...
***音素別WAVファイルを数値データに変換(MFCC) [#y15371d5]
-MFCC解析を行なって、テキスト形式で出力します。
--'''[[MakeWavMfcc.java:http://shower.human.waseda.ac.jp/...
--segmentwav ディレクトリ内の、ファイル名に「_母音名_」を...
$ java MakeWavMfcc segmentwav segmenttxt_a makeWavMfcc.s...
$ sh makeWavMfcc.sh
$ java MakeWavMfcc segmentwav segmenttxt_i makeWavMfcc.s...
$ sh makeWavMfcc.sh
$ java MakeWavMfcc segmentwav segmenttxt_u makeWavMfcc.s...
$ sh makeWavMfcc.sh
$ java MakeWavMfcc segmentwav segmenttxt_e makeWavMfcc.s...
$ sh makeWavMfcc.sh
$ java MakeWavMfcc segmentwav segmenttxt_o makeWavMfcc.s...
$ sh makeWavMfcc.sh
---segmenttxt ディレクトリ内に、テキスト形式のMFCCファイ...
-MATLABで読み込める形に整形します。
--'''[[BindingMfcc.java:http://shower.human.waseda.ac.jp/...
--タイプ1:各ファイルの全ての行を出力して統合
java BindingMfcc speechtxt bindingMfcc.txt before all 100
---各ファイルの全ての行を取り出して、最初から100行分を連...
---ファイルごとに長さ(行数)が異なることに注意してくださ...
--タイプ2:1つのファイルにつき、ある行数分だけ出力して統合
$ java BindingMfcc segmenttxt_a bindingMfcc_a.txt middle...
$ java BindingMfcc segmenttxt_i bindingMfcc_i.txt middle...
$ java BindingMfcc segmenttxt_u bindingMfcc_u.txt middle...
$ java BindingMfcc segmenttxt_e bindingMfcc_e.txt middle...
$ java BindingMfcc segmenttxt_o bindingMfcc_o.txt middle...
---各ファイルの中央5行分だけ取り出して、最初から100行分を...
---音素別に切り出したファイルなどの場合、これで定常部を取...
--タイプ3:第六引数にキーワードを指定して、キーワードを含...
---'''[[SearchBindingSegment.java:http://shower.human.was...
java SearchBindingSegment segmenttxtMfccM vowellist.txt ...
searchBindingSegment.sh middle all 100
sh searchBindingSegment.sh
ページ名:
既存のページ名で編集する