README.md
February 14, 2022 · View on GitHub
あみたろの声素材工房様によるITAコーパス読み上げ音声のアクセント情報・音素アライメントラベル置き場
配布している情報について
labelsに音素とその開始時刻・終了時刻を示したラベルデータ(モノフォンラベル)があります。
音素に関しては、OpenJTalkのものを使用しており、無声母音も含まれます(OpenJTalkによる機械的推定と、作成者y-chanの耳で聞いて無声だろうと判断したものを無声母音としています)
accent_and_phoneme*.csvはアクセントと音素を記しています。アクセントに関しては、OpenJTalkによる機械的推定を作成者y-chanが手動で修正したものです。
疲れていたなどで、一部アクセント情報が誤っている可能性もありますが、最初に記録を取った時のまま公開します。
accent*.csvはアクセントのみを記しています。
おまけとして、accent_and_phoneme*.csvをaccent*.csvに変換するスクリプト(extract_accent_and_phoneme.py)と、アクセント情報をnumpyの配列ファイル(.npy)に変換するスクリプト(convert_accent.py)を同梱しています。
更に、ITAコーパスをこれから読むといった方向けに、アクセント情報が見やすいVOICEVOX(0.10.4)プロジェクトファイルを公開しています(vvproj内)
アクセント確認用プロジェクトなので、再生はできません。
また、こちらもおまけとしてプロジェクト生成スクリプト(vv_create.py)を同梱しています。
アクセント記号について
母音音素時にアクセント記号が来るようにデータを作成していますが、稀にヒューマンエラーによる例外が存在します。 もしよろしければ、修正PRを送っていただけると助かります。
| アクセント記号 | アクセント記号の意味 |
|---|---|
[ | ピッチ上がり |
] | ピッチ下がり(アクセント核) |
# | アクセント境界 |
? | アクセント境界(疑問形) |
_ | アクセント情報に変化なし |
これらアクセント情報は、以下の研究報告をもとに作成した
藤井 一貴, 齋藤 佑樹, 猿渡 洋, 韻律情報で条件付けされた非自己回帰型End-to-End日本語音声合成の検討, 情報処理学会研究報告, 2021-SLP-138, No. 16, pp. 1-6, 2021.
ライセンス情報
おまけのコード・データ情報共にUnlicenseです。
煮るなり焼くなり好きにしてください。