音楽とソフト - pCov

 
→ HOME
→ mp3
→ 動画@nicovideo
→ 動画@YouTube
→ ソフトウェア
→ ブログ
 

pCov - 音声合成用コーパスのカバー率を測定するソフト。

 

title image of pCov

 

------------------
<概要>
pCovは音声合成コーパスの収録テキスト等のカバー率を測定するソフトです。主にUTAU向け連続音声収録テキストを主な解析対象としていますが、他の歌声・音声合成でも使えるかもしれません。

 

UTAU界隈では複数種の収録テキストが公開されています。短時間で収録できるものからなるべくカバー率を上げた連続音までと様々です。誰にとってもベストな収録テキストを作ることはできないため、その人のそのときの状況に応じて最適なテキストを選んだり自作したりすることが今後もあると思います。

 

また、自作したテキストに抜けはないか、発声wavファイルに抜けはないかを調べたくなることもあると思います。

 

pCovはそのようなときのための支援ツールであり、指定した収録テキストや収録済みwavファイルにVCVの音の組み合わせが何回出てくるかやカバー率等を測定します。

 

pCovはそのようなときのための支援ツールであり、pCovは主にUTAU向き音源の解析を前提としていますが、Sinsyのxml形式にも対応しています。Sinsyでは曲を歌ったwavファイル+xmlファイルから合成データを作りますが、既存曲の歌詞ではカバーできない音の組み合わせが出てくる可能性大です。そこで例えばpCovにxmlを入力し、カバーしていない音を別途収録させることで収録漏れを防ぐことができます。

 

なお、もしこのソフトを使用したことでお使いの PC などに何らかのトラブルが生じても作者は責任を取りませんので、悪しからずご了承下さい。

 

------------------
<ダウンロード>
(最新版)
pCov ver. 2.1 (2.2MB、公開日=2013/10/27)

 

(旧版) (以下のリンク先のうち、4sharedからダウンロードするものではユーザ登録が必要になりましたのでご注意下さい。ver.1.2以降については最新版のリンク先(osdn, ユーザ登録不要)のoldフォルダにもあります)
pCov ver. 2.0 (2.2MB、公開日=2013/10/26)
pCov ver. 1.2 (2.1MB、公開日=2011/01/18)
pCov ver. 1.1 (2.1MB、公開日=2010/11/14)
pCov ver. 1.0 (2.1MB、公開日=2010/11/06)

 

------------------
<インストール>
ダウンロードした圧縮ファイルを解凍し、適当なフォルダに置いて下さい。

 

------------------
<アンインストール>
インストールしたフォルダを削除して下さい。

 

------------------
<紹介動画>

 

------------------
<使用方法>
起動はpCovをダブルクリックです。pCovはボタンと度数分布表とで構成されています。窓下半分の度数分布表では、先行母音を列に、当該モーラを行に配置させ、VCVの各組み合わせの出現頻度を表にしています。一度も出現していない組み合わせは黄土色になっています。

 

窓上半分のボタンの機能は以下のとおりです。
ボタン名機能
ファイルを開く 収録用ファイル(収録txtやUTAU用ustなど。詳細は後述)を読んで解析する。
ファイルを開く(追加) 現在までに読み込んだデータに更にファイルを追加読み込みする。
フォルダを開く フォルダ内にある各種ファイル(.txt, .ust, .xml, .wav)を読んで解析する。
フォルダを開く(追加) 現在までに読み込んだデータにさらに、フォルダ内にある各種ファイル(.txt, .ust, .xml, .wav)を追加解析する。
解析 発声回数やカバー率などを表示する。
項目名内容
発声回数 発声回数(UTAUだとwavファイル数)
発声モーラ数 発声するモーラの総数
組み合わせ総数 度数分布表の縦×横の総組み合わせ数
カバー済組み合わせ数 何とおりの組み合わせを発声するか
未カバー組み合わせ数 何とおりの組み合わせを発声していないか
カバー率 カバー済組み合わせ数 / 組み合わせ総数 * 100 [%]
(例) 全組み合わせをカバーすれば100%
収録効率 カバー済組み合わせ数 / 発声モーラ数 * 100 [%]
(例) 組み合わせに重複がなければ100%
未収録パターン(ver.2.0〜) 一度も収録されない音の組み合わせを列挙
csv形式で保存 度数分布の行列をcsv形式でファイル保存する。
リセット 解析結果をリセットする。

 

対応している入力ファイルは以下のとおりです。
形式説明
txt 一つの発声毎に改行または空白を入れて記述する (OREMOのreclist.txtと同じ)。
 
例: 「あいうえお (ポーズ) かきくけこ」なら
  あいうえお
  かきくけこ  ←空白または改行でポーズとみなす
UTAU用ust
Sinsy用xml
UTAUUおよびSinsyのデータファイル。 Sinsyでは既存曲のxmlとその歌唱wavから音声データを学習します。 同様の手法はUTAUでも恐らく可能ということで、 両方の形式に対応させました。
UTAU用音源wav UTAUでは各wavのファイル名を「(発音).wav」としています。 それらのファイル名を基にカバー率の解析を行います。

 

また、ver.1.2からドラッグ&ドロップに対応しました。解析させたいファイルやフォルダをpCovにドロップすると解析されます。また、Ctrlを押しながらドロップすると追加解析されます。
操作説明
ドラッグ&ドロップ ファイルまたはフォルダを読んで新規解析する。
Ctrl+ドラッグ&ドロップ ファイルまたはフォルダを読んで追加解析する。

 

なお、初期化ファイルとして pCov-init.tcl があります。中身はtclスクリプトファイルでありテキストエディタで編集できます。ただしパラメータの変更内容次第では正しく動かない場合もあると思います。その場合は作者のblogやtwitter等でご連絡を頂ければ対応検討いたします。 zipにはcvvc音源用に試作したpCov-init-cvvc.tcl、連続音(vcv)用に作ったpCov-init-vcv.tclが入っています。必要な方をpCov-init.tclというファイル名に変更すれば実行時に設定内容を反映します。

 

------------------
<ライセンス>
pCov は修正BSDライセンスのフリーソフトです。

 

------------------
<不具合連絡・要望>
何かお気づきの点があれば作者ブログのコメントやtwitterなどでお知らせ下さい。なるべく具体的に説明していただけると対応しやすいです。
inserted by FC2 system