Common Voiceの録音と検証のやり方
2020年10月3日時点での情報です。
録音のやり方
- 細かな注意点は、以下の検証のガイドライン案を見て下さい。
- マウスのクリック音が録音に入って気になる、という方はショートカットを試してみて下さい。
- 以下の場合は、できれば報告ボタンを押していただけるとありがたいです。
- 不適切な言葉(あなたが抵抗のある性的表現、ヘイトスピーチ等)
- 文の間違い(誤字脱字、途中で終わっている等)
- 外国語(選択した言語以外の文字。例えば、和文でのアルファベットが該当します)
- 発音が難しい(録音時間は10秒です。その中で言い終わるにはどうも難しい、言いにくい、という場合は気軽に報告して下さい)
- その他、読み上げるのに不適切と思われる文は、選択肢その他から報告して下さい。
- 読めない文、読みたくない文は、スキップして構いません。
- 録音の途中で画面左上の←ボタン(トップページに戻るボタン)を押すと、5クリップ未満でも録音を提出できます。録音を消して終了することもできます。
- できるなら、提出前に再生▷ボタンを押して、録音したクリップを確認してみて下さい。あなたの声は聞こえますか?
検証のやり方
- まず、文章を見ないで、音声だけを聞きます。
- 次に、文章を見て、音声と合っているかどうか確認します。
- 判断できない文章は、スキップして構いません。
ガイドライン案
→ Discussion of new guidelines for recording validation(フォーラムトピック)
文章を「正確に」読み上げているかチェックします。
却下するクリップ
以下は却下して下さい。
- 文章と異なる音声(付け足し、省略、変更、重複)
- 録音が途切れている
- 音声が聞こえない(すべての文章が聞き取れない)
- (文章以外の)言葉として認識できる音が入っている(テレビの音声、同居人の会話など)
- 歌っている
- 合成音声(肉声以外での録音)
例
- 文章:このお味噌汁、おいしいね。
- この味噌汁、おいしいね。(「お」が省略されている)
- このお味噌汁、おいしいなあ。(文章と異なる)
- この……る、おいしいね。(音声が聞こえない)
- この味噌汁、おいし(途中で録音が切れている)
- この味噌し、しる、おいしいね。(繰り返し読んでいる)
- このお味噌汁、おいしいね。なに言ってんの?[話者とは異なる人物の音声](文章にはない、言葉として認識できる音声)
- 文章:ここはあいつの独擅場だ。
- ここはあいつのどくせんじょうだ。
- ここはあいつのどくだんじょうだ。(誤読。「だん」は土偏)
聞き取れれば承認できるクリップ
以下に関しては、「文章の読み上げが、すべて聞こえるなら」OK。聞き取れない場合、却下して下さい。
- ノイズ(くしゃみ・せき、笑い声、マウスのクリック音、その他物音)
- BGM
- 小さい/大きい声
- 叫んだり、ささやいたり等の声の表現
例
- 文章:このお味噌汁、おいしいね。
- このお味噌汁{くしゃみ}おいしいね。
間違っていると思われる発音、発音は合っているが異なるイントネーション(抑揚)に関して
これは非常に難しいところです。上記のトピックを見ても、どうここに書いたら良いかわかりませんでした。
ただ、Common Voiceが様々な発音や訛りを収集していることを考えると、そう易々とクリップを却下するのは、望ましくないことなのかもしれません。
ですから、「聞いて、何を言っているか理解できるか」というところに焦点を当てて下さい。また、母国語でない方がいること、あなたの知らない発音があるかもしれないことにも留意して下さい。あとは、あなたの判断次第です。
ただし、明らかな誤読は却下して下さい。
他、詳しい案内や、これらの判断理由などは、上記のトピックを参照して下さい。
わからないことは、ぜひ質問して下さい!
→ Common VoiceのQ&A(自家製)もどうぞ。