Common VoiceのQ&A(自家製)

2020年10月3日時点での情報です(とくに明記がなければ)。

文章収集・CollectorツールのQ&A(自家製):文章収集全般についてはこちら。

一般的なトラブルシューティング(質問する前に)

  1. フォーラムを検索する
  2. GitHubの問題報告Issuesを検索する
  3. ブラウザに依存する問題なら、各ブラウザのヘルプやフォーラムを検索する
  4. Googleなどの検索エンジンで検索する

公式のQ&Aはないの?

驚くべきことに、プラットフォームのFAQ以外はありません。

私も不満に感じたので、意見を出しておきました(We need a Q&A)。Mozillaのスタッフモデレーターさんから反応をいただいたので、いつかは作られると思います。

句読点や記号は読むの?

読みません。通常、私たちは会話をするとき、句読点(記号)を発音しません。
音声認識システムは句読点(特定の文字)を無視して言葉を認識できますし、システムが発音するときも、句読点は無視するべきです(つまり、人間にとって自然な話し方)。

「明日」とか「昨日」みたいに、複数の読みがある言葉はどうするの?

とくに決まりはありません。好きに読んで下さい。私たちが普段通り話す言葉こそ、Common Voiceが必要としているものです。

読み方に傾向はあっても、私たちは必ずしも同じ読み方をするわけではありません。
音声認識システムは、すべての読みを認識できるべきですし、学習には多様な読み方(発音)が必要です。

語尾の「っ」はどう読むの?

読みません(発音しない)
この用法の明確な定義は無いものの、一般には感嘆語として認識されています。あくまで話者の状態を表現するものであって、明確な発音法は定義されていません(少なくとも、私の調べでは)。

なんで1,000回以上読んでいる人もいるのに、自分は300回しか録音できないの?

一文は一回の録音で充分だからです。Mozillaが途中から録音回数に修正を加えたようです。

プロファイルページで「自分のデータをダウンロード」リンクを開いても、音声ではなくテキストファイルが出てくる

正常な動作です。プロファイルの設定内容がプレーンテキストで出力されます。
私も皆に尋ねて回ったわけではないのですが、同じ疑問を持ったユーザーはいました:"Download My Data" broken?

自分の声のみをダウンロードすることはできません。確かにデータセットからクリップはダウンロードできますが、話者を特定しないことが条件です(例え自分の声を特定する目的であっても、他の人の声が同梱されている以上、特定すべきではありません)。
もし手元に残しておきたいのなら、Common Voiceと自分用に、二重に録音しておくのが良いかもしれません。

「自分のデータをダウンロード」は、紛らわしい言い回しですよね。改善するよう要望を出しておきました(Correct inappropriate link text)。

録音ページで「音声クリップを共有する」ボタンを押しても、Common Voiceのリンクしか出てこない

正常な動作です。Common Voiceのリンク(アドレス)が提供されます。

録音直後のクリップを共有(ダウンロード)したり、公開することはできません。データセットとしてダウンロードはできますが、「自分のデータをダウンロード」リンクの件でも書いたように、クリップの話者は特定されるべきではありません。
署名入りで声を公開したいのなら、二重に録音するなどして、他の場所でアップロードすることをおすすめします(Common Voiceの文章コレクション自体はパブリックドメインであり、自由に利用できます)。

「音声クリップを共有する」は、非常に誤解を招きやすい表記だと感じたので、改善の要望を出しておきました(Correct inappropriate link text)。

音声クリップが聞こえない

様々な要因があるので、私は答えられません。一般的なトラブルシューティングを参照して下さい。

いくつか心当たりを挙げておきます。

原因1:録音ミス

原因2:ブラウザ、デバイスの設定

もしあなたがFirefoxを使っているなら、support.mozilla.org、別名SUMOのフォーラムに頼ってみるのも手です(質問の投稿にはFirefox アカウントが必要です。また、2020年10月20日現在、日本語では利用できません)。MozillaZine.jp フォーラムでは日本語にて検索・質問ができます。

症状に関して、Googleなどで検索してみて下さい。

プロジェクトの責任者は?

参照:QA/Common voice - MozillaWiki

プラットフォームのロボットっぽいやつは何?

ファイル名がmars.svgなので、もしかしたらMars(マーズ、マルス)って名前なのかもしれません。
青いやつ緑のやつとの関係は何なのか、ロボットなのか、誰がデザインしたのか、など、質問してみました(Common Voice character's name)。

感想とか送りたいけど、英語ができない(´・ω・`)

私は全文自動翻訳です。でも何とかやり取りできてます。

フォーラムには、日本語の投稿を英語に翻訳してくれる人もいます!

機械翻訳ならDeepL翻訳がおすすめです。Google 翻訳くらべて、割かし自然に翻訳してくれます。