Common VoiceのQ&A(自家製)
Common VoiceのQ&A(自家製)
2020年10月3日時点での情報です(とくに明記がなければ)。
→ 文章収集・CollectorツールのQ&A(自家製):文章収集全般についてはこちら。
一般的なトラブルシューティング(質問する前に)
- フォーラムを検索する
- GitHubの問題報告を検索する
- ブラウザに依存する問題なら、各ブラウザのヘルプやフォーラムを検索する
- Googleなどの検索エンジンで検索する
公式のQ&Aはないの?
驚くべきことに、プラットフォームのFAQ以外はありません。
私も不満に感じたので、意見を出しておきました(We need a Q&A)。Mozillaのスタッフモデレーターさんから反応をいただいたので、いつかは作られると思います。
句読点や記号は読むの?
読みません。通常、私たちは会話をするとき、句読点(記号)を発音しません。
音声認識システムは句読点(特定の文字)を無視して言葉を認識できますし、システムが発音するときも、句読点は無視するべきです(つまり、人間にとって自然な話し方)。
「明日」とか「昨日」みたいに、複数の読みがある言葉はどうするの?
とくに決まりはありません。好きに読んで下さい。私たちが普段通り話す言葉こそ、Common Voiceが必要としているものです。
読み方に傾向はあっても、私たちは必ずしも同じ読み方をするわけではありません。
音声認識システムは、すべての読みを認識できるべきですし、学習には多様な読み方(発音)が必要です。
語尾の「っ」はどう読むの?
読みません(発音しない)。
この用法の明確な定義は無いものの、一般には感嘆語として認識されています。あくまで話者の状態を表現するものであって、明確な発音法は定義されていません(少なくとも、私の調べでは)。
なんで1,000回以上読んでいる人もいるのに、自分は300回しか録音できないの?
一文は一回の録音で充分だからです。Mozillaが途中から録音回数に修正を加えたようです。
プロファイルページで「自分のデータをダウンロード」リンクを開いても、音声ではなくテキストファイルが出てくる
正常な動作です。プロファイルの設定内容がプレーンテキストで出力されます。
私も皆に尋ねて回ったわけではないのですが、同じ疑問を持ったユーザーはいました:"Download My Data" broken?
自分の声のみをダウンロードすることはできません。確かにデータセットからクリップはダウンロードできますが、話者を特定しないことが条件です(例え自分の声を特定する目的であっても、他の人の声が同梱されている以上、特定すべきではありません)。
もし手元に残しておきたいのなら、Common Voiceと自分用に、二重に録音しておくのが良いかもしれません。
「自分のデータをダウンロード」は、紛らわしい言い回しですよね。改善するよう要望を出しておきました(Correct inappropriate link text)。
録音ページで「音声クリップを共有する」ボタンを押しても、Common Voiceのリンクしか出てこない
正常な動作です。Common Voiceのリンク(アドレス)が提供されます。
録音直後のクリップを共有(ダウンロード)したり、公開することはできません。データセットとしてダウンロードはできますが、「自分のデータをダウンロード」リンクの件でも書いたように、クリップの話者は特定されるべきではありません。
署名入りで声を公開したいのなら、二重に録音するなどして、他の場所でアップロードすることをお勧めします(Common Voiceの文章コレクション自体はパブリックドメインであり、自由に利用できます)。
「音声クリップを共有する」は、非常に誤解を招きやすい表記だと感じたので、改善の要望を出しておきました(Correct inappropriate link text)。
音声クリップが聞こえない
- OS(Windows、Mac、Linux等)の設定
- デバイスの設定
- ブラウザの設定
様々な要因があるので、私は答えられません。一般的なトラブルシューティングを参照して下さい。
いくつか心当たりを挙げておきます。
原因1:録音ミス
- 背景の音は聞こえますか? マウスのクリック音、息遣いなど。
- 他の言語のクリップも聞こえませんか?(検証する必要はありません。再生するだけです)
- 音量を上げても聞こえませんか?
原因2:ブラウザ、デバイスの設定
- 他のブラウザでも聞こえませんか?
- 他のサイトの音は聞こえますか? Common Voiceのみが聞こえない?
- 同じブラウザで、他のサイトの音が聞こえますか? クリップを再生すると、ブラウザのタブにスピーカーアイコンが表示されますか? 参考画像:
- 音声を再生してもタブのスピーカーアイコンが出ない場合、音の出力自体ができていない可能性があります。
- ブラウザのデータを削除しても聞こえませんか?
- ブラウザや拡張機能で、音声に関する設定をしていませんか?
- デバイス(マイク、ヘッドホン等)を抜き差ししても聞こえませんか?
もしあなたがFirefoxを使っているなら、support.mozilla.org、別名SUMOのフォーラムに頼ってみるのも手です(質問の投稿にはFirefox アカウントが必要です。また、2020年10月20日現在、日本語では利用できません)。MozillaZine.jp フォーラムでは日本語にて検索・質問ができます。
症状に関して、Googleなどで検索してみて下さい。
見たことのある文章がある/パブリックドメインでない文章がある(その疑いがある)
プロジェクトの責任者は?
参照:QA/Common voice - MozillaWiki
ファイル名がmars.svgなので、もしかしたらMars(マーズ、マルス)って名前なのかもしれません。
青いやつと緑のやつとの関係は何なのか、ロボットなのか、誰がデザインしたのか、など、質問してみました(Common Voice character's name)。
感想とか送りたいけど、英語ができない(´・ω・`)
私は全文自動翻訳です。でも何とかやり取りできてます。
フォーラムには、日本語の投稿を英語に翻訳してくれる人もいます!
機械翻訳ならDeepL翻訳がおすすめです。Google 翻訳と較べて、割かし自然に翻訳してくれます。