[草稿]Common Voiceの課題設定

このページは公式です。正確な情報はフォーラムや公式サイトを参照して下さい。


Common Voiceの全体図(おおよそ)
順番 参加する部分 作業 方法 開発(技術的)部分 備考
1 文章コーパス 探すデータセットの素材
追加Sentence CollectorSentence Collectorの開発
レビュー
2 音声コーパス 録音WebアプリWebアプリの開発
検証
3 モデルトレーニング トレーニングデータセット(目標)
4 機能 入力(音声もしくは文章)アプリ

参加方法

データセット生成前の課題設定

  1. 言語の追加
  2. Webアプリの翻訳

文章収集の課題設定

  1. 探す
    1. なにを?(収集する対象の把握)
    2. どこで? どうやって?
    3. 見つけたら:[重要]文章の権利状態の確認
    4. 追加の仕方
  2. 追加
    1. 文体の確認
    2. 追加する

    メモ

  3. レビュー

    メモ

    • レビューは前後のページに移動しても持ち越される
    • 判断できない文は?:無視しても良い

    疑問

    • 不採用の文はどうなる?

音声収集の課題設定

  1. 録音
    1. 音声入力装置(マイク等)を用意する
    2. 文章を読む
    3. 音声が録音されているか確認
    4. クリップを提出

    メモ

    • 録音する際の注意点は?:Common Voiceの録音と検証のやり方
    • 読めない・読みたくない文は?:スキップボタン
    • 不適切な文があったら?:報告ボタン
    • 5クリップ未満でも提出できる
    • 途中で録音を消して終了できる

    疑問

    • マイクが使用できない(声が入力できない)ときは?
  2. 検証
    1. 文章を見ないで、音声を聴く
    2. 次に、文章を見て、音声と合っているか確認する

    メモ

    • 判断できないクリップは?:スキップボタン
    • 不適切な声・文があったら?:報告ボタン