[草稿]Common Voiceのワークフロー(作業の流れ)

このページは公式です。正確な情報はフォーラムや公式サイトを参照して下さい。


  1. 文章
    • 貢献者:文法に詳しい人
    • ツールSentence Collector
    • すること:パブリックドメインの文を探す、追加する、レビューする
    • 目標:180万文
    • 貢献者:文章を読める人
    • ツールCommon Voice
    • すること:声を録音、検証する
    • 目標:2,000時間分の検証済み音声
  2. トレーニング
    • 貢献者:技術者
    • ツールデータセット
    • すること:用途に合った適切なデータを探す、システムを訓練する
    • 目標:会話を理解するシステムを作る
    • 準備:データセットをダウンロードする
  3. 機能
    • ユーザー:みんな
    • ツール:アプリ
    • すること:声を入力する、アプリに読ませる文を入力する
    • 目標:ユーザーによる
    • 準備:アプリを選ぶ

文章収集の流れ

  1. パブリックドメインの文章を探す
  2. 文章を編輯する
  3. Sentence Collectorに追加する
  4. 文章をレビューする
  5. 承認された文章がCommon Voiceに追加される
  6. ボランティアが文章を読み上げる

録音の流れ

  1. クリップが追加されたデータセットがリリースされる
  2. ユーザーがデータセットをダウンロードする
  3. 技術者が音声認識システムを訓練する(あるいは、他の用途でデータセットを利用する)