文章の編集について(使用文字の確認)

このページは、多く私見を含みます。
正確な情報は、公式の資料を参照して下さい。


How-to on Common Voice Sentence Collector

前提

参考

数字

公式の資料では「あるべきではない」と書かれています。

しかし、フォーラムで質問してみると、「文脈が明瞭であり、読み方が限定されるのなら」含んでいても可、という回答を得ました(あくまで非公式の見解、私の解釈違いがあるかもしれないことに注意)。
公式の見解に従うなら、文章に含まれているべきではありません。(アラビア数字、漢数字ともに)

使用する場合、読み方に充分に注意を払って下さい。とくに、数字が並んでいるとき。
例えば、「三〇一」は「さんびゃくいち」「さんれいいち」「さんまるいち」と読めます。

単語の一部にある場合は、問題ありません。例えば、緒、言、回り、重、分、三十みそじ九十九里など。

編輯の例

以下の例は読みが明瞭ですが、私の解釈も定かでないので、挙げておきます。

参考

略語

外国語の略字・頭字語は、避けるべきです(読み方が断定できないため)。カタカナに直しても、意味が伝わりにくく、やはり避けるべきです。
例:エイチティーエムエル、シーエスエス、アイキャン

日本語の場合、ほとんど読み方が決まっているので、使用しても問題無いでしょう。

使用の例

ただし、(株)のやうに「かぶ」「かぶしきがいしゃ」と読み方に迷いを抱かせる言葉は、避けるべきです。

句読点・記号

使用は、必要な場合に留める。
記号の読み方は複数あったり、知られていないことがあったり、読むかどうかで話者に混乱を招きます。

日本語の場合、以下が妥当でしょう:

参考

外国語の文字

その言語で用いられている文字のみを使用する。

日本語では、ひらがな・カタカナ・漢字のみを使用します。

例えば、和文でのアルファベットは除外の対象です。今日、混在する文章はたくさんありますが、決まった読み方があるわけでもなく、読み方がわからない人もいます。
外国語を使用する場合は、カタカナに直して下さい(ひらがなでも可能ですが、判りやすさを考慮すれば、カタカナの方が妥当でしょう)。

編輯の例

参考

長さ

10秒以内で読み終えられる長さ。母国語でない人、読み上げるのが苦手な人がいることも留意して下さい。

私見ですが、(句読点を除き)30文字以下。それでも長すぎるかもしれません。
いずれにしろ、長文は期待されていません

参考

  1. 今日は良い天気ですね。(10文字)
  2. 私はそれを恋だなんて思ってないけどね。(18文字)
  3. お父さんは箔が付くからって言うけど、あたしとしちゃどうだって良いね。(32文字)
  4. このサハラというのが本名から取ったにしろ、サハラ砂漠か何かから取ったにしろ、大して興味は無い。(44文字)

好ましい文体

We prefer natural/conversational sentences. While phonetic diversity and different words in sentences is important, we are trying to make recording sentences as much fun as possible. Therefore it would be great if you could try to keep your sentences as natural/engaging as possible.

Government proceedings, books and articles are also great however since the text tends to be a little more formal they are less of a priority.

自然で、会話的な文章。硬い文章でも構いませんが、できるなら「話すのと同じような」感覚で書かれていると、より良いです。

短く、読みやすいこと。

編輯の例

“文章 (sentence)”の定義

Discussion of new guidelines for uploaded sentence validationより:

Although the website is misleadingly called the “Sentence Collector” don’t worry too much whether the text meets the formal definition of a sentence. For example, it’s not necessarily a problem if the text does not include a verb. Any phrase that you could imagine being used as a caption to an image should be OK.

厳密な「文章」の定義を満たす必要は無く、動詞が無くても構わない、ということが言及されています。
画像(絵や写真、ある場面)を説明するような言葉であれば構わない。

文章の例

Post #27でのMichael Maggs氏の例:

Some simple examples:

日本語なら、「教室の戸」「花瓶の載った教卓」でも良い、ということですね。

文章の分割

であるならば、一文を分割して、文数を稼いでも良いかもしれません。

でも、これだと自然会話的とは言えない気がします(私見)。
以下のように編輯するのが良いでしょう。

  1. 高校最後の夏
    • 高校最後の夏だった
    • 高校最後の夏
  2. 教室の戸
    • 教室の戸を開けた
    • 教室に入った
  3. まず眼に入った
    • 先生が眼に入った
    • 先生にがいった
  4. 花瓶の載った教卓
    • 花瓶の載った教卓があった
    • 先生の机に、花瓶が載ってた

疑問点の補完

Sentence collector for Japanese language (日本語の文章について)(フォーラムトピック)
日本語の文章について疑問がある場合は、ぜひこちらで質問して下さい。一緒に考えましょう!

文章収集・CollectorツールのQ&A(自家製)もどうぞ。