漢字の讀み方について

The way a number is read depends on context and might introduce confusion in the dataset.

このHow toの一節が氣になつて仕方無かつた。

漢字の讀み方は文脈に依存してゐる！　そして多くの漢字は、複數の讀みを持つてゐる。

思ひ附く限り、擧げてみよう。

「どうやつて使ひ分けてゐるの？」「どうしてその言葉を選んだの？」――意外にも、私たちはそれ程意識せず言葉を「選擇」してゐる事が判るだらう。

A. 同じ意味 / 同じ字 / 異なる讀み

恐らく、Jindřich Dítěが懸念してゐた事である：as long as there is not multiple ways to pronounce what you have written in the context it is in, it should be fine.（Jindřich Dítěの返信 [2020-09-21]）

〇（れい、ゼロ、まる）
四（し、よん）
七（しち、なな）
明日（あした、あす、みょうにち）
昨日（きのう、さくじつ）
重複（ちょうふく、じゅうふく）
経緯（けいい、いきさつ）
世論（せろん、せいろん、よろん）

確かに、文脈である程度は讀み方を絞り込む事はできるが、それは「傾向」であつて、絶對ではない。どう讀むかは話者の知識量、生活習慣（例へば職業、讀書量など）に依存する。何なら“好み”で選擇してゐる節さへある。なので、「正しく讀んで下さい」と言はれた時、私たちは困惑する――「どれも正しいよなあ」と。

音聲アルゴリズムは、總ての讀みを理解してゐる必要がある。

B. 同じ意味 / 異なる字 / 同じ讀み

それぞれの字の意味で使ひ分ける。あるいは、好み。

あんこく：暗黒、闇黒
ひざし：日差し、陽射し

C. 異なる意味 / 同じ字 / 異なる讀み

讀み方は、文脈や單語に依存する。

小人（こびと、こども）
最中（さいちゅう、もなか）
落着らくちゃく / 落おち着つく
過去かこ / 過すぎ去さる
明あかるい / 暗くらい / 明暗めいあん

例

ここは人気があります。
- ここは人気にんきがあります。
- ここは人気ひとけがあります。

このやうな短い文脈では、讀み方は判斷できない（もつと文脈――判斷に足る情報――を必要とする）。

D. 異なる意味 / 異なる字 / 同じ讀み

所謂、同音異義語。

けんとう：見当、拳闘、軒灯、健闘、検討、賢答など
せいかく：正確、性格、正格、精確、醒覚など
いし：石、意志、医師、遺志、遺子など
かなう：適う、叶う、敵う

例1

きじにかけているぶぶんがある。
- 記事に書けている部分がある。
- 記事に欠けている部分がある。
- 生地に欠けている部分がある。
- 生地に掛けている部分がある。

日本語の發音は總て平假名で書けるが、ここにさうすべきでない理由がある。勿論、「書けて」と「欠けて」ではイントネーションが違ふ。だが、「記事」と「生地」は同じである。平假名の文章から意味を把握しようとするなら、もつと「背景」が必要になるだらう。

例2

ここではきものをぬぎます。
- ここで履き物を脱ぎます。
- ここでは着物を脱ぎます。

よくある洒落。“Ice Cream”と“I Scream”のやうなものか？　上記の場合、多少發音が違ふが。