さて,「人気」は,なんと読むのだろうか

意外に知られていない難度世界一の落とし穴
http://japan.internet.com/wmnews/20060531/7.html

↑この人は,東京の人なんだろうな.
「東雲」は,おそらく,読めない日本人のほうが多い.

関西の人にとっては,「枚方」のようなもの.


世界一だとは思わないけれども,母国語としていない人々にとって,完全に習得することが難しい言語だとは思う.


さて,表題に書いた「人気」.
なんと読みましたか?

たとえば,「人気のない場所」と書いたときに,

ひとけのないばしょ
にんきのないばしょ

どちらにも読めます.
これは,文脈をみないと識別できない.
場合によっては,文脈をみても識別できないこともある.

上に挙げた URL では,異体字のことを困難さのひとつとして挙げているけれども,それは「読み」が付随すればいいだけのことなので,多くの日本語処理の困難さの中では,大した困難さではない.
そんなことを挙げているから,いつまでたっても,シングルバイトで済んでしまう人たちに,理解されないのだ.

この記事へのコメント

なるひこ
2006年05月31日 23:37
ひらかた、でしたっけ?>枚方
なんつーか、学問的には NOIKE さんの仰ることは全面的に agree ですけど、運用上の話だとこの著者さんの言うことも一理あるかも。
つか、みんなけっこう人の名前の表記とか無頓着なんだもん。人のメールとか見てると。
本質ではないにせよ、企業というヤツはこういう下らないことにコストを払ってしまうモンなのかもしれません。残念ながら。
2006年05月31日 23:50
あれ,この記事って,「コストをかけてない」って話だと思うよ.(片手間にやっているという話)
コストをかけている企業はまっとうに対応しているわけで,そのお金の使い方は,決してくだらなくないと思うよ.
コストをかければ解決できることは,コストをかけるべきだし,解決できるのならば,それは,日本語処理の難しさとは違う話だと思うのですよ.
2006年05月31日 23:52
そうそう.「ひらかた」だよー.
さすが.

じゃぁじゃぁ,「東風」は?
「Tong Poo」じゃないよ(笑)
あっ,R 社の人だから,ご存知か(^^;).
taks-ike
2006年05月31日 23:53
URL先の記事.もうアホかとバカかと…

「日本語の難しさ」と「データの形成・活用法」の二つの問題が混同されていますね.特に後者は誰が管理する云々の問題は完全にお門違いな指摘にしか思えないです.
そりゃどちらも由々しき問題であることは事実ですが,それらに相互的因果関係はないでしょう(全くないとは言いませんが).

というか,こういう記事がまかり通るところから,日本のIT業界のレベルってたかが知れてるなぁと思いました.
なるひこ
2006年06月01日 11:19
おっと表現がマズった。
本来なら払うべきコストを払ってないから、後々でくだらないコストが発生する……ってなことを言いたかったのです。この記事は間違いも多いしピントも外してるけど、少なくともその点については正しいのではないかと。
オイラはいわゆるIT業界人ではない (単なる一プログラマ) なので難しいことは分かりませんが、現場に蔓延するムズムズ感をなんとか論理的に書こうとして失敗したのかな……って思って読みました。
共感できるとしたら、そのムズムズ感に対してかも。
2006年06月01日 19:00
目先の損得勘定に振り回されるのって,イヤだよねぇ.
かといって,あまりにも長~い計画立てられても,実る前につぶれちゃうし.

プログラマって,IT業界人に入らないのか... .
「IT業界」という言葉も,千差万別の定義があるよねぇ.