日本語の二次熟語ネットワークとその解析

日本語の単語には多くの二字熟語がある。漢字をノードとし、漢字同士が二字熟 語を形成していれば、その二字を繋ぐリンクがあると考える事で、漢字のネット ワークを構築できる。いくつかの国語辞典でこのネットワークを解析すると、全 ての辞書でスモールワールド性や高いクラスター性を示すネットワークであるこ とが確認できた。次数分布は概ねべき的な振る舞いを示したが、小中学生用の初 等的な国語辞典に関してはべき性は見られなかった。これは、初等的な国語辞典 が、一般的な辞典のある種の部分集合として考える事で理解できる。 本発表は、早稲田大学理工学術院の山本健氏の論文[1]及び日本物理学会2009年 秋大会の発表の紹介である。

[1] Ken Yamamoto and Yoshihiro Yamazaki, Physica A 388, 2555(2009).

戻る