鈴木雄介ブログ: 語学

2010年1月30日

語学

文章の順列法則は語学か言葉の知識にとってかなり本質的。文章は少なくとも、書道にあってさえ口語と文語との間になりたち、この法則は古語となったほぼ使われていない用語集の中で観測できる一定量を常にもつ。
松島よひねもすのたりのたり哉
この短い例文の中で現役で使われている用語と用法に関わらず、重畳性（単位順列の執れる複雑さ）とここに介在する手法をときあかした学識はやはり法則性をもつ。語学的にはこれを重複性･repeativityとなづけていい。例えば「助詞ノよ」と「副詞ノ冒頭句ひ」の間に特別な因果関係がないとすると、それらのもつ分類の適切さは1通り×1通りで1重複。ところが「副詞ノひねもす」は順列で4permutation4→4×3×2×1=24通りある内の４つ並びなので4＼24=6重複をもつ。「副詞カ動詞ノのたりのたり」の場合は、のたりの連続語かつ、上述の順列計算に倣い
（3p3÷3)×(〃)=(3･2･1÷3)(〃)=2×2
⇒4重複
となり、ヒネモスの句よりも重複さは低い。つまりくりかえしが使われる程その単位順列にみる複雑さは一定の比例で低まる。このルールは
((XpX)÷Y)log e‥重複比例
X: 文字長さの未知数
Y: 品詞単位長さの未知数
e: 自然対数
の値で増減する。ゆえプログラム言語で既存辞書の機能にくみこめば、重複さという使われてきた言葉の、少なくともこの手順のみでの単語中の複雑さを分析できる。
　この手順を有限回くりかえし、作品とされる文章全体の計測によっては、かなり客観的に或いは平均した語彙の流暢さの中でその読み方の難易度が想像できる最も単純な統計指標でだが表示できる様になる。
　音読みと訓読みの問題は次の手順で解決できる。もし重複比をrepeativity orderの略でreoと書くと、
漢字数reo仮名数⇔XreoY⇔
つまり、「形容動詞カ終助詞ノ哉」と「名詞ノ松島」についていえば
　哉は漢字1文字reo仮名2文字→1reo2、重複さは1p1÷1=1、元となる重複比例は自然対数の底なので、累乗根計算に還元して、1×1^√2≒1×1.414
⇒1.4重複比
この値を口語単位な重複さにかえればいい（重複比は文語用の付加できる演算子）。
　松島も同様に、
2reo4∧reo
=2p2÷2
=1∴2reo4
＝2×1^√4
＝2×2
⇒4重複比
　字学についていえば、字毎の重複さは無駄も入り込みがちな2ビット演算のみでなく、同様によりたやすいものとして日用に卸せる。画数を使う方法。
重複さ÷画数％＝重複率
この単純な手順で、文字毎の複雑さを今より精確に数値で図式化できる。