漢字部品の頻度
NIK-50(私が勝手に50部品に減らしたバージョンを私が勝手にこう呼ぶことにしました)での部品の頻度表です。NIK-Code上の全漢字上で最大限に補完を効かせた時(ローマ字定義ファイルの容量節約のためフルスペルは含めていないわけですが)、各部品が何度出てくるかであって、頻出漢字だろうが使わない漢字だろうが全て1のカウントですのでこのデータ自体の有効性も疑問ですが…。
┏━━━┳━━━┳━━━┳━━━┳━━━┳━━━┳━━━┳━━━┳━━━┳━━━┓ ┃& 30┃シ 170┃ ┃ツ 79┃才 161┃← 192┃ ┃ ┃ ┃刀 33┃ ┃5 49┃冫 136┃ ┃ソ 248┃亠 336┃廾 254┃ ┃ ┃ ┃ク 136┃ ┣━━━╋━━━╋━━━╋━━━╋━━━╋━━━╋━━━╋━━━╋━━━╋━━━┫ ┃ ┃又 57┃厂 207┃フ 67┃¬ 140┃< 194┃二 469┃ナ 35┃L 107┃凵 57┃ ┃ ┃ノ 863┃口 497┃・ 469┃冂 792┃| 519┃一 778┃十 584┃ヽ 45┃乙 75┃ ┣━━━╋━━━╋━━━╋━━━╋━━━╋━━━╋━━━╋━━━╋━━━╋━━━┫ ┃辷 45┃大 90┃ヨ 184┃了 39┃B 52┃人 490┃冖 70┃宀 108┃メ 46┃戎 10┃ ┃土 322┃小 200┃コ 431┃レ 28┃T 275┃イ 180┃ハ 152┃ム 199┃ト 114┃豸 35┃ ┗━━━┻━━━┻━━━┻━━━┻━━━┻━━━┻━━━┻━━━┻━━━┻━━━┛
本来「冂」や「|」の頻度はそんなに高くないと思われるのですが、77あった部品を勝手に50に減らしたせいで、それらが単純な画に集約されて、かなりいびつになっていると思われます。
そもそもこれは、27部品減らして出来た穴に、ホーム上下以外に残っていた部品をそれっぽい位置に適当に詰め込んだだけのでっちあげ配列なわけですが…。(オリジナルの配列はhttp://www.iplab.cs.tsukuba.ac.jp/ssr/1998/research/masui/NIKkeyboard.html)
というわけである程度慣れてしまうよりも前に、配列をまともにしたいので、漢字の出現頻度表どっかにありませんか。最悪このNoteで今まで私が書き散らしてきたテキストをソースにしてもいいのですが、偏りがあり過ぎて逆に悪くなること請け合いですので…。とはいえT-code の文字頻度データは新聞記事から採取したそうですので、こうやってだらだら書いた言葉での頻度データのほうが日常の使用には嬉しいことは嬉しいかもしれません(もちろん酔狂が目的なのですが)。どうなんでしょう?
…それとは別に「戎」の10って凄いな。補完するようにしていると右側にしか来ない部品は使いませんね。「戎」部品のところまで打たないと文字を特定できないのは「茂戊伐賎盛成哉感我俄」だけです。こんなもの残すより「木」があったほうが嬉しいのではないか、しかし四画以上は一律削ったし…なんて考えてしまいます。個人的には「三」とか「工」とか「寸」とか「縦線にユ」(「五」の上線以外とか「偉」の右上)とかあったら省打鍵に役に立ちそうなどと思うのですが、無い部品の追加までは流石に憚られますね…。辞書を全面的に直すのも面倒ですし。