我流ローマ字配列の作り方

忘れないうちに私が考えてきたことをメモっておこうと思いました。
ベースとなるのは、AIUEONTSHの9キーです。
ローマ字だけですと重要なのはAIUEONHWYですが、STHが織り成す"st","sh","th"のdigraph(?)の頻度は、日本語でのわ行や拗音を遥かに超えています。
そして、これらの9キーはお互いどの組み合わせでも絡み得ます。ところが、打鍵に使える指は8本ありますので、どれか諦めないといけません。QWERTYならUとNとHが、DvorakならUとIがそれぞれ同じ指になっています。
UとNは"un-"で多用しますし、UとIは"build","guide"等割とあります。この中で最も頻度の少ない組み合わせはNとHではないでしょうか。"inherit"ぐらいしかちょっと出てこないです。Object Pascalではinheritedが予約語ですし、「星を継ぐもの」もありますので惜しいですが。
ちょっと卑怯ながら、私を含めQWERTYに慣れた手はUとNやUとHを同指(しかもUとNは跳躍)で打つことに慣れていますので、同じ指でも上中段とか中下段とかにしておけば、QWERTYと比べ打ち易くなったなあと思えること間違いなしです。
件の超Dvorak(やLuia)では、UとEですが、これは"queue","sequence","europa"等頻出です。しかし元データといいますかテキストによっては全く出てこない可能性がすごく高く思える語群ではあります。ただ、出るときはひたすら出そう(特に"euro"は通貨単位)ですので却下したいですね。超DvorakはQまでUと同じ側ですので、氏の集めたデータにはこれらの語群がほとんど出てこなかったことが想像できます。
…というわけで重ねるならUとN、UとHか、NとHです。
次に、日本語は母音が最後に来る法則から、句読点につなげるため母音の大部分は左側です。ただ、適当に散らさないと左手の負担が半端じゃなくなってしまうので、日本語で母音からさらに続くことが多いIは右側がいいと思ってます。
必然的に上記キーの母音以外は右に来ます。
ところがここで、Hの置き場所が問題となります。
Hは日英ともに頻出シーケンスのど真ん中に出てくることが多い文字です。絡むアルファベットが多いのです。6つも互いに絡みにくいキーを集めないといけない人差し指は問題外です。その上、なにやら私の直感がH小指を推奨しているのです。頻出で絡みも多いなら中指か薬指が筋と思うのですが、中指Hはどうもしっくりきません。Ctrl+Hがバックスペースであることと、は行の力の抜き具合がパワー全開の中指と合わないのだと考えています。やはり力のある指には力のあるSやTこそ相応しい…。
そんなことを考えながらホーム8キーを決めるわけです。ただしEはショートカットとの兼ね合いで左に置くなら中指上段のままが良いでしょうし、右側もU,I,Oが来るなら、QWERTYに習えで上段のほうがいいかもです。右薬指ホームからピリオドへの薬指連打がなぜか中指や小指からピリオドへつなげるよりも楽ですので、右薬指ホームにはOよりももっと文末に来やすいアルファベットを置きたい思惑もあります。
それと…最初にこちらを書くべきでしたが、右小指にアルファベットを置くことを前提に書いてます。セミコロンは必然的に移動してもらうことになりますが、セミコロンを30キーの範囲に置くよりは、英語キーボード風に、シングルクオーテーション/ダブルクオーテーションをひとつのキーにして、それを置いたほうが良いと考えます。最初開き括弧("["/"「")置こうとしてましたが、考えてみれば開き括弧の直前はほぼ改行ですので、実はわりとどうでもいいと思えました。シングルクオーテーションですと、英語(やソースコード)は無論のこと、ローマ字でも"n'"で"n"を連打することなく"ん"を確定させられますのでそこそこ役に立ちそうです。
それからホームの上下を埋めていきますが、Iは絡む頻度の低いYまたは次点でJと、Uは前述のNHまたは同じ理屈でM("ju","yu"はさすがに回避したいです)そして純粋に絡む頻度の低いWと組ませればよいと考えています。Eはほぼ全てと絡み、そしてQWERTYで組になっているDとは"de-","-ed"で多用することもあり、Dvorakで組んでいるJか、でなければKぐらいしか無い…かな。CとEを動かさないならKを置くと"-ck"がありますのでJ一択かも。これでも"eject"がありますが、"check"は勿論前述の"inherit"と比べても軽く無視できる単語ではないかと。それでも昔のアセンブラではキーワードにも使われてたりしますが、"dec-"のQWERTYよりはましという方向で。
後は"put"、"get"や"typewriter"、"information"や"implementation"、"full"、"lerf"、"top"、"right"、"bottom"などが打ち易いように並べます。SからMへ、SからPへの運指もさりげなく大事。
またこの際BJKQVXYZ(とシングルクオーテーション)は重要度低め。ローマ字の主要キーではありませんがFやLのほうが重要です。特にYは想像以上に使わないキーです。BやKはローマ字では多用しますが…。で、なるべくこれらがQWERTYのQやYやBの位置へくるようにします。Qは前述の通りUの逆側。あとできれば"by"や"hy"が同じ指になるのは避けたいところ。
あと"-ing"と"end"は気持ちよく打ててしかも後にピリオドを続け易いことこれ必須。
…短い期間で考えたにしてもこれだけルールを決めれば良さそうな配列ができてもいいと自分でも思うのですが、どう並べてもdigraphが全部消せないんですよ…。いや全部消すのは無理とわかってるのですが、なにぶんネイティブの英語使いでは無いもので、つーかむしろソース書くぐらいで英語そのものは大の苦手ですので、どれが重要とかどれは感覚的に手間取っても構わないとかさっぱりわからんのです。既存の頻度表を頼ると先のUとEみたいなのが抜け落ちそうですし。
それで、自動生成なら諦めもつくかなあ…なんて。