MS-IMEでのユニコード文字の一括登録
まだまだ暑いけれど、風の中に少しひんやりしたものを感じられた。
セミの鳴き声も少なくなってきたし、種類も変わってきているね。
MS-IMEでのユニコード文字の一括登録(一括インポート)について、あまり情報がないようなので、記録として残しておこうと思う。
ふと思って、ユニコード文字をMS-IMEに登録したいと思った。
1件1件登録する時は、ユニコードの文字でも問題なく登録出来た。
1件1件の登録で出来るということは、絶対に一括登録でも出来るということだ、と思った。
でも、「一般的なやり方」では、一括登録では、ユニコード文字は登録出来ない。
MS-IMEの一括登録は、Shift-JIS形式のファイルを対象としているから。
古い名残りだね。
一応、UTF-8でBOMあり、BOMなしでやってみたけれど、案の定、ダメ。
もしかして、と思って、UTF-16でやってみたけれど、ダメだった。でも...後述。
検索してみると、そういうことなんだ、というやり方を見つけた。
まずは、登録したいユニコード文字、この場合は、絵文字、をこういう感じでテキストファイルとして作成する。
:うれしい(TAB)😀(TAB)顔文字(TAB)絵文字 嬉しい
:かなしい(TAB)😿(TAB)顔文字(TAB)絵文字 悲しい
:わらう(TAB)🤣(TAB)顔文字(TAB)絵文字 笑う
:くるま(TAB)🚜(TAB)顔文字(TAB)絵文字 車
上記の場合、「:(なんちゃら)」で、その絵文字が出るようにしている。
普通に「なんちゃら(うれしいとかかなしい)」と変換した時に出ないように。
「(TAB)」は、タブキー(\t)のこと。
テキストエディターによってやり方は違うけれど、保存形式として、このようにする。
UTF-16LE BOM付き、改行コードCR+LF
これであれば、MS-IMEでも一括登録が出来るようだ。
僕もUTF-16でやってみたけれど、形式が違っていたみたい。
この辺の情報があまり一般的ではないようなのは困ったものだ。
(なんでUTF-8でないのかは不思議。
この形式、VB.NETのiniファイルの保存フォーマットと同じだ。この形式にしておけば、マルチランゲージ対応が可能。)
このやり方を知っていれば、他のIME用に作られたユニコード辞書を変換すれば、MS-IMEにも登録出来る、ということだ。
ただ、「品詞」の種類はあまり多くないので、それには気を付けよう。
MS-IMEでも、ちゃんとユニコード対応になっていたんだね。(笑)
次に、漢字変換で、そういう使い方があったのか!という話。
読めない漢字が出てきたら、今のご時世であれば、ネットで調べると思う。
根気強い人なら(笑)、手書き入力を使うだろう。
そんなことしなくても、こうすればいい。
(1)メモ帳でも何でもいいので、書き込み可能な領域に、その漢字をコピペしておく。
(2)その漢字を選択状態にする
(3)その状態で、「Winキー+/」を押す。もしくは、「変換」キーを押す
(僕のキーボードは英語キーボードなので、「変換」キーでは試せていない。)
すると、再変換されるので、そこに読みが出ているかもしれない。
MS-IMEもGoogle日本語入力でも出来ると思う。
なるほどなぁ、と思った。
これはちょっとした便利機能だと思う。
| 固定リンク
「パソコン・インターネット」カテゴリの記事
- とうとう来てしまった(2024.12.04)
- 定例のアップデート(2024.11.28)
- 今日はどうだったか(2024.11.22)
- 何かが降ってきた(2024.11.21)
- 画面内の文字をテキスト化(2024.11.19)
コメント