« 興味深い話題 | トップページ | 暑さを »

2019年8月17日 (土)

MS-IMEでのユニコード文字の一括登録

まだまだ暑いけれど、風の中に少しひんやりしたものを感じられた。

セミの鳴き声も少なくなってきたし、種類も変わってきているね。

 

MS-IMEでのユニコード文字の一括登録(一括インポート)について、あまり情報がないようなので、記録として残しておこうと思う。

ふと思って、ユニコード文字をMS-IMEに登録したいと思った。

1件1件登録する時は、ユニコードの文字でも問題なく登録出来た。
1件1件の登録で出来るということは、絶対に一括登録でも出来るということだ、と思った。

でも、「一般的なやり方」では、一括登録では、ユニコード文字は登録出来ない。

MS-IMEの一括登録は、Shift-JIS形式のファイルを対象としているから。
古い名残りだね。

一応、UTF-8でBOMあり、BOMなしでやってみたけれど、案の定、ダメ。
もしかして、と思って、UTF-16でやってみたけれど、ダメだった。でも...後述。

検索してみると、そういうことなんだ、というやり方を見つけた。

まずは、登録したいユニコード文字、この場合は、絵文字、をこういう感じでテキストファイルとして作成する。

:うれしい(TAB)😀(TAB)顔文字(TAB)絵文字 嬉しい
:かなしい(TAB)😿(TAB)顔文字(TAB)絵文字 悲しい
:わらう(TAB)🤣(TAB)顔文字(TAB)絵文字 笑う
:くるま(TAB)🚜(TAB)顔文字(TAB)絵文字 車

上記の場合、「:(なんちゃら)」で、その絵文字が出るようにしている。
普通に「なんちゃら(うれしいとかかなしい)」と変換した時に出ないように。

「(TAB)」は、タブキー(\t)のこと。

テキストエディターによってやり方は違うけれど、保存形式として、このようにする。

UTF-16LE BOM付き、改行コードCR+LF

これであれば、MS-IMEでも一括登録が出来るようだ。

僕もUTF-16でやってみたけれど、形式が違っていたみたい。

この辺の情報があまり一般的ではないようなのは困ったものだ。
(なんでUTF-8でないのかは不思議。
この形式、VB.NETのiniファイルの保存フォーマットと同じだ。この形式にしておけば、マルチランゲージ対応が可能。)

このやり方を知っていれば、他のIME用に作られたユニコード辞書を変換すれば、MS-IMEにも登録出来る、ということだ。

ただ、「品詞」の種類はあまり多くないので、それには気を付けよう。

MS-IMEでも、ちゃんとユニコード対応になっていたんだね。(笑)

 

次に、漢字変換で、そういう使い方があったのか!という話。

読めない漢字が出てきたら、今のご時世であれば、ネットで調べると思う。
根気強い人なら(笑)、手書き入力を使うだろう。

そんなことしなくても、こうすればいい。

(1)メモ帳でも何でもいいので、書き込み可能な領域に、その漢字をコピペしておく。
(2)その漢字を選択状態にする
(3)その状態で、「Winキー+/」を押す。もしくは、「変換」キーを押す
(僕のキーボードは英語キーボードなので、「変換」キーでは試せていない。)

すると、再変換されるので、そこに読みが出ているかもしれない。

MS-IMEもGoogle日本語入力でも出来ると思う。

なるほどなぁ、と思った。

これはちょっとした便利機能だと思う。

|

« 興味深い話題 | トップページ | 暑さを »

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




« 興味深い話題 | トップページ | 暑さを »