「変換用辞書セット2015年版」の編集履歴(バックアップ)一覧はこちら
「変換用辞書セット2015年版」(2016/04/24 (日) 17:13:32) の最新版変更点
追加された行は緑色になります。
削除された行は赤色になります。
*変換用辞書セット2009年版
2009年版シン弐くん 74095行(1.1MB)
http://www33.atwiki.jp/asterisk99/pages/151.html
*変換用辞書セット2013年版
2013年版シン弐くん 85150行(1.5MB)
http://www33.atwiki.jp/asterisk99/pages/414.html
*変換用辞書セット2015年版
2015年版シン弐くん 86275行(1.5MB)
#ref(2015_dic_set.zip)
(zip 圧縮、599KB)
シン弐くん.txt
カタギリ・ジョー辞書.txt
校閲ぱんだ(旧字).txt
校閲ぱんだ(新字).txt
間違えやすい文字.txt
※ メモ:「間違えやすい文字」の後半部分は、書き換え部分の色指定がまだ。ほかにも要修正あり。[熱] の行も要修正。
※ これまでは変換語句の追加拡張を基本にしていたが、精度が向上するとともに、ムリな変換指定の部分が決まって誤変換することに。ここ一、二年は追加拡張よりも、誤変換の原因となるムリな変換指定行のブラッシュアップにつとめた。
※「誤変換の原因となるムリな変換指定」というのは具体的にいうと、
移し うつし
移す うつす
移せ うつせ
たとえば、こんなふうに漢字をかなに開こうとすると、「推移」「変移」「遷移」というふうに語尾が「移」の熟語の誤変換率が高くなる。いままでは、誤変換発生のたびにそれぞれ、
推移 推移
変移 変移
遷移 遷移
……のような誤変換回避用の行を追加していたが、この方法だと該当する熟語を延々と追加しつづけなくてはいけない。これでは辞書が肥大するばかり。根本原因は「移し」「移す」のような「漢字一字+かな一字」という変換指定があまりにも無謀なのだということがわかっていたので、そこで、
移し// うつし
移す// うつす
移せ// うつせ
のように、ダブルの半角スラッシュを入れて誤変換を回避。誤変換の原因となっていた行そのものを削除してしまってもいいのだけれど、それではのちのち、削除したことを忘れてふたたび同じ変換指定を記述するおそれがある。そこで本文中にまずありえない文字列として、ダブルの半角スラッシュを入れて誤変換原因の行を温存しておく。辞書をブラウジング、ブラッシュアップしてる際にも眼につきやすい。
移らうと うつろうと
移れ うつれ
移ろは うつろわ
移ろはう うつろおう
移ろひ うつろい
移ろふ うつろう
移ろへ うつろえ
また、上記の例のように「移」プラスかな二字以上、あるいは日本語の熟語の成り立ち上、熟語プラス「ラ行」ではじまる条件はかなりしぼられそうな気がするので、これらに該当する行は積極的に温存追加する。
これで追加行の無限地獄から抜け出せる。辞書の肥大化はテキスト変換のスピードにも大きく影響するので、今後はさらにシェイプアップする方向で。
*ユー・ガット・ヘール♪
ところで、11月から朝刊配達をはじめました。バイク(Cub)もはじめて。冬道も。150件近い配達先をおぼえて、主要紙ほか諸紙の種類を確実に投函。立ちゴケ、カーブゴケもすでに経験。体のあちこちにアザやら打ち身やらねんざやら。
このトシで新聞配達とは、……とわれながら苦笑いするしかありませんが、長いひきこもりからの第一歩としては、なかなかに刺激的な毎日がはじまりました。深夜三時、四時にはいかいするマスク姿の高齢者やら、ネコやらなにやらの小動物やら。
毎日、数時間バイクにまたがることは、おもいがけなくもシェイプアップマシンにまたがってる効果があるようで。ちょくちょくトイレにもいけないから、仕事前は水分補給もひかえめになるし。ちょっとやばいくらいの体重減に驚き。
そんなこんなで、かんじんの毎週発行が完全にとどこおっています。副業のほうがおちつくまで、いましばらくお待ちください。
むー、自分の近況報告だけになってしまった。。。
「好きな花はデイジー」
12.29 5:05 PM
長瀬、ペンタトニック、Eat the rich。
2015.12.31 公開
2016.1.5 更新
しだひろし/PoorBook G3'99
転載・印刷・翻訳は自由です。
カウンタ:&counter()
----
- あの書店、なくなったのかあ。。。しばらく、行ってなかったからなあ。 -- しだ (2015-12-31 09:10:03)
#comment
*変換用辞書セット2009年版
2009年版シン弐くん 74095行(1.1MB)
http://www33.atwiki.jp/asterisk99/pages/151.html
*変換用辞書セット2013年版
2013年版シン弐くん 85150行(1.5MB)
http://www33.atwiki.jp/asterisk99/pages/414.html
*変換用辞書セット2015年版
2015年版シン弐くん 86275行(1.5MB)
#ref(2015_dic_set.zip)
(zip 圧縮、599KB)
シン弐くん.txt
カタギリ・ジョー辞書.txt
校閲ぱんだ(旧字).txt
校閲ぱんだ(新字).txt
間違えやすい文字.txt
※ メモ:「間違えやすい文字」の後半部分は、書き換え部分の色指定がまだ。ほかにも要修正あり。[熱] の行も要修正。
※ これまでは変換語句の追加拡張を基本にしていたが、精度が向上するとともに、ムリな変換指定の部分が決まって誤変換することに。ここ一、二年は追加拡張よりも、誤変換の原因となるムリな変換指定行のブラッシュアップにつとめた。
※「誤変換の原因となるムリな変換指定」というのは具体的にいうと、
移し うつし
移す うつす
移せ うつせ
たとえば、こんなふうに漢字をかなに開こうとすると、「推移」「変移」「遷移」というふうに語尾が「移」の熟語の誤変換率が高くなる。いままでは、誤変換発生のたびにそれぞれ、
推移 推移
変移 変移
遷移 遷移
……のような誤変換回避用の行を追加していたが、この方法だと該当する熟語を延々と追加しつづけなくてはいけない。これでは辞書が肥大するばかり。根本原因は「移し」「移す」のような「漢字一字+かな一字」という変換指定があまりにも無謀なのだということがわかっていたので、そこで、
移し// うつし
移す// うつす
移せ// うつせ
のように、ダブルの半角スラッシュを入れて誤変換を回避。誤変換の原因となっていた行そのものを削除してしまってもいいのだけれど、それではのちのち、削除したことを忘れてふたたび同じ変換指定を記述するおそれがある。そこで本文中にまずありえない文字列として、ダブルの半角スラッシュを入れて誤変換原因の行を温存しておく。辞書をブラウジング、ブラッシュアップしてる際にも眼につきやすい。
移らうと うつろうと
移れ うつれ
移ろは うつろわ
移ろはう うつろおう
移ろひ うつろい
移ろふ うつろう
移ろへ うつろえ
また、上記の例のように「移」プラスかな二字以上、あるいは日本語の熟語の成り立ち上、熟語プラス「ラ行」ではじまる条件はかなりしぼられそうな気がするので、これらに該当する行は積極的に温存追加する。
これで追加行の無限地獄から抜け出せる。辞書の肥大化はテキスト変換のスピードにも大きく影響するので、今後はさらにシェイプアップする方向で。
*ユー・ガット・ヘール♪
ところで、11月から朝刊配達をはじめました。バイク(Cub)もはじめて。冬道も。150件近い配達先をおぼえて、主要紙ほか諸紙の種類を確実に投函。立ちゴケ、カーブゴケもすでに経験。体のあちこちにアザやら打ち身やらねんざやら。
このトシで新聞配達とは、……とわれながら苦笑いするしかありませんが、長いひきこもりからの第一歩としては、なかなかに刺激的な毎日がはじまりました。深夜三時、四時にはいかいするマスク姿の高齢者やら、ネコやらなにやらの小動物やら。
毎日、数時間バイクにまたがることは、おもいがけなくもシェイプアップマシンにまたがってる効果があるようで。ちょくちょくトイレにもいけないから、仕事前は水分補給もひかえめになるし。ちょっとやばいくらいの体重減に驚き。
そんなこんなで、かんじんの毎週発行が完全にとどこおっています。副業のほうがおちつくまで、いましばらくお待ちください。
むー、自分の近況報告だけになってしまった。。。
「好きな花はデイジー」
12.29 5:05 PM
長瀬、ペンタトニック、Eat the rich。
2015.12.31 公開
2016.1.5 更新
しだひろし/PoorBook G3'99
転載・印刷・翻訳は自由です。
カウンタ:&counter()
----
- あの書店、なくなったのかあ。。。しばらく、行ってなかったからなあ。 -- しだ (2015-12-31 09:10:03)
- ささいなことですが、サイト名のアスタリスクを半角から全角に変えてみました。たぶんこっちのほうがトラブルないかと。。。 -- しだ (2016-04-24 17:13:32)
#comment