frame_decoration

「変換用辞書セット2009年版」の編集履歴(バックアップ)一覧はこちら

変換用辞書セット2009年版」(2009/12/31 (木) 11:53:32) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

*変換用辞書セット2009年版 *スリーパーズ日記 #ref(2009_dic_set.zip) (zip 圧縮、504KB)  シン弐くん.txt  カタギリ・ジョー辞書.txt  校閲ぱんだ(旧字).txt  校閲ぱんだ(新字).txt  間違えやすい文字.txt ※「シン弐くん」はルビ情報を随時追加することに。従来までの編集方針を大きく切り替える。74095行(1.1MB)。辞書は肥大化することになるが、すでに、今のところ処理スピードに大きな差は感じられない状態なので、以後もこの方向で進めたい。 *例)硯、躊躇 | |硯|→|硯《すずり》| | |硯《すゞり》|→|硯《すずり》| | |硯《すずり》|→|硯《すずり》| | |躊躇|→|躊躇《ちゅうちょ》| | |躊躇《ちうちよ》|→|躊躇《ちゅうちょ》| | |躊躇《ちゅうちょ》|→|躊躇《ちゅうちょ》| 一行目では、単純にルビを付与。 二行目では、旧がなを現代がなに置換。 三行目では、底本ルビのキープ。 ※ 一行目だけだと、ルビありテキストを変換するさいに「硯《すずり》」が「硯《すずり》《すずり》」のように二重ルビになってしまう。それを回避するために三行目のようなルビ・キープのための行を登録している。 | |躊躇う|→|ためらう| | |躊躇は|→|ためらわ| | |躊躇はう|→|ためらおう| | |躊躇ひ|→|ためらい| | |躊躇ふ|→|ためらう| | |躊躇へ|→|ためらえ| ※「躊躇」を「ためらう」と読んでいるばあいのために、送りがなの活用形をすべて登録。「躊躇(ためら)う」は「ア行四段」、「躊躇(ためら)ふ」は「ハ行四段」活用。 ※「躊躇(ちゅうちょ)」と読ませるばあいは「躊躇する」のように「サ行変格活用」となるので、ア行やハ行の送りがながとブッキングする可能性は、たぶん低い。 ※ 本来なら「ア行四段」の活用もすべて登録してあっていいはずだが、実際には「躊躇う」の一行のみ。これは、当て字「躊躇(ためら)う」の実際の使用頻度が、現代表記版ではまれで、旧字旧かな版での利用のみが多い、というようにかたよっているためだろうと思われる。 *オリジナルの復刻は忠実に。そのぶん、現代表記版は大胆に。 新字新かな辞書「シン弐くん」は、メイン・エンジンにフリーウェア辞書「丸谷君第三版」を使用しています。本家が10890行なので、行数換算で6.8馬力のアップ。パブリックドメインのデジタル復刻といえば青空文庫だけれど、そこでさえ、現代表記版への変換登録数はごく少ない。作業に醍醐味を感じる理由のひとつは、そのあたりかもしれませんね。 *「生への執着」 パンデミック劇場、温暖化劇場、 世論のクリアランス。 十年近く危険な状態がつづいてしまったものの、この一年で「生への執着」がふたたび芽生える。執着することは、強くなる半面、弱くなることでもあるが、いまはすなおに感謝したい。「生への執着」が復活したばかりのものにとっては、ケとヶの大小もパンデミックも大きな問題ではなく、理性をよそおった感情逆なであいの応酬劇のほうが、十年前の個人的な過去の記憶を想起させるので、そこに身をよせることは今後もないだろう。 考える時間があると、どうしても過去の「いやな」記憶に脳内を支配されやすくなる。おそらく今後も「死神さんの来訪」は折々あろうが、どうやら来訪を先延ばしにしてもらうコツがないわけでもないらしい。ひたすら疲れるまで眠くなるまで青空の入力や校正作業をやりつづけ、個々の語彙等を辞書にあたること。博物館や図書館でつたない質問を口にすること。毎週、『ミルクティー*』を発行すること。一日、一日。来年は出会えるだろうか。おとずれた出会いに何回、気がつけるだろうか。 2009.12.29:公開 2009.12.30:更新 しだひろし/PoorBook G3'99 ダウンロード、利用、改変、再配布は自由です。 カウンタ:&counter() ---- #comment
*変換用辞書セット2009年版 *スリーパーズ日記 #ref(2009_dic_set.zip) (zip 圧縮、504KB)  シン弐くん.txt  カタギリ・ジョー辞書.txt  校閲ぱんだ(旧字).txt  校閲ぱんだ(新字).txt  間違えやすい文字.txt ※「シン弐くん」はルビ情報を随時追加することに。従来までの編集方針を大きく切り替える。74095行(1.1MB)。辞書は肥大化することになるが、すでに、今のところ処理スピードに大きな差は感じられない状態なので、以後もこの方向で進めたい。 *例)硯、躊躇 | |硯|→|硯《すずり》| | |硯《すゞり》|→|硯《すずり》| | |硯《すずり》|→|硯《すずり》| | |躊躇|→|躊躇《ちゅうちょ》| | |躊躇《ちうちよ》|→|躊躇《ちゅうちょ》| | |躊躇《ちゅうちょ》|→|躊躇《ちゅうちょ》| 一行目では、単純にルビを付与。 二行目では、旧がなを現代がなに置換。 三行目では、底本ルビのキープ。 ※ 一行目だけだと、ルビありテキストを変換するさいに「硯《すずり》」が「硯《すずり》《すずり》」のように二重ルビになってしまう。それを回避するために三行目のようなルビ・キープのための行を登録している。 | |躊躇う|→|ためらう| | |躊躇は|→|ためらわ| | |躊躇はう|→|ためらおう| | |躊躇ひ|→|ためらい| | |躊躇ふ|→|ためらう| | |躊躇へ|→|ためらえ| ※「躊躇」を「ためらう」と読んでいるばあいのために、送りがなの活用形をすべて登録。「躊躇(ためら)う」は「ア行四段」、「躊躇(ためら)ふ」は「ハ行四段」活用。 ※「躊躇(ちゅうちょ)」と読ませるばあいは「躊躇する」のように「サ行変格活用」となるので、ア行やハ行の送りがながとブッキングする可能性は、たぶん低い。 ※ 本来なら「ア行四段」の活用もすべて登録してあっていいはずだが、実際には「躊躇う」の一行のみ。これは、当て字「躊躇(ためら)う」の実際の使用頻度が、現代表記版ではまれで、旧字旧かな版での利用のみが多い、というようにかたよっているためだろうと思われる。 *オリジナルの復刻は忠実に。そのぶん、現代表記版は大胆に。 新字新かな辞書「シン弐くん」は、メイン・エンジンにフリーウェア辞書「丸谷君第三版」を使用しています。本家が10890行なので、行数換算で6.8馬力のアップ。パブリックドメインのデジタル復刻といえば青空文庫だけれど、そこでさえ、現代表記版への変換登録数はごく少ない。作業に醍醐味を感じる理由のひとつは、そのあたりかもしれませんね。 *「生への執着」 パンデミック劇場、温暖化劇場、 世論のクリアランス。 十年近く危険な状態がつづいてしまったものの、この一年で「生への執着」がふたたび芽生える。執着することは、強くなる半面、弱くなることでもあるが、いまはすなおに感謝したい。「生への執着」が復活したばかりのものにとっては、ケとヶの大小もパンデミックも大きな問題ではなく、理性をよそおった感情逆なであいの応酬劇のほうが、十年前の個人的な過去の記憶を想起させるので、そこに身をよせることは今後もないだろう。 考える時間があると、どうしても過去の「いやな」記憶に脳内を支配されやすくなる。おそらく今後も「死神さんの来訪」は折々あろうが、どうやら来訪を先延ばしにしてもらうコツがないわけでもないらしい。ひたすら疲れるまで眠くなるまで青空の入力や校正作業をやりつづけ、個々の語彙等を辞書にあたること。博物館や図書館でつたない質問を口にすること。毎週、『ミルクティー*』を発行すること。一日、一日。来年は出会えるだろうか。おとずれた出会いに何回、気がつけるだろうか。 2009.12.29:公開 2009.12.30:更新 しだひろし/PoorBook G3'99 ダウンロード、利用、改変、再配布は自由です。 カウンタ:&counter() ---- - あ、ぎゃ〜、出たーー! ごめん(謝) -- しだ (2009-12-31 11:53:32) #comment

表示オプション

横に並べて表示:
変化行の前後のみ表示: