frame_decoration

「あさっての向かい風 **♡計画」の編集履歴(バックアップ)一覧はこちら

あさっての向かい風 **♡計画」(2008/03/28 (金) 23:42:01) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

あさっての向かい風 **計画 「cards」の中の html ファイルと「作家別テキストファイル」を、JIS X 0213 形式と Unicode 形式へ変換するプロジェクト。包摂文字は考慮に入れない単純な注記変換。図書カードから、それぞれのファイルへリンクを用意。生成ファイル・変換辞書を CD-ROM で提供。 変換後のテキストファイル圧縮とファイル名変更方法が思いつかないので、とりあえずそれは保留。  **計画のおおまかな内容 1.外字注記の抽出・変換辞書の作成。 2.テキストと html ファイルの変換。 3.図書カードへの追加記入。 4.変換不要ファイルの抽出・リスト作成・該当ファイルの削除。 ----------------------------------- ※ ファイルの取り扱い規準については、本家と同じ。 青空文庫早わかり ファイルを利用する http://aozora.gr.jp/guide/nyuumon.html#riyou 青空文庫収録ファイルの取り扱い規準 http://aozora.gr.jp/guide/kijyunn.html >ファイルは、誤りを含んでいる可能性があります。誤りに気付かれた際は、info@aozora.gr.jp宛にご連絡ください。確認、修正の後、ファイルを差し替えます。ただし、ファイルを用いたことで何らかの被害があったとしても、青空文庫側は責めを負いません。  **計画は、2008.3.10 現在、青空文庫未公認プロジェクトなので、誤入力・誤変換の指摘は当 wiki サイト・*99 のコメント欄へ。また、利用被害の責任は負いかねます。ご了承ください。 >ファイルは、有償であるか、無償であるかを問わず、複製し、再配布することができます。/ファイル形式を変換したり、ルビや外字、傍点などの注記形式を変更することも可能です。/異なる底本に合わせて字句をあらためたり、旧かな、旧漢字を現代表記にあらためるといった、用字用語の書き換え、注記の削除などもできます。/対価を支払ったり、了解を求めたりする必要はありません。/複製、再配布にあたって、作品名、著者名、翻訳者名、底本などに関する情報、入力者名、校正者名、ファイルが作成された日付、修正された日付、「青空文庫作成ファイル:」以下の由来に関する注など、これらの情報が削除されないことを希望します。/底本や表記の変更に際しては、どの底本に基づいたファイルにどのような変更を加えたかという作業履歴が明記されることを期待します。 この部分は、そのまま **計画にも適用。なお、**計画で置きかえたファイル・図書カードには下記の文言を「青空文庫作成ファイル:」の直前に付記。 > **計画:文字コードと注記形式の変換 >YYYY年MM月DD日 >編集:しだひろし/PoorBook G3'99 ----------------------------------- aozora 100,674項目 3.56GB(3,640,135,733バイト) ----------------------------------- 今のところ考えられる課題 ・本家ファイルに修正が入ったばあい、作り直し作業が生じる。タイミングの問題。 ・ネットへのアップ方法、サーバの選択。本家カードとの連繋。 ・包摂文字の取り扱い。再点検作業・変換作業。 公開:2008.3.10 更新:2008.3.28 しだひろし/PoorBook G3'99 ---- - 行頭に「*」のある行が見出しに置きかわっているもよう。回避方法不明。 -- しだ (2008-03-10 09:49:54) - 検索置換ラクダv1.01を用いた JIS X 0213 への置換は成功。おそらく同じ方法でhtmlページの変換も可能と推測。ただし、Internet Explorer 5 でフォントを habian にするが表示できない(=0213文字が未表示。)。/Unicode 置換をrakudaX で、と思っていたものの、どうもうまくいかない。正規表現でヒットはするが、置換後の Unicode 文字がすべて○(マル)に化けてしまう。エディタで正規表現をあつかえるものが限られている。LightWayText 4.1.6 MacOS Xでも同様。(もしかしたら、2000 や XP のほうがいけるんじゃないか。)/0213 化だけではつまらないので、Unicode 置換にめどがつくまで計画保留とする。乞う、共謀 Win ユーザー。 -- しだ (2008-03-12 09:21:05) - Unicode 置換成功。が、とてつもなくトロい。 -- しだ (2008-03-15 18:33:32) - 行頭「*」のある行を全角スペースで書き出し、見出し処理をやりすごす。 -- しだ (2008-03-28 00:05:10) #comment
あさっての向かい風 **♡計画 「cards」の中の html ファイルと「作家別テキストファイル」を、JIS X 0213 形式と Unicode 形式へ変換するプロジェクト。包摂文字は考慮に入れない単純な注記変換。図書カードから、それぞれのファイルへリンクを用意。生成ファイル・変換辞書を CD-ROM で提供。 変換後のテキストファイル圧縮とファイル名変更方法が思いつかないので、とりあえずそれは保留。  **♡計画のおおまかな内容 1.外字注記の抽出・変換辞書の作成。 2.テキストと html ファイルの変換。 3.図書カードへの追加記入。 4.変換不要ファイルの抽出・リスト作成・該当ファイルの削除。 ----------------------------------- ※ ファイルの取り扱い規準については、本家と同じ。 青空文庫早わかり ファイルを利用する http://aozora.gr.jp/guide/nyuumon.html#riyou 青空文庫収録ファイルの取り扱い規準 http://aozora.gr.jp/guide/kijyunn.html >ファイルは、誤りを含んでいる可能性があります。誤りに気付かれた際は、info@aozora.gr.jp宛にご連絡ください。確認、修正の後、ファイルを差し替えます。ただし、ファイルを用いたことで何らかの被害があったとしても、青空文庫側は責めを負いません。  **♡計画は、2008.3.10 現在、青空文庫未公認プロジェクトなので、誤入力・誤変換の指摘は当 wiki サイト・*99 のコメント欄へ。また、利用被害の責任は負いかねます。ご了承ください。 >ファイルは、有償であるか、無償であるかを問わず、複製し、再配布することができます。/ファイル形式を変換したり、ルビや外字、傍点などの注記形式を変更することも可能です。/異なる底本に合わせて字句をあらためたり、旧かな、旧漢字を現代表記にあらためるといった、用字用語の書き換え、注記の削除などもできます。/対価を支払ったり、了解を求めたりする必要はありません。/複製、再配布にあたって、作品名、著者名、翻訳者名、底本などに関する情報、入力者名、校正者名、ファイルが作成された日付、修正された日付、「青空文庫作成ファイル:」以下の由来に関する注など、これらの情報が削除されないことを希望します。/底本や表記の変更に際しては、どの底本に基づいたファイルにどのような変更を加えたかという作業履歴が明記されることを期待します。 この部分は、そのまま **♡計画にも適用。なお、**♡計画で置きかえたファイル・図書カードには下記の文言を「青空文庫作成ファイル:」の直前に付記。 > **♡計画:文字コードと注記形式の変換 >YYYY年MM月DD日 >編集:しだひろし/PoorBook G3'99 ----------------------------------- aozora 100,674項目 3.56GB(3,640,135,733バイト) ----------------------------------- 今のところ考えられる課題 ・本家ファイルに修正が入ったばあい、作り直し作業が生じる。タイミングの問題。 ・ネットへのアップ方法、サーバの選択。本家カードとの連繋。 ・包摂文字の取り扱い。再点検作業・変換作業。 公開:2008.3.10 更新:2008.3.28 しだひろし/PoorBook G3'99 ---- - 行頭に「*」のある行が見出しに置きかわっているもよう。回避方法不明。 -- しだ (2008-03-10 09:49:54) - 検索置換ラクダv1.01を用いた JIS X 0213 への置換は成功。おそらく同じ方法でhtmlページの変換も可能と推測。ただし、Internet Explorer 5 でフォントを habian にするが表示できない(=0213文字が未表示。)。/Unicode 置換をrakudaX で、と思っていたものの、どうもうまくいかない。正規表現でヒットはするが、置換後の Unicode 文字がすべて○(マル)に化けてしまう。エディタで正規表現をあつかえるものが限られている。LightWayText 4.1.6 MacOS Xでも同様。(もしかしたら、2000 や XP のほうがいけるんじゃないか。)/0213 化だけではつまらないので、Unicode 置換にめどがつくまで計画保留とする。乞う、共謀 Win ユーザー。 -- しだ (2008-03-12 09:21:05) - Unicode 置換成功。が、とてつもなくトロい。 -- しだ (2008-03-15 18:33:32) - 行頭「*」のある行を全角スペースで書き出し、見出し処理をやりすごす。 -- しだ (2008-03-28 00:05:10) #comment

表示オプション

横に並べて表示:
変化行の前後のみ表示: