外字注記の抽出

※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。

外字注記の抽出


これまで


[ \r[ regex
] ]\r regex
【 \r【 regex
】 】\r regex
[ \r[ regex
] ]\r regex
〔 \r〔 regex
〕 〕\r regex

検索置換ラクダv1.01 で上記処理をほどこしたあと、「#」を検索。


これまでの欠点は、外字注記の先頭にある※印を除外していた。主目的が、外字注記のコレクションだったから。今回、「【テキスト中に現れる記号について】の変換」をおこなうにあたっては、※のあるものはあるままに、※のないものはないままに抽出したうえで、変換リストを作成・変換することになる。

そこで、これまでの上記処理を、下記のように追加変更。

※[ \r※[ regex
※【 \r※【 regex
※[ \r※[ regex

[ \r[ regex
] ]\r regex
【 \r【 regex
】 】\r regex
[ \r[ regex
] ]\r regex
〔 \r〔 regex
〕 〕\r regex

カッコの直前に※のあるばあいは、※の直前で改行。重複処理はおこなわないはずなので、置換リスト後半にあるコマンドは該当する注記では無効化される(はず)。

……とおもったら、結果、期待はずれ。
重複処理してるということだろうか。

では、しようがないので、これまでの処理はそのまま。
くわえて、下記のように二重処理をほどこす。

※\r[ \r※[ regex
※\r【 \r※【 regex
※\r[ \r※[ regex

どうやら、期待どおりに処理ができた……ような気がする。二重処理はめんどうだけれど、ほかにいい方法がおもいつかないのだから、しかたがないじゃん。



2008.5.1
しだひろし/PoorBook G3'99
翻訳・朗読・転載は自由です。

名前:
コメント: