外字注記の抽出
これまで
[ \r[ regex
] ]\r regex
【 \r【 regex
】 】\r regex
[ \r[ regex
] ]\r regex
〔 \r〔 regex
〕 〕\r regex
検索置換ラクダv1.01 で上記処理をほどこしたあと、「#」を検索。
これまでの欠点は、外字注記の先頭にある※印を除外していた。主目的が、外字注記のコレクションだったから。今回、「【テキスト中に現れる記号について】の変換」をおこなうにあたっては、※のあるものはあるままに、※のないものはないままに抽出したうえで、変換リストを作成・変換することになる。
そこで、これまでの上記処理を、下記のように追加変更。
※[ \r※[ regex
※【 \r※【 regex
※[ \r※[ regex
[ \r[ regex
] ]\r regex
【 \r【 regex
】 】\r regex
[ \r[ regex
] ]\r regex
〔 \r〔 regex
〕 〕\r regex
カッコの直前に※のあるばあいは、※の直前で改行。重複処理はおこなわないはずなので、置換リスト後半にあるコマンドは該当する注記では無効化される(はず)。
……とおもったら、結果、期待はずれ。
重複処理してるということだろうか。
では、しようがないので、これまでの処理はそのまま。
くわえて、下記のように二重処理をほどこす。
※\r[ \r※[ regex
※\r【 \r※【 regex
※\r[ \r※[ regex
どうやら、期待どおりに処理ができた……ような気がする。二重処理はめんどうだけれど、ほかにいい方法がおもいつかないのだから、しかたがないじゃん。
2008.5.1
しだひろし/PoorBook G3'99
翻訳・朗読・転載は自由です。
最終更新:2008年05月01日 02:53