外字注記の抽出

［ \r［ regex
］］\r regex
【 \r【 regex
】】\r regex
[ \r[ regex
] ]\r regex
〔 \r〔 regex
〕〕\r regex

検索置換ラクダv1.01 で上記処理をほどこしたあと、「＃」を検索。

これまでの欠点は、外字注記の先頭にある※印を除外していた。主目的が、外字注記のコレクションだったから。今回、「【テキスト中に現れる記号について】の変換」をおこなうにあたっては、※のあるものはあるままに、※のないものはないままに抽出したうえで、変換リストを作成・変換することになる。

そこで、これまでの上記処理を、下記のように追加変更。

※［ \r※［ regex
※【 \r※【 regex
※[ \r※[ regex

［ \r［ regex
］］\r regex
【 \r【 regex
】】\r regex
[ \r[ regex
] ]\r regex
〔 \r〔 regex
〕〕\r regex

カッコの直前に※のあるばあいは、※の直前で改行。重複処理はおこなわないはずなので、置換リスト後半にあるコマンドは該当する注記では無効化される（はず）。

……とおもったら、結果、期待はずれ。
重複処理してるということだろうか。

では、しようがないので、これまでの処理はそのまま。
くわえて、下記のように二重処理をほどこす。

※\r［ \r※［ regex
※\r【 \r※【 regex
※\r[ \r※[ regex

どうやら、期待どおりに処理ができた……ような気がする。二重処理はめんどうだけれど、ほかにいい方法がおもいつかないのだから、しかたがないじゃん。

2008.5.1
しだひろし／PoorBook G3'99
翻訳・朗読・転載は自由です。

タグ：

+ タグ編集

最終更新：2008年05月01日 02:53

＊99 [ e のない e 本]

名前:
コメント: