変換:外字注記+アクセント分解

※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。

変換:外字注記+アクセント分解


その1

対象:あく・芥川竜之介(353)
時間:およそ30分(1800秒)
1件あたりの処理時間:1800秒/353件 ≒5.1秒
※ 外字注記変換辞書が2866行、アクセント分解変換辞書が913行。
※ 外字注記のみの処理とくらべて、ちょうど倍の時間がかかった。

その2

対象:こう・幸田露伴(35)
時間:およそ3分(180秒)
1件あたりの処理時間:180秒/35件 ≒5.1秒

結果

※ 芥川竜之介と幸田露伴の1件あたりの処理時間はいずれも5.1秒。
※ 230.4MB×6分 =1382.4分 ≒23時間
※ 6853件×5.1秒 ≒34950.3秒 582.505分 9.7時間 ?

外字注記とアクセント分解のをいちどに処理するほうが、手数が減る。ところが、処理時間は、倍の時間がかかった。手数をはぶくか、時間をとるか。

a)アクセント分解の作品群      1177件
b)外字注記の作品群         5520件
 【#】 2件
 [#] 5518件
c)外字注記+アクセント分解の作品群 5841件
d)処理不要の作品群         1012件(=6853−5841)

6853件のなかからd)を削除。第一段階にa)とc)を抽出して処理。第二段階にb)とc)を抽出して処理。

仮にd)処理不要の作品群1012件を処理対象にふくんだままにすると、1012件×5.1秒として5161.2秒≒86分が余計な作業時間。

5841−5520件(c)からb)をひく)=321件。=外字注記 and アクセント分解321件×5.1秒として1637.1秒≒27.3分。

1177−321件=856件。純粋にアクセント分解の変換処理だけで作業がすむ作品数。856件×2.6秒として2225.6秒≒37分。

856件  37分
321件  27.3分
5520件 4時間(≒239.2分=14352秒=5520件×2.6秒)
1012件 0分
total  5時間?

totalの件数があわない。どこかおかしい。それから5時間には作業時間に分類にかかる時間がふくまれていない。手作業での分類は、ちょっと考えたくない。やるとしたらUnix。



公開:2008.4.11
更新:2008.4.11
しだひろし/PoorBook G3'99
翻訳・朗読・転載は自由です。

名前:
コメント: