ルビ振りの効用
OCR によるテキスト化というのも便利になったもので、よほどということでもなければ意外と認識率は高いようであるし、画像と認識したテキストとをシンクロ表示してくれるので、確認と修正もやりやすくなっている。もっとも、昔試したことがある程度なので、あるいはそれは体験版のようなものだったかもしれないし、そうでなくても十数年は前だろうから、ソフトのレベルにしてもスキャン技術の向上にしても、今とは比べられないような時代だったかもしれない。
とはいえどうしても認識の間違いはあるもので、それがすぐにわかるようなものであればそれほど問題はない。困るのは見た目ではすぐに気がつけない場合。
カタカナの「ト」と漢字の「卜」。カタカナの「ロ」と漢字の「口」。
といったように見かけではすぐには気づけないものもあって、これは後になって慌てることになる。もっともそれは合成音声で機械的に読ませようとするとということであって、人が読む分にはさほど問題にはならない。けれども、機械(PC)にとっては文字コードで処理するのだから、厳密にそれにあわせた読み方をしようとするわけで、いざ読ませてみて気づくということになる。
で、これらの文字について見た目ではなかなかすぐに気づけないので、どうしたものかと思っているけれど、つまりは一度読ませてみるという方法もありではある。ただ、それでは時間もかかる。
同じようなことではあるけれど、一度すべての漢字にルビを振らせてみるというのが案外よいのではないかと。
これによってルビがつくはずのないものについていれば、それは実は漢字であるのだし、ルビがあるべきものになければ、それは実は漢字以外のなにかなのだとわかる。
その程度のチェックであれば、読ませるよりも人の目で流して確認するほうがよほど早いのではなかろうかと。
結果的には一度読ませるのと同じことをしているわけではあるので、好きなほうを選べばよいとは思うものの、多分目視したほうが早いのではないかなと。
余談:
2.02 図書をあれこれしていて思うのは、やはり餅は餅屋として機械的な作業は機械に任せないと、どうにもおれおれ文書になってしまって後がやっかいであるということ。HTML のタグはもうあまりに自由でどうしたものかと思うくらい。どこかで諦めるしかないのではないかと思いはじめたところ。
| 固定リンク
コメント