ルビ。振るべきか。振らざるべきか。 (その2)
たとえば「贈り物」というテキストの、「おく」と「もの」にルビがあるという例を考える。形態素解析では「贈り物」とするものもあるだろうし、「贈り」「物」とするものもあるかもしれない(というか事実いろいろのようだ)。
この場合にどちらの例でも「おくりもの」とは読むのだけれど、振られているルビとは違うという判断から「おくりもの、(おく)り(もの)」のように読んでしまう例もある様子。
といってこれを「おくりもの」とルビを振っておいても、先の例であれば問題ないかもしれないけれど、後者の例ではやはり解析結果とルビが異なるので二重に読み上げてしまったりする状況が発生しうると。
どうするのが望ましいのか。形態素解析の数だけ、あるいは学習の習熟の程度だけ状況が異なるということを思えば、諦めてあくまでもルビとして原本通りに振っておくだけというのが望ましいのか、とも。仮にそれによってうまく再生されないケースがあったとしても。
こうなってくるといっそ青空文庫の傍点のように、画像で表示しているだけでテキストにはまったく影響を与えないようなルビの実現のほうが望ましい、なんてことも考え方としてはあるのかもしれないとも思ったり。すべては読み上げエンジン側にまかせるという。どっちつかずになっていることが問題を生じさせているのかもしれないなあと。
追記:
ことによるとルビがはいっているために正しく解析できないという弊害があったりするのではなかろうかとも。
「贈(おく)り物(もの)」といった感じに XHTML で表現されているとして、ルビがあるので決して「贈り物」としては解析されないのでは? いや、ruby タグに対応しているとそうはでないから大丈夫? しかし、それもまた表示の上でのことでしかないのではないかとか。
EPUB3 ではこのあたりどう考えているのだろう?
| 固定リンク
« コイは水色 | トップページ | オーディオブック »
コメント