« 大が小を兼ねるわけでは必ずしもない | トップページ | 消えるルビを解消(たぶん) »

消えるルビを修正したものの

 ルビ振りの不備のパターンがちょっと多めに出てくる作品にあってしまったので、ようやく重い腰をあげて修正。

 ルビを振らずにいてしまうパターン修正は問題なくできたのだった。

 よしよしということで、英文などにはいっている半角スペースが削除されてしまうのも修正しようとしたのだけれど、こちらはちょっと悩んでいる。

 MeCab を通すとどうしても半角スペースは削除されてしまうようなので、これを単純に連結しなおしても元には戻ってくれない。

 それならと元の文字列に漢字が含まれていなければルビ振りの必要がないのだからそのままにするようにしたらよいではないかと思ったら、どうも漢字の判定がおかしなことになっているらしい。 英文だけなのに(半角英数)漢字と思っているらしい。

 これまでは「カナ・かなでない」「全角英数でない」「全角記号でない」といったパターンを用意して、それらではないのを「漢字」ということにしていたのだけれど、半角英数もそこに含まれてしまっているような。 いや、一応それも除外するようにはしているつもりなのだけれど。

 なにかこうスパッと「漢字」を定義できるようなものがないのだろうか、などと無いものねだりしたり。(あるのかもしれないし)

 あるいは、元の文字列に半角空白が含まれていたらそれを後からでも戻すというようなことをすればと思ったりもするのだけれど。

 もう少しあがいてみる。

追記:
 修正できたと思っていたルビ振り。 どうも別のおかしな挙動がでてしまったのでふりだしに戻る。

|
|

« 大が小を兼ねるわけでは必ずしもない | トップページ | 消えるルビを解消(たぶん) »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/28835/55268472

この記事へのトラックバック一覧です: 消えるルビを修正したものの:

« 大が小を兼ねるわけでは必ずしもない | トップページ | 消えるルビを解消(たぶん) »