ということで、Daisy2.02 図書で少なからず問題が見つかったところなどをあげてみる。ncc.html 内にある meta 情報の ncc:files の値については、Pipeline でも特にチェックもしないのか何も言わないようで、実際図書に使用されているファイルがちゃんとアクセスできるのであれば、どんな数字でも問題ないともいえる。ただ、それであるならば、その数字にはたして意味があるのだろうか? ということではあるわけで。
書名右のカッコ内はファイル名。[注意]などとあるのはチェック結果。
■盲導犬の健康管理(Dog-aM)
[注意] ncc:filesの値がサブフォルダの分を含んでいません。
ncc:files : 297 カレント: 297 サブフォルダ: 53
[注意] 次のファイルは使用されていません
bodyt1.jpg
bodyt2.jpg
bodyt3.jpg
coatking.jpg
coolbandana.jpg
dryer.jpg
echo.jpg
glove.jpg
petbottle.jpg
pinbrush.jpg
rubberbrush.jpg
showerhead.jpg
supplement.jpg
■ほじょけんのけんこうかんり(Dog-bM)
[注意] ncc:filesの値がサブフォルダの分を含んでいません。
ncc:files : 283 カレント: 283 サブフォルダ: 53
■元気と幸せのおすそわけ(genkiM2)
次のファイルは図書とは直接関連がありません
readme.txt
■ごん狐(gonM)
[注意] ncc:filesの値がサブフォルダの分を含んでいません。
ncc:files : 24 カレント: 24 サブフォルダ: 10
■マッチ売りの少女(match)
[注意] ncc:filesの値がサブフォルダの分を含んでいません。
ncc:files : 21 カレント: 21 サブフォルダ: 6
■三匹のこぶた(pigs)
[注意] ncc:filesの値が使用ファイル数よりも小さいです。
ncc:files : 27 カレント: 28 サブフォルダ: 8
■DAISYってなんだろう?(wdaisy)
[注意] 次のファイルは実際のファイル名と厳密に同じではありません。
HTML内:01_daisy.mp3
実際 :01_DAISY.mp3
HTML内:03_daisy.mp3
実際 :03_DAISY.mp3
HTML内:04_daisy.mp3
実際 :04_DAISY.mp3
HTML内:05_daisydaisy.mp3
実際 :05_DAISYDAISY.mp3
HTML内:06_daisy.mp3
実際 :06_DAISY.mp3
HTML内:07_dtbdigital_talking_book.mp3
実際 :07_DTBDigital_Talking_Book.mp3
HTML内:08_daisy.mp3
実際 :08_DAISY.mp3
HTML内:09_daisy.mp3
実際 :09_DAISY.mp3
HTML内:12_sigtuna_dar_3_3.mp3
実際 :12_Sigtuna_DAR_3_3.mp3
HTML内:13_mystudio_pc.mp3
実際 :13_MyStudio_PC.mp3
HTML内:14_plextalk_recording_software.mp3
実際 :14_Plextalk_Recording_Software.mp3
HTML内:16_ptr1_1.mp3
実際 :16_PTR1_1.mp3
HTML内:19_lpplayer1010.mp3
実際 :19_LpPlayer1010.mp3
HTML内:20_amis.mp3
実際 :20_AMIS.mp3
HTML内:21_tpbreader.mp3
実際 :21_TPBReader.mp3
HTML内:22_tab_player.mp3
実際 :22_TAB_Player.mp3
HTML内:23_easereader.mp3
実際 :23_EaseReader.mp3
HTML内:24_victor_reader_soft.mp3
実際 :24_Victor_Reader_Soft.mp3
HTML内:26_tk300.mp3
実際 :26_TK300.mp3
HTML内:27_ptr1_1.mp3
実際 :27_PTR1_1.mp3
HTML内:28_scholar.mp3
実際 :28_Scholar.mp3
HTML内:29_victor_reader_classic.mp3
実際 :29_Victor_Reader_Classic.mp3
HTML内:30_victor_reader_classic_.mp3
実際 :30_Victor_Reader_Classic_.mp3
HTML内:31_victor_reader_pro.mp3
実際 :31_Victor_Reader_Pro.mp3
HTML内:32_victor_reader_vibe.mp3
実際 :32_Victor_Reader_Vibe.mp3
HTML内:35_di_maker_2003_2003.mp3
実際 :35_DI_Maker_2003_2003.mp3
HTML内:36_daisy_10_to_20_converter_10__2.mp3
実際 :36_DAISY_10_to_20_Converter_10__2.mp3
HTML内:37_daisy_202_validator_202_.mp3
実際 :37_DAISY_202_Validator_202_.mp3
HTML内:38_daisy_202_regenerator_202_.mp3
実際 :38_DAISY_202_Regenerator_202_.mp3
HTML内:39_ansiniso_z3986_validator_3986_.mp3
実際 :39_ANSINISO_Z3986_Validator_3986_.mp3
HTML内:41_re11_11.mp3
実際 :41_RE11_11.mp3
■バースデーケーキができたよ!(bcake)
以下は DAISY Pipeline によるバリデーション結果のログ出力から。閉じていないタグや css の記述に問題があると言っている。
[INPUT] - !ERROR! - The element type "img" must be terminated by the matching end-tag "</img>". - file:/bcake/bcake_t.html[9,77]
[INPUT] - !ERROR! - Invalid identifier start character. - file:/bcake/style.css[7,0]
[INPUT] - !ERROR! - Invalid identifier start character. - file:/bcake/style.css[8,0]
[INPUT] - !ERROR! - Invalid identifier start character. - file:/bcake/style.css[9,0]
[INPUT] - !ERROR! - { expected. - file:/bcake/style.css[12,0]
[INPUT] - !ERROR! - The element type "img" must be terminated by the matching end-tag "</img>". - file:/bcake/bcake.html[9,79]
[INPUT] - !ERROR! - The element type "br" must be terminated by the matching end-tag "</br>". - file:/bcake/bcake22.html[18,3]
[INPUT] - !ERROR! - The element type "hr" must be terminated by the matching end-tag "</hr>". - file:/bcake/bcake24.html[74,3]
[SYSTEM] - !INFO_FINER! - DAISY 2.02 DTBをバリデートしています。
[INPUT] - !ERROR! - expected total elapsed time 0:01:59.738 but found 0:01:59 - file:/bcake/wxyz000f.smil
[SYSTEM] - !INFO_FINER! - 入力されたファイルセットの完全なバリデート完了。
[SYSTEM] - !INFO! - 9 の問題が見つかりました。
-----
それを受けて、以下のファイルのタグを修正した。
bcake.html line:10, add img end tag , "/"
bcake_t.html line:11, add img end tag, "/"
bcake22.html line:17, add br end tag, '<br clear="all">' => '<br clear="all" />'
bcake24.html line:20,34,48,69, add hr end tag, '<hr>' => '<hr />'
------
[注意] ncc:filesの値がカレントファイル数とも、サブフォルダファイル数を加えた数と
も合いません。
ncc:files : 111 カレント: 87 サブフォルダ: 28
[注意] 次のファイルは実際のファイル名と厳密に同じではありません
HTML内:wxyz000a.mp3
実際 :wxyz000A.mp3
HTML内:wxyz000b.mp3
実際 :wxyz000B.mp3
HTML内:wxyz000c.mp3
実際 :wxyz000C.mp3
HTML内:wxyz000d.mp3
実際 :wxyz000D.mp3
HTML内:wxyz000e.mp3
実際 :wxyz000E.mp3
HTML内:wxyz000f.mp3
実際 :wxyz000F.mp3
HTML内:wxyz001a.mp3
実際 :wxyz001A.mp3
HTML内:wxyz001b.mp3
実際 :wxyz001B.mp3
HTML内:wxyz001c.mp3
実際 :wxyz001C.mp3
HTML内:wxyz001d.mp3
実際 :wxyz001D.mp3
HTML内:images/title.jpg
実際 :images/title.JPG
HTML内:images/4.jpg
実際 :images/4.JPG
HTML内:images/6.jpg
実際 :images/6.JPG
HTML内:images/8.jpg
実際 :images/8.JPG
HTML内:images/10.jpg
実際 :images/10.JPG
HTML内:images/12.jpg
実際 :images/12.JPG
HTML内:images/13-1.jpg
実際 :images/13-1.JPG
HTML内:images/13-2.jpg
実際 :images/13-2.JPG
HTML内:images/13-3.jpg
実際 :images/13-3.JPG
HTML内:images/13-4.jpg
実際 :images/13-4.JPG
HTML内:images/14-1.jpg
実際 :images/14-1.JPG
HTML内:images/14-2.jpg
実際 :images/14-2.JPG
HTML内:images/15.jpg
実際 :images/15.JPG
HTML内:images/16-1.jpg
実際 :images/16-1.JPG
HTML内:images/16-2.jpg
実際 :images/16-2.JPG
HTML内:images/17-1.jpg
実際 :images/17-1.JPG
HTML内:images/17-2.jpg
実際 :images/17-2.JPG
HTML内:images/18.jpg
実際 :images/18.JPG
HTML内:images/19.jpg
実際 :images/19.JPG
HTML内:images/20.jpg
実際 :images/20.JPG
HTML内:images/21.jpg
実際 :images/21.JPG
HTML内:images/22.jpg
実際 :images/22.JPG
HTML内:images/23.jpg
実際 :images/23.JPG
HTML内:images/24.jpg
実際 :images/24.JPG
[注意] 次のファイルは使用されていません
images/26.JPG
images/27.JPG
images/28.JPG
確認したうちで「三匹のこぶた(英語版)」「マッチ売りの少女(英語版)」「百人一首」「おじいさんのランプ」には問題はなかった。
「DAISYってなんだろう?」や「バースデーケーキができたよ!」で、ファイル名の大文字小文字が違っているのは、Windows だから許容されてしまっているもので、PC-UNIX 系であれば異なるものとみなされて図書の再生ができない可能性もある。
再生ソフトウェアなどがほぼ Windows 限定であったがゆえに、見過ごされてきた問題ともいえるのではないかと。Android 用のソフトウェアなどもでてきたこの頃、また Ubuntu などで図書作成をしたいという動きもあるようなので、このあたりはきちんとしていないと問題が顕在化することになるのではないかと。
さらに問題は「バースデーケーキができたよ!」。タグが閉じていないところが多数あるためにそのままでは REXML がエラーをだして処理できない。Pipeline でのエラーも多数。つまりバリデーションしてないのではないか?
また、使用されていない画像がそのまま入っているのもファイルサイズを無駄に大きくしてしまう。図書の説明ファイルとしてのテキストファイルくらいなら、まだ可愛いものだが余分なものは含める必要はないと思う。
ncc:files の数字くらいであれば、まあたいして問題ではないかと思っていたけれど、ファイル名が厳密に合致しないとか、余計なファイルがあるとか、そもそもの html タグなどが間違っているとかがあると、さてどうなのかと。
少なくともタグつけはきちんとした生成ソフトウェアによって間違いなくさせるようにするべきでは。
閑話休題。
タグがきちんとしていれば、これら 2.02 図書を読み込んで、2005-3 図書へ変換させることはできるようになった。Pipeline によるバリデートでもエラーはなく(例によってページ数表記由来のものは別として)、AMIS で問題なく再生できる。
ただし、スタイルシートの適用は基本的に引き継がない。クラスネームが図書ごとに自由に設定されているので、すべてに対応することは不可能なので。github にあげるのはもう少し先に。(まあ、そもそも変換需要があるのかどうかが疑問ではあるのですが)
最近のコメント