書物蔵

古本オモシロガリズム

目次情報の精確度:国会デジデジとざっさくプラスを比較

ちょっとオモシロな計測をしてみた。

かずかぞえ(σ^〜^)

わちきが秘かに○○○○を集めていることはここだけの秘密ぢゃが、この雑誌、巻頭に書斎探訪の写真がある。んで、ここに117名が書斎の写真に写ってをるんぢゃが、皓星社の目次DBではさすがに総目次などから入力しただけあって、117名全部が出てくる。ところがいっぽう国費120億円のほうは96名分しか出てこない。
連載通号から全体が117件なのは確かなので、皓星社は100%採録とわかり、一方、NDLは82%採録。また、NDLは82%のうち、10件ほど記事名とキャプションを取り違えて採録しているようである。どうやら記事標題でなく目次を採用しているらしい(´〜`;)
つまり、目次に頼ったというNDLの記事捕捉率は、7,8割ということになる(。・_・。)ノ
うーん(゜〜゜ )
そのやうなものとして使うしかないのー(=゚ω゚=)
あんまり大したものではありませんということか。。。
でも、量的に他に対抗するものはないからこれを使うしかない。それに、まだこれデータを搭載中らしくて(いつおわんの?)わちきの感覚では戦前期の帝国図書館所蔵雑誌が現状(2013.3)の3倍ぐらいはあるのでは。。。
ってか、これだと、どこまでいっても、皓星社DB「ざっさくプラス」と併用する必要がある、といふことだねぇ(゜〜゜ )
一度、ヨミダスと『読売新聞文芸欄細目』(日外)を比較して、ヨミダスの記事情報には抜けが多い(記事そのものは画像ですべてあるはず)という批評が『日本古書通信』にあったが。。。
このまへ、戦前官報がデジデジに搭載されて、でも思ったより記事データの採録は悪くって(特に現在むしろ意味がでてきた雑報類)、がっかりしたことだったが。。。
ヨミダスの無手勝流ぐちゃぐちゃ路線と、皓星社の総目次流用きっちり路線の中間を行ってしまっている感じ。

一般化、論理化

とまあ、具体的にいへば上記のやうになるのだらうけれど。
んなこたぁ、カズ数えでしかないンで、これでおはっちゃあ、しょーもない(σ^〜^)
この数かぞへからいへることは、あらまほしき目次情報てふものが、

目次の引きうつし(転写)でも、本文標題部の引きうつしでもない

ちゅーことぢゃ。
おそらく、「総目次」の作成者は無意識的にか意識的にか、連載なら統一標題をあたへ、タイトルのない記事には仮タイトルをあたへ、タイトルだけでは意味をなさない・わかりづらいものには補記をし、といふことをしてきた。
さらに、記事として独立しているかいないかの判断もしてきた。
ヨミダスの記事情報がぐちゃぐちゃだとしながらも、それでもなほ有用であるのは、じつはかういったことを、品質の管理に失敗(必ずしも成功していないという意味)しながらも、方向としては(定性的には)正しい方向をたどれたからである。

追記・修正(2013.12.2)

わかりづらい部分に少し表現を足した。
上記にように、ヨミダスの記事索引と比較してみると、目次を基本情報として入力したというNDLのデジ化目次の最大の欠点が何かが見えてくる。

広告記事を引けないこと

もちろん、本文記事が独立的に存在するのに、目次にないから引けないことになっちゃふ、という目次vs.細目――ん?(・ω・。) 「細目」のことなんて、図書館情報学ぢゃあ、おしへてくれないのよ――の問題もあるけれど、最大の問題は、

広告が引けない

ことにある。