書物蔵

古本オモシロガリズム

紙屑からお宝発掘o(゚ー゚*o)(ノ*゚ー゚)ノ

1年以上前、「referenceの事例集DBが,意外と実務に役立たない理由」http://d.hatena.ne.jp/shomotsubugyo/20051114/p2なんてもんを書いて、「レファ協」に因縁をつけているわちきであるが。
ちょっとこのデータの集積について、あることを思いついた。
この手のデータ集積は、そのままでは大して役に立たないのは、ちょっとマトモに考えればわかることなんだけれども(わちきはあるヒトからいろいろと聞いてなるほどと)、逆に言えば、多少工夫すれば役に立つようにもなる。
役立たせ方としては3つの方向があって。
ひとつは、過去の回答事例を新しい質問にうまくマッチングさせていくカラクリをつくること。
もうひとつは、レファレンス質問の典型例をピックアップして、教育用教材の材料にすること。
さいごに、データ集積を分析することで、ヒト・ツール・質問などの、認知しづらい意外な関係を見出すこと。
で。
この最後の、データから意外な関係を見つけるということについてちょっとしたアイデアが。

お宝発掘法

まあ、データマイニング(って、このコトバは嫌い。お宝発掘とても訳すがよろし)ってことなんだろーけどね。
このアイデアの基本はある人物が言っていた(のを聞いた)ことがヒントなんだけど、わちきがもっと具体的に敷衍してみますた。
前提として、個々の質問にNDCが(もちろん質問を主題分析しておく)、一方で使われたツール(当然、ネット資源含む)にもNDCなどの書誌データが完備されていること。
って、いちおー言うけど、べつにNDCじゃなくってDDCやUDCだっていいのだけど、日本司書はNDCしか知らんから。それにわちきは日本主義図書館学しとるからね。でもNDLCは論外。一般性ないしなにより記号の階層性がほとんどないから。
たとえば、近代日本小説についての質問に、『近代日本小説辞典』を使って答えたとする。
質問NDC:913.6→ツールNDC:913.6
まあこれがいちばん単純なケースなわけなんだけど、こんなのは発掘作業じゃあむしろノイズ(ってか、これでは司書が閲覧で介入する余地はない)。

質問とツールのタテの関係、ヨコの関係

ではこんなのはどうか。
近代日本小説についての質問に、『日本文学辞典』を使って答えたとすると。
質問NDC:913.6→ツールNDC:910*1
おや、質問とツールのNDCの一致は上から2桁になってしまいましたぞよ。
ちょっとひねって、近代日本小説家についての質問に、それがあまり有名なヒトじゃなくて、出身地の(たとえば奈良の)人名事典で答えることができたとする。
質問NDC:913.6→ツールNDC:281.61
で、さらにさらに、出身地で有名というよりも、小説の舞台(たとえば京都)で有名な作家であれば、どんなツールに出てくる可能性があるかといえば。
もちろん郷土文学辞典(910.29)ということもあろうが、地方人名事典(281.62)であったり、さらにはただの旅行案内(291.62)だったりもする。もしかして、地方年鑑(059.162)が回答につかわれてるかもしんない(地方年鑑には名簿が収録されていることがある)。
質問NDC:913.6→ツールNDC:281.62;910.29;291.62;059.162
とゆーことで。
こういった質問とツールのNDCセットをどんどん集積しき、なおかつ単純事例にはまらないパターンを見出していくと、まさしくデータマイニングになるじゃないすか(゚∀゚ )アヒャ
ここでは上位のケタが一致する関係(913.6→910とか)を(同じジャンルの上位下位ということで)「タテの関係」、上位の数字が違うの(913.6→281.62)を(ジャンルを横断するという意味で)「ヨコの関係」と呼んでおきたい。

生かし方

レファレンス・ツールっちゅーもんは基本的に、NDCのタテの関係で開発される。つまり、913.6(日本近代小説)についての情報は、913.6は言うに及ばず、913(日本小説辞典)や910(日本文学辞典)といったもので救えるよう、出版されるとゆーこと。
でも実際のレファレンス回答じゃあ、そんなことはあまりまい。ってかそれなら利用者は自分でツールを引けばすむ。
ツールを知り、質問のずらし方を心得た「れふぁれんさあ」によって日々、意外な資料、意外な答え方が開発されていて、それを見出せて初めてお宝発掘なのじゃ。
たとえば、910.29がツールに頻出するとせば、-029なぞというトンチキな地理区分モドキなんぞでお茶を濁すでなく、ここは是が非でもきちんと地理区分せねばならんというwarrantになる。
もちろん、ツール開発会社(って日外とTRCくらい?)が、『地名から文学を引く辞典』とかを抜け目なく開発してくれるきっかけにもなろう。
要するに、ツールの新規開発や、NDC標目の改善、NDC表の参照改善などに使えるというわけ。

これは人文学に特に役立つはず

なんどもなんども言うけれど、人文学に予算がばらまかれたり商業出版社が飛びついたりすることは絶対にない。
上記のタテの関係でツールが開発されるのはカネが集まるジャンルに限られる(あるいは篤志家が苦節ウン十年で創ったりすることはあるが)。
たとえば、「漢奸を一覧にしたような辞書はないすか?これからつくりませんか?」ってったって、これからイチからつくるようなことは絶対にできまへーん。
ところがところが
今度ゆまに書房から出るとセンセが言っておった。
これはオタさん実践しおるところの「大東亜トンデモ学人名事典ないすか?」「ありますよ、あれとこれとそれ」とまったく同じ現象じゃないすか(゚∀゚ )

*1:形式細目-033は説明が混乱するので省略。