Tips: 検索を効率よく行う


AND検索

あるデータベースに入っている資料A〜Fには、それぞれ表に示すようなキーワードが付与されていると仮定しよう。

表 1 仮想的な書誌データベース例

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

このとき、「たしか女性問題で総理大臣を辞めた人がいたよなぁ。総理大臣ってどんな理由で辞める人が多いのだろう」という疑問をもった人が「退職理由」をキーワードにこのデータベースを検索すると、下の表のようにヒットしてA, C, D, Fの資料が結果として得られる。

表 2 「退職理由」での検索結果

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

しかしながら、よく見るとCは高齢者が引退後どう暮らすかという本のようだし、Dは年金の話らしい、Fは女性がなぜ結婚しないかという話のようなのでこれも知りたいこととは違う。結局、本当に知りたいことが書いてありそうな資料はAだけであり、検索結果のうち実に75%は知りたいことと関係のないノイズであったことがわかる。

この例は資料がたった6件しかなかったので出てきた結果4件を精査することが簡単にできたが、出てきた結果が1000件あったとしたらとても無理である。

このように、検索結果が多すぎてとてもチェックできないと思われる際に便利なのがAND検索である。AND検索では複数のキーワードを指定した際に「全てのキーワードが含まれている資料」だけを検索結果として与える。

上の例で言えば「退職理由」AND「政治家」で検索を行えば、下の表に示すように資料Aだけが両方のキーワードを含んでいることがわかる。上で考察したように、Aは求めている資料らしいので、AND検索を使って検索範囲を狭める(絞り込む)ことによって検索の精度を上げることができた。

表 3 「引退理由」 AND 「政治家」での検索結果

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

OR検索

OR検索は、複数のキーワードのうち一つでも該当するものがあれば検索結果として返すような検索方法である。たとえば「高齢化が日本の労働市場に与えている影響を知りたい」ということで、キーワードとして「高齢化」を用いて検索を行うと、下の表のようにA, C, Dの資料が検索結果として得られる。しかし、Bも高齢化と労働市場に直接関係しそうな資料であるし、Eも若者の雇用に高齢化がどのような影響を与えるかを書いてありそうなので、これが出てこないのは困る。

表 4 「高齢化」での検索結果

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

実際には、検索して該当した結果しか出力されないためBやEのように「本当は検索結果に入って欲しいのだが、キーワードの選び方でたまたまはいらなかった」という資料については存在すら気づかないことになる。これは、適切な情報を得るという検索の目的からすると非常にマズい状況である。

そこで、網羅的に資料をリストアップするために使えるのがOR検索である。検索条件を「高齢化」OR「高齢者雇用」と変えてみると、下の表のように資料BやEも検索結果に出てくるようになり、漏れがなくなる。

表 5 「高齢化」 OR 「高齢者雇用」での検索結果

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

実際の情報検索では、まずOR検索を行って網羅的に資料をリストアップした上でAND検索(絞り込み検索)で資料数を絞り込むようにする方が漏れのない検索が可能である。たとえば図書館のOPACなども絞り込みは追加で行えるように設計されているが、これは「そもそもリストアップされなかった資料は存在すらわからないが、絞り込むのは後でもできる」という設計思想によると考えられる。

NOT検索

NOT検索とは「キーワードが含まれない資料を探す」というケースで用いられる。NOTを単体で使うと大部分の資料が該当してしまうので、NOT検索は必ずAND検索とセットで使われる 。上の表 5を見ると、OR検索で結果を大きくしたためか、元々の問題意識である「高齢化が日本の労働市場に与えている影響を知りたい」とはあまり関係なさそうなA, C, Dなどが混じっている。一つの方法としては、表 5の結果に「ニート」のようなキーワードを追加してAND検索(絞り込み検索)を行うことであるが、もう一つの方法はキーワードを含まないという条件でAND検索(絞り込み検索)を行うことである。

たとえば、「年金」というキーワードを含まないという条件で表 5を絞り込んでみよう。検索式としては、(「高齢化」OR「高齢者雇用」)AND(NOT「年金」)のように書けるが、検索結果は下の表に示したように、A, B, Eとなる。

表 6 (「高齢化」 OR 「高齢者雇用」) AND (NOT「年金」)での検索結果

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

神奈川大学図書館OPACでのAND, OR, NOT検索の使い方

神奈川大学図書館OPACの検索画面は下図に示すような形式になっている。

この中で、検索対象として一番使われるのはおそらく「タイトル」あるいは「キーワード」ということになるだろう。

AND検索
キーワードを「 」(スペース)で区切って入れれば、全てのキーワードを含む資料だけが検索されるAND検索となる
例)ガソリン 価格   → ガソリン AND 価格
OR検索
キーワードを「+」(プラス記号)で区切って入れれば、いずれか1つのキーワードを含む資料が検索されるOR検索となる
例)借金+負債   → 借金 OR 負債
NOT検索
含みたくないキーワードの前に「^」をつけて入力すればNOT検索となる。ただし、NOT検索の場合は必ず他のキーワードとのAND検索として入力する必要がある
例)借金^国債 → 借金 AND (NOT 国債)

例題: 「インターネットを使わないオンライン情報検索について調べたい」

Step1. どれくらい件数があるのか見当がつかないので、まずキーワードとして「情報検索」を指定してOPACで件数を調べてみる

すると、

193件ヒットした。これは全部チェックするには多すぎるので、絞り込むことを考える。
そこで、まず「インターネットを使わない」に着目してNOT検索を行ってみる。

143件に減ったものの、まだちょっと多すぎる。そこで、つぎに「オンライン」を含むという限定を追加してみる。

12件まで減った。これくらいまで減れば本の中身を精査する気にもなるというものだ。

練習問題

1. 図書館のOPACを使って、「耐震に必要な構造計算」について書いてある本を調べてみなさい。検索に使うキーワードや検索式は各自工夫すること(☆)