神奈川大学 経済学部
2009年度経済情報処理

第10課

第10課の目標

↑経済情報処理(2009)ホームページに戻る

準備問題
  1. 神奈川大学図書館のWebを見て、OPACがどんなものか見てみる
  2. 総務省統計局のWebを見て、政府統計にどんなものがあるか見てみる
  3. 神奈川大学図書館で使えるデータベースのリストを探してみる

1. 書誌検索

例題1 神奈川大学図書館で「狂牛病」と「プリオン」に関する本を探したい

Step 1. http://libopac.kanagawa-u.ac.jp/webopac/に接続する。正しく接続すれば下のような画面が表示される

Step 2. 「キーワード」欄に探したいキーワードである「狂牛病」と「プリオン」を入力して、「検索」ボタンをクリックする

Step 3. 検索結果が表示される。この場合は7件あったことがわかる

練習問題1

神奈川大学図書館が提供しているOPAC(Online Public Access Catalogue)には「タイトル」という検索項目と「キーワード」という検索項目がある。タイトルは、タイトルに含まれる語句の検索を行うが、キーワードは図書館で主題に関して付与した索引語のほか、タイトル、著者名、出版者、出版地、件名、キーワード、ID、ファイル種別での検索が可能である。つまり、キーワードで検索するほうがより広い範囲での検索が可能になるはず。以下の語を「タイトル」に入れて検索した場合と「キーワード」に入れて検索した場合で結果がどう違うかを確認しなさい

2. 統計の検索

練習問題 2.

以下の情報について調べてみなさい

3. 商用データベース

練習問題 3.

図書館で利用できるデータベース一覧しらべ、自分が使いそうと思うものの説明を読んでみなさい(実際のアクセスは、アクセス数制限があったりするので授業中に一斉に行わないこと)

4. 検索を効率よく行う


4.1 AND検索

あるデータベースに入っている資料A〜Fには、それぞれ表に示すようなキーワードが付与されていると仮定しよう。

表 1 仮想的な書誌データベース例

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

このとき、「たしか女性問題で総理大臣を辞めた人がいたよなぁ。総理大臣ってどんな理由で辞める人が多いのだろう」という疑問をもった人が「退職理由」をキーワードにこのデータベースを検索すると、下の表のようにヒットしてA, C, D, Fの資料が結果として得られる。

表 2 「退職理由」での検索結果

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

しかしながら、よく見るとCは高齢者が引退後どう暮らすかという本のようだし、Dは年金の話らしい、Fは女性がなぜ結婚しないかという話のようなのでこれも知りたいこととは違う。結局、本当に知りたいことが書いてありそうな資料はAだけであり、検索結果のうち実に75%は知りたいことと関係のないノイズであったことがわかる。

この例は資料がたった6件しかなかったので出てきた結果4件を精査することが簡単にできたが、出てきた結果が1000件あったとしたらとても無理である。

このように、検索結果が多すぎてとてもチェックできないと思われる際に便利なのがAND検索である。AND検索では複数のキーワードを指定した際に「全てのキーワードが含まれている資料」だけを検索結果として与える。

上の例で言えば「退職理由」AND「政治家」で検索を行えば、下の表に示すように資料Aだけが両方のキーワードを含んでいることがわかる。上で考察したように、Aは求めている資料らしいので、AND検索を使って検索範囲を狭める(絞り込む)ことによって検索の精度を上げることができた。

表 3 「引退理由」 AND 「政治家」での検索結果

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

4.2 OR検索

OR検索は、複数のキーワードのうち一つでも該当するものがあれば検索結果として返すような検索方法である。たとえば「高齢化が日本の労働市場に与えている影響を知りたい」ということで、キーワードとして「高齢化」を用いて検索を行うと、下の表のようにA, C, Dの資料が検索結果として得られる。しかし、Bも高齢化と労働市場に直接関係しそうな資料であるし、Eも若者の雇用に高齢化がどのような影響を与えるかを書いてありそうなので、これが出てこないのは困る。

表 4 「高齢化」での検索結果

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

実際には、検索して該当した結果しか出力されないためBやEのように「本当は検索結果に入って欲しいのだが、キーワードの選び方でたまたまはいらなかった」という資料については存在すら気づかないことになる。これは、適切な情報を得るという検索の目的からすると非常にマズい状況である。

そこで、網羅的に資料をリストアップするために使えるのがOR検索である。検索条件を「高齢化」OR「高齢者雇用」と変えてみると、下の表のように資料BやEも検索結果に出てくるようになり、漏れがなくなる。

表 5 「高齢化」 OR 「高齢者雇用」での検索結果

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

実際の情報検索では、まずOR検索を行って網羅的に資料をリストアップした上でAND検索(絞り込み検索)で資料数を絞り込むようにする方が漏れのない検索が可能である。たとえば図書館のOPACなども絞り込みは追加で行えるように設計されているが、これは「そもそもリストアップされなかった資料は存在すらわからないが、絞り込むのは後でもできる」という設計思想によると考えられる。

4.3 NOT検索

NOT検索とは「キーワードが含まれない資料を探す」というケースで用いられる。NOTを単体で使うと大部分の資料が該当してしまうので、NOT検索は必ずAND検索とセットで使われる 。上の表 5を見ると、OR検索で結果を大きくしたためか、元々の問題意識である「高齢化が日本の労働市場に与えている影響を知りたい」とはあまり関係なさそうなA, C, Dなどが混じっている。一つの方法としては、表 5の結果に「ニート」のようなキーワードを追加してAND検索(絞り込み検索)を行うことであるが、もう一つの方法はキーワードを含まないという条件でAND検索(絞り込み検索)を行うことである。

たとえば、「年金」というキーワードを含まないという条件で表 5を絞り込んでみよう。検索式としては、(「高齢化」OR「高齢者雇用」)AND(NOT「年金」)のように書けるが、検索結果は下の表に示したように、A, B, Eとなる。

表 6 (「高齢化」 OR 「高齢者雇用」) AND (NOT「年金」)での検索結果

資料名 キーワード1 キーワード2 キーワード3 キーワード4
A 政治家の引き際 政治家 退職理由 女性問題 高齢化
B 高齢者と女性を生かす会社が伸びる 高齢者雇用 女性問題 政治家 ニート
C 悠々生活 高齢化 年金 高齢者雇用 退職理由
D 年金が危ない 少子化 高齢化 年金 退職理由
E 若者暗黒大陸 ニート 若年者雇用 少子化 高齢者雇用
F 結婚しない女たち 晩婚化 退職理由 女性問題 若年者雇用

4.4 神奈川大学図書館OPACでのAND, OR, NOT検索の使い方

神奈川大学図書館OPACの簡易検索画面は下図に示すような形式になっている。

この中で、検索対象として一番使われるのはおそらく「タイトル」あるいは「キーワード」ということになるだろう。

AND検索
キーワードを「 」(スペース)で区切って入れれば、全てのキーワードを含む資料だけが検索されるAND検索となる
例)ガソリン 価格   → 「ガソリン AND 価格」の意味になる
OR検索
キーワードを「+」(プラス記号)で区切って入れれば、いずれか1つのキーワードを含む資料が検索されるOR検索となる
例)借金+負債   → 「借金 OR 負債」の意味になる
NOT検索
含みたくないキーワードの前に「^」をつけて入力すればNOT検索となる。ただし、NOT検索の場合は必ず他のキーワードとのAND検索として入力する必要がある
例)借金^国債 → 「借金 AND (NOT 国債)」の意味になる

例題: 「インターネットを使わないオンライン情報検索について調べたい」

Step1. どれくらい件数があるのか見当がつかないので、まずキーワードとして「情報検索」を指定してOPACで件数を調べてみる

すると、

232件ヒットした。これは全部チェックするには多すぎるので、絞り込むことを考える。
そこで、まず「インターネットを使わない」を条件に追加して再検索してみる。

キーワード欄に「^インターネット」を追加したので、キーワードに「インターネット」が入っているものは除外されたはず。結果は以下の通り。

171件に減ったものの、まだちょっと多すぎる。そこで、つぎに「オンライン」を含むという限定を追加してみる。今度は AND検索になるので、キーワード欄に空白で区切って「オンライン」を書き足せばよい。結果は以下の通り。

13件まで減った。これくらいまで減れば本の中身を精査する気にもなるというものだ。

練習問題 4

1. 図書館のOPACを使って、「耐震に必要な構造計算」について書いてある本を調べてみなさい。検索に使うキーワードや検索式は各自工夫すること(☆)

確認問題
  1. 図書館のOPACを使って、フリーターとパートタイマーの違いが載っていそうな本を調べなさい
  2. 適切な政府統計を使って、2005年10月1日現在の日本の総人口と、横浜市の人口を男女別に調べなさい

↑経済情報処理(2009)ホームページに戻る