日米の電子図書館プロジェクトについて 石川准

1. 概要

1.1. 電子図書館とは

1.2. 電子図書館プロジェクトとは

2. 日本の電子図書館プロジェクト

2.1. 国立国会図書館
2.1.1. 国立国会図書館で現在利用可能な資料
2.1.2. パイロット電子図書館プロジェクト
2.1.3. 国際こども図書館
2.1.4. 国立国会図書館 関西館

2.2. BBCC (新世代通信網実験協議会) 国立国会図書館と連携した電子図書館システムの実証実験

2.3. 次世代電子図書館システム研究開発事業

2.4. 国立情報学研究所(旧学術情報センター)
2.4.1. NACSIS-ELS(電子図書館サービス)
2.4.2. NACSIS Webcat(大学図書館目録検索)

2.5. 大学図書館
2.5.1. 奈良先端科学技術大学院大学
2.5.2. 京都大学電子図書館
2.5.3. 筑波大学電子図書館
2.5.4. 筑波技術短期大学 「視覚障害者のための電子図書館」プロジェクト
2.5.5. 神戸大学 電子アーカイブ

3. 米国の電子図書館

3.1. 議会図書館(Library of Congress)
3.1.1. アメリカの記憶(American Memory)
3.1.2. THOMAS
3.1.3. GLIN (Global Legal Information Network)

3.2. デジタル・ライブラリーズ・イニシアティブ(Digital Libraries Initiative:DLI)
3.2.1. カリフォルニア大学バークレー校
3.2.2. カリフォルニア大学サンタバーバラ校 アレクサンドリア電子図書館
3.2.3. カーネギーメロン大学 infomedeia
3.2.4. イリノイ大学アーバナ・シャンペイン校
3.2.5. ミシガン大学
3.2.6. スタンフォード大学

3.4. TULIP(The University Licensing Program)

4. その他の電子図書館プロジェクト

4.1. 世界図書館(ビブリオテーカ・ウニベルサーリス)

4.2. 青空文庫

5. 電子図書館プロジェクトの問題点

6. 参考文献

6.1. 書籍

6.2. ウェブサイト

1. 概要

1.1. 電子図書館とは
「電子図書館」という言葉に対する明確な定義はない。主に図書情報の電子化、ネットワーク化、電子情報での利用者への提供を行うシステムが「電子図書館」と呼ばれている。
提供される電子情報も、マイクロフィルムや写真撮影した画像データベースに目次、索引のテキストを入力して検索できるようにしたレベルから、本文全体をOCR入力して全文検索を可能としたもの、テキスト入力したもの、PDF化したものなど、さまざまな種類がある。テキストデータのフォーマットも、テキスト形式、HTML、SGML、XMLなどがあるが、SGMLまたはXMLの採用の検討が進んでいる。
OCR入力を利用する場合、入力後の校正と修正にコストがかかる。このため、書籍のページをスキャナなどで読み込んで画像データにし、そのデータを閲覧用にする一方、画像データからOCRで取り込んだテキストを誤りを含む状態のまま全文検索に利用するというシステムが主流となっている。今回調査した中でも、奈良先端科学技術大学院大学や神戸大学の電子アーカイブでは、この画像データ、OCRによる全文検索システムが使用されている。


1.2. 電子図書館プロジェクトとは
電子図書館プロジェクトと呼ばれるものには、日本国内だけでも国立国会図書館をはじめ、大学図書館共同のプロジェクト、各大学図書館固有のプロジェクトなどが存在する。また、海外と共同のプロジェクト、各国のプロジェクトなど、さまざまなプロジェクトがある。電子図書館における資料の電子化、保存、検索、利用者への提供方法などは、プロジェクトごとに異なる。目録情報などの二次的データのメタデータ標準としては、Dublin Core(Dublin Core Meta data Element Set)などが提案されているが、まだすべてのプロジェクトで共通のシステム、フォーマットは存在しない。

2. 日本の電子図書館プロジェクト
日本では国立国会図書館を中心にいくつかの電子図書館プロジェクトが立ち上げられており、大学図書館でも個別に電子化が進められている。国立国会図書館のプロジェクトはシステムの実証実験中で本稼動していないが、大学図書館関連のプロジェクトでは実際に運用されているものもある。
日本で進められている主なプロジェクトを以下に示す。


2.1. 国立国会図書館
国立国会図書館では、1998年5月に「電子図書館構想」を策定し、電子図書館を「図書館が通信ネットワークを介して行う一次情報(資料そのもの)及び二次情報(図書の目録、雑誌記事索引など資料に関する情報)の電子的な提供とそのための基盤」と定義し、図書館の利用者が電気通信ネットワークを介して電子情報を直接利用するサービスを目指している。
電子化する資料としては、当面は、一時情報としては、著作権が切れた明治期刊行図書、貴重書、国会会議録の電子化、二次情報としては国会図書館の書誌情報の電子化が挙げられている。
現在はパイロット電子図書館プロジェクトなどによる電子図書館システムの実証実験中で、2002年に開館予定の国立国会図書館 関西館を本格的な電子図書館として立ち上げることを目指している。
現時点で国会図書館で利用できる電子図書には、以下のものがある。


2.1.1. 国立国会図書館で現在利用可能な資料
一次情報

二次情報

2.1.2. パイロット電子図書館プロジェクト
情報処理振興事業協会(IPA)が、国立国会図書館と共同で推進している実験システム。1995年から運用実験を開始している。
パイロット電子図書館プロジェクトは「電子図書館実証実験システム」と「総合目録ネットワーク利用実験システム」の2つに分かれる。電子図書館実証実験システムは、2002年に開館予定の国立国会図書館 関西館での電子図書館システムの基盤技術を準備するための実験プロジェクトとして位置付けられている。


* 電子図書館実証実験システム
大量のコンテンツのデータベースをネットワークで利用する上でのプロトタイプとして技術面、運用面を実験。
実験データを以下のウェブページで閲覧できる。
実験データとしては、慶應義塾大学の稀覯書(グーテンベルク印行「42行聖書」、和漢稀覯書、浮世絵)、慶應大学博物誌資料の写真撮影の画像、遺跡発掘物写真と解説ビデオの画像(GIF、JPEG)、動画データ、ボストン美術館所蔵 日本美術コレクションの画像データおよび、それぞれの解説文をデータベース化し、メニュー検索や作品、時代別検索を可能としたものが用意されている。

http://www.cii.ipa.go.jp/el/el/index.html

* 総合目録ネットワーク利用実験
国立国会図書館をはじめ全国の図書館の書誌情報と所蔵情報を統合し、共通の総合目録データベースを構築するシステム。図書館の利用者が求める本がどの図書館にあるのかを調べることができる。全国の主な公立図書館が参加している。1994年から1998年までパイロット電子図書館プロジェクトのサブプロジェクトとして実施され、1998年にそれを継承して国立国会図書館の事業として実施され、公共図書館間の資料の相互貸借に利用されている。
2001年8月現在で総書誌データ件数は1800万件を超えている。

2.1.3. 国際こども図書館
2000年5月に国立国会図書館の支部図書館として設立された。現在は部分開館中で2002年に全面開館予定。内外の児童書と関連資料の収集、利用とともに、電子図書館機能を利用した情報提供を予定している。
現時点で利用できる機能は、以下のとおり。

2.1.4. 国立国会図書館 関西館
http://www.ndl.go.jp/about/index.html
国立国会図書館 関西館は、京都府の関西文化学術研究都市に現在建設中で2002年の開館を目指している。関西館が提供するサービスについてまだほとんど情報が提供されていないため、国立国会図書館に直接メールで質問して以下の回答を得た。以下の内容はまだ一般公開されておらず、また流動的な部分もあるので、ウェブサイトなどでの一般公開は控えてほしいとのことだった。
関西館で採用されているLindra形式の画像をOCR入力できるかどうかは、現在確認中。

電子化される図書
当面は明治期刊行図書を電子化。NDC(日本十進分類表)で第1類(哲学・宗教)、第2類(歴史・地理)、第3類(社会科学)、第7類(諸芸・娯楽)、第9類(文学)に分類されるもの(第3類は法律分野を除く)。その他劣化の激しい戦前から終戦直後に日本国内で刊行された、国立国会図書館所蔵の社会科学分野の図書(約2500冊)についても電子化する。
平成13年度は約3万冊相当、全体で16.8万冊相当を電子化予定。


電子化のフォーマット
フィルムスキャナで画像入力し、目次をテキストで付けて検索可能にする。索引は付けない。画像データは、専用のプラグインを組み込んだブラウザで表示可能な高圧縮の画像フォーマット(Lindra形式)。目次はHTML形式。

利用方法
館内、その他の図書館の端末、インターネットのウェブブラウザで誰でも検索・閲覧可能。

2.2. BBCC (新世代通信網実験協議会)
国立国会図書館と連携した電子図書館システムの実証実験
高速ネットワーク及び分散環境のもとで電子図書館実験システムを構築し、環境条件の検討と技術的課題の抽出を行い、国立国会図書館 関西館で実現される電子図書館システムに必要とされる機能について検証する。
1997年に検索系の実験、1998年に入力系の実験が行われている。
この実験結果がデジタル貴重書展として国立国会図書館のサイトに掲載されており、画像データと解説のテキストなどを閲覧できる。


2.3. 次世代電子図書館システム研究開発事業
通商産業省、IPA(情報処理事業振興協会)、国立国会図書館が協力して行なったプロジェクト。1999年度で終了した。電子図書館のシステムアーキテクチャ、個別技術、およびプロトタイプの研究開発、実証実験が行われた。

2.4. 国立情報学研究所(旧学術情報センター)
2.4.1. NACSIS-ELS(電子図書館サービス)
http://www.nii.ac.jp/els/els-j.html
大学共同利用機関である国立情報学研究所が日本の学協会の発行する学術雑誌のページをそのまま画像データとして蓄積し、テキストの書誌情報とともに検索できるようにした情報サービス。インターネットで利用できる。
論文・雑誌のリストの検索は自由にできるが、論文のページの表示や印刷をするには利用登録が必要。また、論文のページの表示や印刷には、専用ソフトを使用するか、ブラウザに専用のプラグインソフトウェアを組み込む必要がある。
登録者は大学、高等専門学校の教職員、学生、文部科学省および文化庁の職員、研究機関の職員、学会正会員などに限定されている。


2.4.2. NACSIS Webcat(大学図書館目録検索)
http://webcat.nii.ac.jp/webcat.html
NACSIS-CAT(目録システム)により形成された全国の大学図書館等が所蔵する図書・雑誌の総合目録データベースをインターネット上で検索できるシステム。ウェブページで誰でも検索できる。

2.5. 大学図書館
1996年7月文部省学術審議会が「大学図書館における電子図書館的機能の充実・強化について(建議)」を文部大臣に提出し、文部省の学術振興の基本施策のひとつとして大学の電子図書館化が進められた。
日本の大学図書館の主な電子図書館プロジェクトを以下に示す。

2.5.1. 奈良先端科学技術大学院大学
http://dlw3.aist-nara.ac.jp/index-j.html
1991年に創設された奈良先端科学技術大学院大学は、付属図書館の設計当初からマルチメディア対応の実用的電子図書館の構築を目指している。学術審議会の建議より以前の1992年に学内に整備されている高速LAN曼陀羅ネットワークを基盤とする「曼陀羅図書館プロジェクト」を発足し、1996年から運用を開始した。日本の電子図書館の実用化としては最も早い。
総電子化蓄積ページ数は2000年で100万ページを超えており、学術雑誌、図書、視聴覚資料、CD-ROM、修士・博士論文、テクニカルレポート、辞書などを電子化している。目次や所在情報などだけでなく、本文や動画も閲覧できる。
一時情報(資料そのもの)の入力としては、冊子はスキャナで読み込み、そのデータからOCRによる全文検索用のテキストデータを生成している。また、目次情報の入力、システム内で利用されるデータ形式(主にPDF)への変換編集している。またCD-ROMやネットワーク経由で入手したファイルのデータ形式の変換も行なっている。
奈良先端科学技術大学院大学の電子図書館はインターネットでも公開されているが、著作権上の問題からタイトルを引き出すのみで、全文の閲覧はIDとパスワードを持った者に制限されている。
本文も含めた電子化の場合に問題となるのが著作権で、奈良先端科学技術大学院大学では著作権専門部会を設置し、学会、出版社等と電子化利用許諾に関する交渉を行なっており、エルゼビアサイエンス社、クルーワー社、ゴードン&ブリーチ社、電子情報通信学会、情報処理学会、日経BP社などと契約を交わしている。しかし、出版社や学会に著作権の明確なガイドラインがまだなく、許諾が得られないものも多い。


2.5.2. 京都大学電子図書館
http://ddb.libnet.kulib.kyoto-u.ac.jp/minds.html
1998年に電子図書館システム(京都大学エンサイクロペディア)を正式公開しており、インターネットでもウェブブラウザで閲覧できる。
図書館が所属する貴重資料、京都大学刊行物、樋口一葉小説集などを掲載している。貴重資料はフィルムスキャナで画像入力したGIFやJPEGデータ、京都大学刊行物はHTML、樋口一葉小説集はHTMLおよびPDF形式で掲載している。


2.5.3. 筑波大学電子図書館
http://www.tulips.tsukuba.ac.jp/
附属図書館が収集した貴重書、筑波大学の研究成果報告書、学位論文、紀要等の全文をインターネットで閲覧できる。目次や解説はHTMLだが、本文はPDFやGIFファイルになっており、テキストデータ化はされていない。
オンラインジャーナルの閲覧は学内の人間のみに制限されているが、貴重書、報告書、学位論文、紀要などはインターネットでウェブブラウザを使用して誰でも閲覧できる。


2.5.4. 筑波技術短期大学 「視覚障害者のための電子図書館」プロジェクト
http://cocklobin.k.tsukuba-tech.ac.jp/vlj.htm
画像や外字を含めた図書の内容のフルテキストでの提供、点字電子図書、録音電子図書、ボイス・オン・デマンド、携帯式の録音図書再生機などの実証実験を行なっている。予算(http://cocklobin.k.tsukuba-tech.ac.jp/vl/yosanj.htm)のページを見ると、他の大学図書館プロジェクトとは別に、独自に小規模で行なっている模様。

2.5.5. 神戸大学 電子アーカイブ
http://www.lib.kobe-u.ac.jp/
阪神・淡路大震災関連資料を収集した震災文庫(約17,000タイトル)、経済・経営学関係資料の住田文庫(約2400タイトル)、学内研究成果物などのデータベース。インターネットでウェブブラウザを使用して誰でも閲覧できる。閲覧できる情報は、資料全体をスキャナで画像データとして取り込んだものと、書誌情報のテキストデータなど。

3. 米国の電子図書館
米国では、電子図書館事業は、国家的情報戦略の重要な分野と位置付けられ、電子図書館の実用化が進んでいる。1991年12月にゴア上院議員らが中心になって「高性能コンピューティング法(High Performance Computing Act:HPCA)」が制定され、これを受けて高性能コンピューティング通信(High Performance Computing and Communications:HPCC)計画が推進されたが、このHPCC計画や、ゴア副大統領、クリントン大統領の政権下で1993年9月に発表された国家情報インフラストラクチャ(National Information Infrastructure:NII)のアジェンダの中で、電子図書館が取り上げられている。

3.1. 議会図書館(Library of Congress)
http://www.loc.gov/
National Digital Library Program(NDLP)に基づき、議会図書館を中心とする主要な図書館が所蔵する米国の歴史、文化資料の電子化、ネットワークでの提供を進めている。議会図書館では、現在以下のサービスが実用化されている。

3.1.1. アメリカの記憶(American Memory)
http://lcweb2.loc.gov/
1991年に発足した事業で、議会図書館が所属する歴史的資料をテキスト、画像、サウンド、動画などの電子データ化。現在、100以上の歴史コレクションから700万点以上の電子データを収録している。電子データは、インターネットでウェブブラウザを使用して誰でも閲覧できる。文書の多くは本文をHTML形式公開しており、ブラウザで閲覧できる。

3.1.2. THOMAS
http://thomas.loc.gov/home/thomas.html
議会情報提供サービス。米国の議会情報を提供。法案および議事録のデータベース。主にHTMLとPDFで提供され、インターネットでウェブブラウザを使用して誰でも閲覧できる。

3.1.3. GLIN (Global Legal Information Network)、
http://memory.loc.gov/law/GLINv1/GLIN.html
議会図書館の法律図書館が提供する法律データを中心とする世界各国の法律の原語の全文テキストと英語の抄訳のテキストなどのデータベース。
インターネットでウェブブラウザを使用して誰でも閲覧できる。


3.2. デジタル・ライブラリーズ・イニシアティブ(Digital Libraries Initiative:DLI)
http://www.dli2.nsf.gov/
1994年に全米科学財団(NSF)、国防総省高等研究計画局(DARPA)、アメリカ航空宇宙局(NASA)によって電子図書館研究助成事業DLIが開始された。DLIは大量かつ地理的に分散して蓄積された情報へのアクセスを実現するシステムやサービスの研究が目標で、1998年までの第一フェーズDLI-1では、カリフォルニア大学バークレー校、同サンタバーバラ校、カーネギーメロン大学、イリノイ大学アーバナ・シャンペイン校、ミシガン大学、スタンフォード大学の6大学での異なるプロジェクトに対して年間予算約2,400万ドルの助成が行われた。各大学のプロジェクトについては、次に説明する。
DLIは現在2002年までの第二フェーズDLI-2に入っている。議会図書館など三つの機関がスポンサーに加わり、大中小含めて20以上のプロジェクトが進められ、予算規模も年間約4,000万ドルに拡大されている。


3.2.1. カリフォルニア大学バークレー校
http://elib.cs.berkeley.edu/
植物、動物、地理情報、環境や植物に関する文書、写真を電子化し、インターネットでウェブブラウザを使用して閲覧できる。文書はOCRで自動入力したテキストデータで閲覧できるが、OCR入力後の文書校正は行われていない。

3.2.2. カリフォルニア大学サンタバーバラ校
アレクサンドリア電子図書館
http://www.alexandria.ucsb.edu/
地図をクリックしたり地名を入力したりして目的地を絞り込み、地理情報や航空写真、鳥瞰図などを表示するシステムと、地名、緯度・経度、用語、資源などから該当する場所の地図やデータを表示するシステムがある。

3.2.3. カーネギーメロン大学
infomedeia
http://www.informedia.cs.cmu.edu/
画像、テキスト、動画、音声を統合したマルチメディア図書館システムの研究。ビデオ・オン・デマンドや音声対話による検索などの実験が行われ、一部実用化されている。

3.2.4. イリノイ大学アーバナ・シャンペイン校
http://dli.grainger.uiuc.edu/idli/idli.htm
科学技術ドキュメントのインターネット上での検索閲覧技術の研究。DeLIverというシステムで、土木工学、電気工学、コンピュータサイエンスなど50以上の雑誌の1995年から現在までの記事を試験的に閲覧できる。現在閲覧者はイリノイ大学アーバナ・シャンペイン校の学生と教職員などに限定されている。

3.2.5. ミシガン大学
http://www.si.umich.edu/UMDL/
JSTOR (Journal Storage)プロジェクトでは、社会科学、哲学、数学などの雑誌の電子化、Papyrologyプロジェクトでは古代エジプトのパピルス・コレクションの電子化が進められている。

3.2.6. スタンフォード大学
http://www-diglib.stanford.edu/diglib/index.html/
InfoBusというプロトコルを開発し、ネットワーク上のさまざまな情報資源を統一されたインターフェースで利用できる電子図書館システムの構築を図っている。

3.3. TULIP(The University Licensing Program)
http://www.elsevier.nl/homepage/about/resproj/tulip.shtml
オランダのエルゼビア・サイエンス社が、アメリカの9大学と共同で行なったプロジェクト。紙で発行されていた43の学術ジャーナルを、画像データとOCR入力によるテキストデータとしてサービスする実験を1991年から1995年まで行ない、1995年から商業サービスを開始した。現在1200の雑誌を電子化して販売し、インターネットによるオンラインサービスも行なっている。

4. その他の電子図書館プロジェクト

4.1. 世界図書館(ビブリオテーカ・ウニベルサーリス)
1995年にブラッセルで開催されたG7各国及び欧州委員会が参加して開催された「情報社会に関する関係閣僚会合」で合意された11の共同プロジェクトのひとつとしてG7電子図書館プロジェクトが開始され、G8図書館プロジェクトに継承された。1998年以降はG8を離れて独立の世界図書館プロジェクトとなった。世界の図書館を相互接続し、「人々の交流」に関するテーマの電子化データを作成、提供するという構想だが、具体的な進展は見られない。

4.2. 青空文庫
http://www.aozora.gr.jp/
著作権の切れた作品とインターネットで公開する許諾が得られた作品をテキスト、HTML、エキスパンドブックの三つの形式で電子化し、Webサイトで無料でダウンロードできるようにしている個人の有志のプロジェクト。
入力、校正を一般の無償ボランティアで行い、現在文学作品を中心に千数百冊が電子化されている。


5. 電子図書館プロジェクトの問題点
日本では、電子図書館ネットワークの核となる国立国会図書館 関西館の開館が2002年に予定されているにも関わらず電子図書館プロジェクトの内容について具体的な話が乏しく、図書館関係者以外の関心も薄い。たとえば、関西館についての情報をインターネットで検索しても、建物などのハードに関する情報しか得られず、電子図書館のシステムやサービスなどのソフトに関する情報は概念的な説明のみしか見当たらない。この日本の電子図書館計画の利用者不在の推進方法については、「だれのための電子図書館」(HONCO叢書 津野海太郎著)で詳しく言及されている。
また、今回の調査にあたり参考にしたほとんどの文献では、電子データのアクセシビリティについて触れられていない。また、日本の電子図書館プロジェクトのページでも、アクセシビリティについてはほとんど触れられていない。電子データの特性を生かしたバリアフリーの実現のために、アクセシビリティの側面からみた電子図書館についての議論が必要と思われる。


6. 参考文献

6.1. 書籍
だれのための電子図書館?
著者:津野海太郎、トランスアート、1999年
電子図書館
原田 勝・田屋 裕之 編、勁草書房、1999年
学術情報サービス―21世紀への展望
国立情報学研究所 監修、丸善、2000年

6.2. ウェブサイト
ディジタル図書館ネットワーク
http://www.dl.ulis.ac.jp/dlw_J.html
国立国会図書館電子図書館構想
http://www.ndl.go.jp/project/kousou.html
大学図書館の電子化サービス
http://www.slis.keio.ac.jp/~ueda/libwww/libwwwes.html
電子図書館の胎動 国会図書館総務部主任参事 田屋裕之氏に聞く
http://www.horagai.com/www/moji/int/e-lib.htm
電子メディアへのアクセスの現状と課題(公共図書館を中心に)
「みんなの図書館」1999年5月号掲載原稿

http://member.nifty.ne.jp/m-sugita/digital.html
Dublin Core Metadata Initiative
http://dublincore.org/
以上