[前回記事] [トップ] [次回記事]

2004年1月号掲載 よしだともこのルート訪問記

第87回 超ローコストで実現!タイ語図書データベース構築物語
〜京都大学 東南アジア研究センター(2)〜

木谷公哉(きたに きみや)さん
京都大学 東南アジア研究センター 資料部 情報処理室 助手
北村由美(きたむら ゆみ)さん
京都大学 東南アジア研究センター 資料部 図書室 助手
※所属部署・肩書は取材当時(2003年11月)のものです。

京都大学 東南アジア研究センターとは
東南アジアおよびその周辺諸国を総合的に研究することを目的として、1965年に京大内の組織として官制化された。現在は、地域相関動態、人間生態相関、社会文化相関、社会政治相関という4研究部門、3客員研究部門からなる研究部、資料部、および事務部からなり、さらに、タイのバンコクとインドネシアのジャカルタに連絡事務所を設置している。


京都大学 東南アジア研究センター 資料部とは
資料部は、図書室、編集室、情報処理室から構成されている。そのうちの図書室は、1965年の設立以来、センター内外の研究者の研究活動を支えており、東南アジア地域研究関係の図書館としては、規模・内容ともに国内有数の蔵書を誇っている。
http://www.cseas.kyoto-u.ac.jp/

■多くの現地語図書を有する図書室

よしだ(以下、Y):前回(2003年12月号)では、「東南アジア研究センター 資料部」の情報処理室が、どのようにネットワークを構築・運用し、教職員のPCサポートを実施しておられるかが中心でしたが、今回は資料部の図書室の話を中心にお伺いしたいと思います。
図書室は、東南アジア研究センターの中でもとくに歴史のある建物にありますね。


北村さん(以下、北村):2003年5月から図書室も無線LANになったのですが、図書館が歴史的建造物注1であったために、壁や天井が非常に厚くて、思ったようにつながらなかったんですよ。

Y:なるほど。図書室は、積極的に情報処理室とコラボレーションしておられるそうですね。

北村:将来的に、情報処理室、図書室、編集室という、資料部の下にある3つの機能をもう少し統合して強化する予定があるので、協力しながら実施していることが多いですね。情報処理室は、ネットワークやパソコン管理もしていますが、情報と名の付くものはすべて情報処理室が関係する宿命にあります。そのような背景を踏まえたうえで、資料部からの情報発信を実現させるために、情報処理室と図書室とでコラボレーションしているといえます。

木谷さん(以下、木谷):情報処理室は編集室の情報発信にもWebページなどを通じて協力しています。現在、図書室、情報処理室をリニューアルし、情報発信できる体制にしました注2。今後は個別に発信している編集室の情報発信体制を改善し、それぞれの特色を出しながら資料部全体の情報発信体制を確立したいと思っています。
 また、2001年4月に発足した「ホームページ管理運用委員会」の委員長になった折に、いくつか変更を行いました。ただ、技術的な面はともかく、デザイン能力に乏しい私だけでは色やデザインなどまで勘案して構築できるとは思えなかったので、教職員入り交じって数十名といろいろとデザイン案や色合いなどを考え、また作成した数十にもわたる案を何度かの所内投票を行って絞り込むことで、斬新なデザインが創造できたと思っています。その結果、その年の11月に、現在利用している「トップページの画像を季節に応じて変えていくスタイル(春夏秋冬バージョン)」のものを公開できました。
 1999年当初、すでにあったWebページを一新すべく、外注してデザイン・レイアウトなどを作成してもらいました。その後、改良を重ねる過程で、ロゴやレイアウト以外はすべて内製に変更し、現在のようなページに至っています。情報処理室の奥西久美さんが、JavaScript注3を駆使したり、画像編集ソフトで写真に手を加えたりと、活躍してくれているおかげで、現在あるサイドメニューシステム構築やトップページ構築などを実現できました。
 サイドメニューの作成にはCGI注4を採用し(表示部分はJavaScriptを利用)は、大項目とサブ項目に分け、これらの項目を変更するためには設定ファイルを書き換えるだけでいいようにしています。もちろんサイトマップも連動して書き換わります。
 過去のバージョンでは、選択部分の色の変更などを行うために、関連するすべてのHTMLデータを変えなければならず、これに辟易した私が奥西さんとともに約1か月程度で開発したものです。現在はさらに機能を拡張し、大項目を開いたのち再度大項目をクリックすると、サブ項目が閉じ、同時に目的のページへ飛ぶような仕掛けになっています。気付いていない方々も多いかと思いますけど。

北村:図書室の新しいWebページ注5も、情報処理室の方にこちらの要望をすべて伝えて、手作りしていただきましたので、満足できるものができあがりました(図1)。

Y:図書室には何人ぐらいの職員がいて、どの程度の規模の文献を所蔵しているのですか?

北村:図書室には、私以外に外国人研究者が1〜2名、事務員が5名、アルバイトが3名程度の合計10名前後で担当しています。
 図書室の資料点数は2003年3月時点で約13万5000点で、その内訳は現地語・洋書約11万2000点、和漢書約2万3000点です。現地語図書は、タイ語、インドネシア語、マレー語、ビルマ語、そのほかです。センターでは、1986年度に「東南アジア諸語文献研究部門」が新設され、東南アジアから書誌学者や目録作成の専門家を招聘しており、彼らの協力により、現地図書の整理ができるようになっています。
 現地語以外の文献については、京大内の図書館データベースシステムに登録しさえすれば、総合目録データベースをWebから検索できるサービスの、NACSIS Webcat注6にも反映される仕組みがすでにあります。しかし、NACSIS Webcatは多言語対応が進んでいるとはいえ、去年ぐらいにやっと中国語の簡体字、韓国語、今年からようやくアラビア語対応になったところで、Unicodeに文字がある言語でも、入れられるわけではないのです。このセンターでは、東南アジアの文献を多く持っており、とくに、タイ語、ビルマ語の文献を登録する必要があります。フィリピン語やベトナム語は、一応ローマ字表記なので、言語としては違うのですが対処できます。しかし、タイ語、ビルマ語といった文献は別の文字を使うので、この図書館データベースには登録できません。そこで、このセンターで独自にまずはタイ語の図書データベースを立ち上げたというわけです。

Y:最終的には、NACSIS Webcatでもタイ語の文献を登録できるようになるのが理想ですよね。

北村:はい。その要望は出してるのですが、まだ実現していません。このセンターで独自に立ち上げて、実績を作ってから「ここでのノウハウを提供しますよ」という風に働きかけていく予定です。

図1 図書室のWebページ
図書室のWebページ

■タイ語図書データベースはLinux、PHP、PostgreSQLで構築!

Y:タイ語図書データベース構築がスタートした時期やきっかけを教えていただけますか。

北村:2001年4月に、タイのマハサラカム大学で図書館のシステム管理者であったSompong Charoensiri氏が、客員研究員として来日したことがきっかけです。本国でもデータベースを構築・運用していたということで、こちらでもタイ語の図書データベースを作っていただくことになりました。

木谷:ただし、そのための予算が付いているわけではありませんので、ソフトウェアやハードウェアを買うことはできません。そこで我々は、サーバーとして、その辺にころがっていたPC(CPUはPentium II、メモリは64MB程度)に、Linux、PHP注7、PostgreSQL注8をインストールして、これを使って構築するようにとCharoensiri氏に渡しました。

北村:Charoensiri氏は、本国ではWindowsサーバー上でAccessを利用してデータベースを構築・運用していたそうで、Linuxを渡されて最初は戸惑っていましたが、本国の方と連絡を取るなどして、短期間で完成させてしまいました。もともと、6か月間の滞在予定ということもあって、4月にスタートさせたものが8月にはできあがっていましたね。

木谷:結局、ソフトウェア的にはオープンソースを利用したため、かかった費用はハードディスク代の約2万円と、UPS注9代の5万円程度だけですが、いまも問題なく動いています。もちろん、ずっとこのメモリ64MBのサーバーで運用し続けられるとは考えられないので、近くリプレイスしたいと思っています。

北村:タイ語図書の登録件数も現在は1万件弱になり、世界中から利用されています注10

Y:世界中からWeb画面を使って利用できるのですね。

北村:システムは大きく3つのモジュールから成り立っており、データ入力モジュール、検索モジュール、管理用モジュールのうち、検索の部分は、専用ページにアクセスすることで、誰でもどこからでも利用できます注11。たとえば、いまここでページを開いて、タイトルにタイ語で歴史という意味の「プラワット」を入力すると、331件のタイ語文献の書誌情報が表示されます(図2図3)。
 また、現在は独自のデータベースシステムで動いていますが、将来的には図書データベースの世界標準であるZ39.50注12に準拠したものにしたいです。Webcatもこの規格に準拠していますから、Webcatにタイ語データベースを加えることが可能になります。

北村:センターが提供しているデータベースには、タイ語図書データベース以外にも、経度、緯度の情報を入れることでセンターが所蔵する地図が表示される「Map コレクション」、センターが所蔵する人工衛星画像をオンラインで利用できる「人工衛星画像データベース」、センタースタッフが調査中に撮影した写真をデジタル化して作成した「フォトギャラリー」などがあります。

木谷:「Mapコレクション」はメインサーバーで動いていますが、「フォトギャラリー」は10万円ほどの費用で新規にPCを購入し、Linuxをインストールして構築しています。「フォトギャラリー」はディスクの空き容量が100GB必要ということで、メインサーバーでは容量が足りなかったためです。
 開発を行ったのは、地理情報システムの専門家で、中国から来日した研究者の宋氏です。このような画像関連システムもZ39.50に準拠させることで横断的検索が可能なようにプロジェクトが進んでおり、そう遠くない時期に、もっとしっかりしたシステムにリプレイスする予定です。

Y:貴重なデータベースばかりですね。ゆっくり見てみたいと思います。


図2 歴史と言う意味のタイ語「プラワット」を入力
図3 即座に検索結果が表示された
歴史と言う意味のタイ語「プラワット」を入力 即座に検索結果が表示された

■ジャカルタとバンコクの連絡事務所のネットワーク状況

Y:バンコク注13(タイ)と、ジャカルタ注14(インドネシア)にある連絡事務所注15のネットワーク環境整備も、情報処理室担当ということですよね。

木谷:はい。そのため、ネットワークのトラブルがあった場合には、国際電話がかかってきます。私は両方行ったことがあるので、あちらのネットワーク環境を頭に描きながら電話対応します。もちろんすべて電話対応のみで済むわけではありませんから、直接現地に出向いたり、現地のベンチャー企業などに対処をお願いできるようなネットワーク作りも行っています。
 バンコクは現在、情報系インフラが整備されている最中であり、我々のところでもADSLを導入しています。しかし現状では、ADSLは従量制しかなく、常時接続は帯域が細いISDN、もしくは非常に高価な光ファイバしかないため、拠点間通信を実現できずにいます。とはいえそう遠くない未来には、これらの問題が解決されていると思っています。
 ジャカルタのほうは、電話がつながらなかったり電圧が一定でなかったり、そうかと思えば屋内電話配線が暴発したりと、情報機器の故障が絶えない状況下でのサポートです。現在は、ケーブルTVが利用されていたことに着眼し、ケーブルインターネットを導入していますが、雨の日は利用できないなどとトラブルが多く、まだまだ不安定です。

Y:海外の連絡事務所からは、トラブル時には英語で電話がかかってくるのですか。

北村:いえ。駐在しているのはうちのセンターのスタッフなので、基本的に日本語でかかってきます。スタッフは、研究目的で半年〜1年滞在します。ジャカルタには私も滞在したのですが、根本的なインフラがまだ安定していなくてメールが読めないことがあり、木谷さんによく国際電話をかけましたね。私は、6週間ほど滞在しました。

木谷:北村さんは、ジャカルタ連絡事務所初の女性駐在員だったのですよ。
 タイにもインドネシアにも、コンピュータしか置いてない巨大な専門店(いわゆる部品屋)がすでにあって、5階とか6階建てのデパート全部がコンピュータ関係だったりします。どちらの国も、ネットワーク状況はまだまだ発展途上の状態ですが、今後の発展が楽しみです。

■外国人研究員に囲まれての仕事の苦労とは?

Y:センターには、外国人客員研究員のPCに関しても情報処理室が管理・運営しているそうですね。

木谷:外国人研究員も積極的に各委員会に参加するようになった結果、会議や議論での公用語が英語となっており、会議でも英語で話さないといけない場合が増えてきました。もともと私が英語が苦手であることと、ほとんどの外国人研究員の方が東南アジア出身で発音に特徴があることから、コミュニケーションを取ることに苦労しています。体当たり的なジェスチャーやメールでのやり取りなどを利用して、ずいぶん慣れてきました。もっとも、私自身まだまだ赤面するレベルですが、外国人研究員とのコミュニケーションを取ったり、コンピュータ関連の話題で議論したり、また英作文を短時間で作成できたりなど、まったくできなかったころを思い出すと、ずいぶん上達したものです。
 日本語でトラブルの電話がかかってきた場合は、状況を聞いて電話で指示したり、「いまは資料を書いている最中だから少ししたら行く」という対応ができます。しかし、英語での電話、とくに、まだ日本に来て間がない客員研究員からの電話の場合は、とにかく、すぐに駆け付けることになります。
 言葉の問題以外にも、文化の問題もあります。アジアの国は、情報関連の落差が目立ちます。著作権の概念がない、もしくはあまり規制されていない地域も多いため、法人向けに販売されたソフトウェアの違法コピー版を、デパートで平気で売ってる国もあるほどです注16。したがって、研究員の方であっても、著作権の概念がほとんどないケースがあります。そのような場合、「ソフトウェアを買う費用がないから」と説明しても、「コピーして使えばいいじゃないか」といわれ、著作権の概念の説明に苦労することもあります。
 また、外国人研究者が本国から持ってきたPCは、そのままネットワークにつなぐとセキュリティ上危ないので、こちらでメンテナンスするようにしています。その際、英語版のWindowsなどなら問題ないのですが、フランス語版、中国語版、タイ語版であった場合、「Yes」のボタンが、いったいどちらなのか分からず困ることもあります。
 またこのセンターは、バンコクとジャカルタに海外連絡事務所がある関係で、両国出身の外国人研究員が多いんですね。タイやインドネシアは熱帯地方であるため、日本みたいに暑すぎることはないですが、年中暑くて、湿気の多い地域が多いため、その国から来られた方の部屋は基本的に暑いんですね。夏でもクーラーを入れないのです。だから、僕らがその部屋で作業をしていると、ドーッと汗が出てきますね。実際、暑くて湿度が高い状態だと、プリンタがよく紙づまりなどを起こしがちなので、それで僕らが呼ばれて、大汗をかきながら直しているというわけです。

Y:東南アジア研究センターならではの苦労ですね。前回、今回と楽しく会話させていただき、ありがとうございました。近くにいますので、また遊びに来ますね。


ホームページの改良は自前で
注1 歴史のある建物
東南アジア研究センター(南棟)の図書室がある赤レンガの建物は、100年以上前の1889年(明治22年)に建築された。もともとは明治20年(1887)設立の京都織物会社の建物で、会社名を記した扁額(へんがく)が現在も残っている。

注2 情報処理室の新しいWebページ(要認証)
http://www.cseas.kyoto-u.ac.jp/info/

注3 JavaScript
Netscape CommunicationsがWebブラウザ用に開発したスクリプト言語。Javaとはまったく別のもので、仕様を一部取り入れているにすぎない。HTMLデータ内で<script>タグを用いて書き込まれたスクリプトが、Webブラウザ上で直接実行される。

注4 CGI
Common Gateway Interfaceの略称。WWWサーバーから外部プログラムを利用するための仕組み。CGIを利用すると、外部プログラムを起動してその処理結果をWebブラウザに送り返せるようになる。これにより、HTMLだけでは難しいページ作成が可能となっている。

注5 図書室の新しいWebページ
http://www.cseas.kyoto-u.ac.jp/library/

注6 NACSIS Webcat
国立情報学研究所(National Institute of Informatics)が運営する、「総合目録データベースWWW検索サービス」。全国の大学図書館などが所蔵する図書・雑誌の総合目録データベースおよびRECONファイルを、Web上で検索できるシステム。この総合目録データベースは、国立情報学研究所(NII)がサービスしている目録システム(NACSIS-CAT)を通じて、参加図書館が共同作成している。
http://webcat.nii.ac.jp/

注7 PHP
HTMLファイル内に記述するタイプのスクリプト言語で、データベースとの親和性が高く人気が高い。また、通常のCGIとしても使用できるが、Apacheサーバーにモジュールを組み込むことで処理速度の高速化、サーバー負荷の低減を実現しやすい。なお、正式名称はPHP:Hypertext Preprocessorで、出版社である「PHP研究所」とは一切関係ない。PHP研究所のほうは、Peace and Happiness through Prosperityの頭文字をとったものである。
http://www.php.gr.jp/

注8 PostgreSQL
ポストグレス、ポストグレエスキューエルなどと読む。BSDライセンスのオブジェクトリレーショナルデータベース管理システム(ORDBMS)の1つで、主にPC-UNIX系OS上で動作する。
http://www.postgresql.jp/

注9 UPS
Uninterruptible Power Supplyの略称。無停電電源装置とも呼ばれる。瞬時電圧低下や電圧の変動などの不安定な電源環境は、コンピュータにとって誤動作や停止の原因となりやすい。UPSは、搭載しているバッテリにより通電ができ、突然の停電時でもしばらくの間コンピュータを動かせるようになっている。通電可能な時間が数分程度しかなくても、コンピュータを安全にシャットダウンさせるには十分である。とくに2003年夏は、首都圏で電力不足による停電の可能性があり、家庭向け製品の購入者が増えたようだ。

注10 タイ語図書の登録作業
タイ語の入力には、タイ語キーボードを使う。しかし、日本では入手困難なため、タイからの研究者は、文字を手書きしたシールを日本語キーボードに貼って対処しているそうだ。

注11 タイ語図書検索ページ
http://library.cseas.kyoto-u.ac.jp/cseas/

注12 Z39.50
Z39.50は、データベースの検索(search)と結果(retrieve)に関する、情報検索プロトコル。正式名称は「ANSI/NISO Z39.50-1995 Information Retrieval(Z39.50):Application Service Definition and Protocol Specification」。1998年に国際標準規約としてISO23950-1998に採択され、1999年にはJIS規格「JIS X0806:1999」として認定されている。なお、正式名称中の「NISO」はNational Information Standards Organizationの略称で、ANSI構成団体の1つである。NISOが制定するANSI規格には、Z39.50のように頭に「Z39」が付けられている。
http://www.globalfinder.net/

注13 バンコク
タイ王国の首都。東京・バンコク間の距離は約4500キロで、航空機で6時間ほどかかる。国土面積は日本の約1.4倍で、総人口は約6000万人。平均気温約29度。公用語はタイ語、通貨はバーツ(1バーツ=約3.1円)である。
http://www.thailandtravel.or.jp/

注14 ジャカルタ
インドネシア共和国の首都。国土面積は日本の約5倍、約1万7000の島々からなる世界最大の島しょ国家である。人口は世界第4位の約2億人だが、そのうちの約1億人が、ジャワ島(総国土面積中の約7%)に集中している。
http://www.mofa.go.jp/mofaj/area/indonesia/index.html

注15 連絡事務所
連絡事務所の主な役割は、情報収集拠点、情報発信拠点、現地調査のベースキャンプの3点。バンコク連絡事務所は1963年開所、ジャカルタ連絡事務所は1970年開所。ジャカルタの駐在所は普通の家で、オフィス機能と宿泊機能を兼ねており、バンコクのほうはマンションの一室だとか。

注16 アジアの違法コピー問題
コンピュータソフトウェア権利保護団体Business Software Alliance(BSA)によれば、アジア太平洋地域全体の違法コピーによる損害総額は約6,505億円に達し、調査が始まった1994年以来、過去最高を記録した。違法コピー率ワースト3は、ベトナム、中国、ロシア近隣国(CIS諸国)。損害額ワースト3は中国、米国、日本となっている(2003年6月現在)。

[前回記事] [トップ] [次回記事]

Last modified: Mon May 21 13:36:22 JST 2007 by Tomoko Yoshida