to Home Page
仏教データベースと入力計画
ウルス・アップ
この記事は電子達摩第三号(1993年7月)に含まれていた。
--------> アップデート及び新しい計画の紹介。
世界中の多くの研究機関及び個人が、すでに仏教関連の情報入力に携わっている。こうした情報は広い範囲にわたっている。すなわち、様々な言語による古文書、図書情報、辞書情報、仏教僧一覧、伝記、現存の仏教師の法話、学者による書籍や論文、仏教地図、芸術作品の複製、などなどである。これらの入力の質は、様々であり、また入力されたデータの多くは、関心を持つ一般の人々に対して、(まだ)公開されていない。
下記の一覧は、現在私が知っているものを反映しているに過ぎないが、どれほどたくさんの活動が進行中であるかをご覧になって、読者は驚かれるに違いない。この最初の概観に漏れている、現在進行中あるいは計画中の活動について、読者諸賢の御一報をお待ちしている。ここに挙げた研究機関の多くは、ここで言及できたものより、もっと多くのテキスト入力に従事していることを指摘しておかねばならない。このリストは、ただ仏教データベースに限り、扱ったものである。
タイ大蔵経計画
研究機関:Mahidol University
担当者:Prof. T. Supachai
住所: 同左
内容:・タイ版のパーリ大蔵経全体(45卷、3000万字以上)。タイ語と、アルファベットによるパーリ語の両方。
・70卷分の注釈と文献情報
・仏典情報検索ソフト(BUDSIR、第四版)。
沿革:このデータベースは、タイ国王の還暦を祝して創設された。国王はそこで、注釈70卷分を入力するための基金を提供した。注釈なしのテキストは、はじめ、ハードディスク上で、パスワードによるプロテクトをかけて売られたが、売行きはかんばしくなかった。CD-ROM版は、いくつかの改良された特徴を持つが、テキストのプロテクトはそのままであるようだ。
データ量:・大蔵経:30メガのテキスト、25メガの索引、7メガの辞書。
・注釈:53メガのテキスト、45メガの索引。
・16メガの辞書。
データ入力と校正:データは二人のタイピストによって入力され、次に機械によって校合された。学者による全テキストの組織的校正は、いままでのところ、なされていない。自動生成された語彙リストの助けをかりて、いくらかのデータ校正が行われた。国王からこの仕事に任命された、あるタイ僧が、さらに校正を追加した。これらのうちいくつかは、印刷原本の誤りを取り除くものだと言われている。このような校正がデータセットの中で識別できるように明示されていないので、このCD-ROMは、単純に印刷原本の電子版というのではなく、印刷原本との相違が不
明な、新しい版とみなさねばならない。
環境:IBMコンパチのパソコン上で使用可能な、CD-ROMで提供される予定。CD上のデータは符合化されている。このため、添付の検索ソフトしか使うことができない。この検索・表示のソフトは、初歩的なものである。単語単位の検索が可能で、それらを文脈のなかで見ることができ(現在のところ、フルスクリーン・モードのみ。ウィンドウズには対応していない)、いくらかの頻度統計が表示される。
頒布:1993年秋からの提供が計画されている。タイ国内における頒布は、マヒドール大学、他の地域ではアメリカ宗教アカデミー(AAR)による。価格:研究機関は500ドル、個人は300ドル。
展望:開発中の BUDSIR V 検索ソフトは、専売のマヒドール・ウィンドウズ・システムで動作することになるが、これはマイクロソフト・ウィンドウズとコンパチではないようである。スパチャイ教授は、他のコンピュータ及びソフト環境のユーザーが利用できるようにすることは、全く計画してないようである。
ビルマ大蔵経(1)
担当者:S.N. Goenka氏
内容:ビルマ大蔵経全体。
沿革:ビルマ大蔵経のほぼ全部と、注釈及びいくつかの補釈の入力が、インドのS.N. Goenka氏によって完成された。入力はラングーン会議(1954-56)の成果に基づいており、廉価なデバナガリー版を刊行するために行われた。Goenka氏は、ローマ字化した形の電子データを刊行することにも積極的である。
データ入力と校正:不詳。
頒布:数カ月前に、私はこのデータベースがローマ字化され、AAR(アメリカ宗教アカデミー)を通じて刊行されるらしいと耳にした。これと次の計画との間に、何等かの関連があるのかどうか、私は知らない。
ビルマ大蔵経(2)
研究機関:Dhammachaka 冥想センタ−
担当者: Ven. U. Silananda師
住所: 同左
内容:内容:ローマ字体のビルマ大蔵経ラングーン会議版。ビルマ字体版をイメージ入力することも検討中。
頒布:Silananda師は、このデータベースをコピープロテクトや制限を一切せずに利用できるようにしたいと考えている。
パーリ文献協会データベース
研究機関:ダンマカーヤ基金
担当者:メッタナンド師
住所: 米国及びタイ国同左
米国担当者:Mettanando師
タイの担当者:Dattajivo師
内容:バンコクのダルマカーヤ基金は、ほとんど大部分のパーリ資料と、パーリ文献協会叢書の英訳を入力したと言われている。データは現在校正中の段階にあるが、どのデータにせよ、完成が公表されたものはないし、頒布の仕方についても、まとまったものは何もない。
チベット仏典データベース
研究機関:アジア古典入力計画
担当者:M. Roach氏, R.Taylor氏
住所: ・ ACIP のワシントン事務所同左
・ACIP のニューヨーク事務所同左
・ACIP の東京事務所:言語情報研究法人*
Hakumyo Niisaku
4-9-15 Koyama
Shinagawa-ku
Tokyo
電話: (03) 3783-9428
Fax: (03) 3788-6180
内容:「アジア古典入力計画」という名前がついているが、この計画が焦点を合わせているのは、チベット仏典と仏画である。この計画の当面の目標は、カンギュ派とテンギュ派の群籍(サンスクリット仏典のチベット訳)のうち、4500作品の入力である。電子テキストとともに、他の研究工具(辞書、文献一覧)も電子テキストの形で刊行される予定。価格はコピーと郵送料のみ。
この計画の様々な活動と入力テキストの一覧表は、最近出た『アジア古典入力計画:第三回公開』(ACIP)に詳しく記されている。このパンフレットはまた、チベット語電子テキストの種々のハードやソフト環境上での取り扱いに関して、多くの価値ある情報を含んでいる。このデータベースは現在約40メガのデータを有しており、そのうちの幾つかは未校正である。校正済みのものは、五十を超えるチベット仏典と、幾つかの教科書、それに多数のリストやカタログである。これらの資料の大部分は、フロッピーディスクで利用できる。さらに、IBMコンパチや他
フ機種上で使用できるいくつかのグラフィックファイルとともに、種々のプログラムとツールが頒布されている。
沿革:この計画は、パッカード人文科学研究所とデービッド及びルシール・パッカード財団の寄付金によって開始され、様々な機関の支援を得てきている。ごく最近では、人文科学に対するアメリカ合衆国の寄付金を受けている。最初のデータ公開は1990年に行われ、第二回は1991年、そして第三回目は1993年の五月に行われた。
データ入力と校正:これらのテキストの入力は、現在、その大部分が南インドにあるセラ・メイ僧院で行われているが、チベット難民共同体において、さらに十の入力センター(チベットの全部で四つの学派に属する)を開設することが計画されている。
現在のところ、デルゲ*の中観部の入力が進行中である(東京大学版を使用)。未校正のデータの正確度は約98%である。校正の最終的段階は、チベット人専門家によって行われている。関心のある学者は、校正の過程に参加することができる。
環境:データは標準アスキーコードで入力されており、IBMとアップルの両方の機種で頒布されている。日本のNECユーザーも、データを利用することは可能であるが、検索や他のユーティリティソフトにおいて、非常に制限された選択の余地しかない。
頒布:データは、上記の住所を通じて、コピー及び郵送料金とひきかえに頒布されている。
高麗大蔵経計画
研究機関:海印寺(韓国)
担当者:宗林師、慧黙師
住所: 同左
内容:韓国海印寺に所蔵されている八万枚以上にのぼる高麗大蔵経の木版全部を入力することが計画されている。
沿革:最初の入力作業は、韓国チョギ修道会居士仏教徒協会の前会長、パーク・ウォンイル氏の協力とともに、バークレイ大学のランカスター教授によって組織された。海印寺がこの計画を引き継ぐことが決まったとき、全入力データが譲渡された。入力と校正活動の継続は、現在組織中である。
データ入力と校正:最初の二つの卷は、上海で1992年に入力された(Etenを使ってBig-5コードで。自家製の文字を追加)。データは二回校正読みが行われたが、改訂版の入力ガイドラインが海印寺で出来上がれば、あと何回か校正を行わなければならないだろう。データ校正の後半段階は、海印寺の学僧によって行われる見込みである。
北海データベース
研究機関:佛光山北海道場
担当者:慧傳
住所: 台北縣石門郷内石門靈山路106號
電話: (02) 6382511
Fax: (02) 6381293
内容:台湾の北の端にある北海僧院の見習い僧が、大正大蔵経所載の佛典名カタログを入力した。また、約40の経典が、スクリーン上で見易いフォーマットで、すでに入力されている(その中には、主要な中観派と**のテキストとともに、法華経、維摩経、金剛経、楞厳経が含まれている)。句読点とテキストは、ほとんど大正版以外のものによっている。
沿革:もともと、北海僧院の僧たちは、中華大蔵経の部分版である*沙版(約5000軸。1930年に発見され、最初の木版版である10世紀の**版の正確なコピーに非常に近いと言われている)に関して、ある仕事をしていた。計画は、この版の土台として、高麗大蔵経計画を使用する予定だった。当面、この計画はストップしているようであり、高麗大蔵経計画の続行をまって、再開してもよかった。しかし、僧たちは何もしないでぶらぶらしていないで、以下に見るようなテキストを入力したのであった。
データ量:入力された経典の量は、50万字を超える。1993年五月現在、入力された経典は次のとおり(大正大蔵経の番号による):nos. 99 (部分), 102, 124, 209, 235, 251, 262, 276, 353, 361, 365, 366, 389, 412, 450, 475, 492, 600, 676, 684, 685, 707, 779, 784, 842, 945, 1497, 1558 (part), 1564, 1568, 1569, 1573, 1613, 1614, 1630, 1666, 1915, 1917, 1944, 2010。
入力は速いテンポで進んでおり、幾人かの僧は、私がかつて見たいかなるプロよりも速くタイプすることができる(一分間に100字の割合)。また、テキスト名(それに翻訳者なども)全体のリストも入力されている。佛典推進会が推進しようとしている国際的協力が、どのようなものであるかの一例として、このリストは花園大学の国際禅学研究所に譲与された。そこで北海禅院のファイルに含まれている全漢字のピンイン読みが、自動的に生成された。
こうして作成されたファイルは、現在、京都の法宝義林研究所(下記参照)で、校正と日本語読み、ピンイン読み、サンスクリット名などを補充しており、最終的には北海僧院及び関心をもつ機関へ還元することになるだろう。
環境:データは未フォーマットのテキストファイル(Big-5)であり、IBMあるいはアップルの装置上で、必要なシステムソフトがあれば使用できる。
データ入力と校正:北海僧院の僧たちはIBMコンパチ上でETEN を使ってデータを入力している。データはBIG-5 コードと、いくらかの追加文字による。スクリーン上でテキストを読めるようなフォーマットにするために、大正大蔵経のフォーマットは放棄され、また読み易くするために、しばしば近代的なスタイルの句読点が付加されている。データ校正の過程とその状況は、まだよく分からない。
中国社会科学院データベース
研究機関:中国社会科学院
担当者: 樂貴明
住所: 電悩中心、中国社会科学院
中国・北京建国門内大街伍號
電話: 5129614 ext. 2412
Fax: 5135025
内容:外界には知られることなく、このアカデミーは大正大蔵経全体の入力を開始していた。1933年の五月には、最初の10卷がすでに入力され(校正状況は不詳)、引続き入力は一週間に百万字の割合で進行しているとのことである。
沿革:このアカデミーは、80年代中頃から、中国古典データの入力と処理に関わってきた。そのため、繁体字に関して、充分な経験を積んでいる。すでに大量のデータを入力してきており(中国古典、全唐詩、全唐文など)、索引シリーズを刊行している。1993年五月にアカデミーを訪問したとき、この計画と、その急速な進展を知って、我々は非常に驚いた。計画責任者は、入力の財源は自ら都合していると語ったが、我々はこれらのデータの出版、あるいは頒布について、それ以上見いだすことはできなかった。
環境:IBMコンパチ。中国古典データは、通常、アカデミー自作の四万五千字のコードによって入力され、入力した人が一回校正する。外部から受注した場合は、入力はBIGー5かGBコードによって行われる。マスターデータ(自作コード)ユーザーデータ(BIGー5かGBコードであるが、情報の欠損は避けられない)は、はっきりと区別されている。自作文字コードは修正版DOS環境と、拡張カードが必要で、アカデミーがこれを売り付けていることは明らかである。しかし、その価格やシステムのコンパチ性について、はっきりしたところは分からない。
頒布:大正大蔵経のデータの利用の仕方や、頒布計画があるかどうか、目下のところ不明である。
京都大学人文科学研究所データベース
研究機関:京都大学人文科学研究所
担当者:高田助教授
住所:〒606京都市左京区北白川東小倉町47
Tel: (075) 753-7531
Fax:
沿革:この研究所は、多言語データ処理に関しては、パイオニア的存在の一つである。80年代に、京都大学の大型計算機によって、アジア学に関する有名な年次文献一覧の印刷を開始しており、研究所の幾人かのメンバーは、彼等独自のデータベース計画に従事している。最も大部なテキスト入力は、太平御覧1000卷(勝村哲也教授)であるが、その他様々の資料(いくつかの道教文献のような)もまた、研究所の個々のメンバーによって、電子テキストの形で利用されている。大正大蔵経テキストの入力は、1992年に開始された。現在、人文科学研究所で研
究されているテキスト、大正大蔵経99卷NO.2085高僧法顯傳の索引が計画されている。
内容:大正大蔵経の49卷から52卷(史伝部)の入力が計画されている。今までのところ、次のテキストが入力されている。大正大蔵経NO. 2059, 2085, 2087, 2088, 2089 (第一部と二部), 2092。これらのデータは、基本的な校正の段階を終了している。データはJISコードによっており、JISに含まれていない文字については、代替記号が使われている。データ入力と校正:データは電子達摩第二号で記述された方法に基づき、NEC装置上でスキャナーを使い、JISコードによって入力された。次にデータは、京都大学の中国文学専攻の学生によって、校正が行われ
ス。
環境:NEC 9801型の装置。印刷のために、マッキントッシュ上でフォントグラファー・プログラムを使用して、JISに含まれていない漢字を作成した。
頒布:頒布については、まだ検討されていないが、人文科学研究所の伝統に従えば、専門家に対するデータ公開が期待できる。
中央研究院(アカデミア・シニカ)データベース
研究機関:中央研究院
担当者:丁之侃
住所: 中央研究院計算中心
台北市南港區11529研究院路二段128号
電話: (886) 2-789-9257
Fax: (886) 2-783-6444
沿革:中央研究院は、その二十五史のデータベース(四千万字)で、もっともよく知られているが、また他の膨大な量のデータも入力中である。たとえば、敦煌資料や中国の碑銘(いくつかは、すでに中央研究院のオンライン・ネットワークで利用可能)、中國歴史地名辭典、永樂大典人名書名索引など。同様に、すでに研究所内部のオンラインで利用可能なものとして、約900万字に相当する古典がある(注釈付き十三経、墨子、莊子、列子、道徳經など)。すでに入力され、八人の専従者からなるチームによって、現在校正が行われているものには、高僧傳と續高
僧傳(大正no. 2059、2060)とともに、洛陽伽藍記、太平御覽、世説新語が含まれている。
現在入力中のものには、多数のテキストのうちでも、特に文選、朱熹語類、敦煌變文集、四十二章經などがある。中央研究院内部で使用されている大正大蔵経テキストは、さらに次のものがある:no. 23, 46, 114, 115, 131, 137, 140, 149, 150a, 150b, 151, 152, 154, 157, 167, 184, 186, 190, 196, 197, 198, 202, 204, 208, 209, 210, 211, 212, 223, 224, 225, 280, 313, 322, 348, 350, 356, 361, 417, 418, 458, 492, 525, 526, 551, 553, 554, 602, 603, 604, 605, 607, 608, 621, 622, 624, 626, 630, 684, 701, 724, 729, 730, 731, 732, 733,
735, 778, 779, 791, 792, 807, 1467, 1470, 1492, 1508, 1557, 2027。
環境:中央研究院は、UNIXネットワークを使用している。データはBIGー5コードを使用して、業者によって入力している(千字につき70$NT)。このコードに含まれていない文字は、空白で入力されている。テキストは、次に中央研究院において八人の専従者のチームによって校正され、編集される。検索処理はまだ充分柔軟ではなく、出力オプションも限られている。二十五史のCDがDOS装置上で利用できるが、ETENを使うのが望ましい。アカデミア所有のコンピュータ上では、BIGー5に含まれていない文字は「@」として現れるが、このCDには、この文字がおよそ五
轤ュらいあるようだ。私はまだこのCDを所期の環境で動作させてみたことがない。
頒布:二十五史が、現在、CDーROMのフォーマットで販売されている一方、残りのデータは、ただ研究所内で使われているだけである。驚くべきことに、他のいかなる大学といえども、このネットワークにアクセスすることはできない。国立台湾大学でさえ、できないのである。
香港中文大學データベース
研究機関:中國文化研究所、古文獻資料庫計劃
担当者:何志華
住所: 香港中文大學、香港、新界、沙田
内容:この大規模計画の第一段階は、中国古典約八百万字を入力することにある。約六百万字が、1993年夏までに入力される予定である。特に、1993年から1995年の間に、六朝から36の道教文献(約五十万字)が、入力されることになっている。続く第二段階では(1995年開始)、六朝から47の仏典(約四百二千万字)が入力されることになっている。この研究所が入力を予定している仏典には、次のようなものを含んでいる。大正大蔵経no. 154, 223, 235, 262, 278, 360, 366, 374, 388, 397, 426, 453, 475, 618, 670, 816, 1238, 1422, 14
78, 1509, 1521, 1524, 1568, 1646, 1659, 1666, 1668, 1819, 1856, 1857, 1957, 1978, 2046, 2064, 2047, 2048, 2059, 2102, 2145。同時期に入力が予定されている続蔵経のテキストについては、下参照。
沿革:これは本質的に索引作成計画であり、このチームがこれまでに焦点を絞ってきた多くの問題は、電子テキストを作成するというより、コンピュータ上で印刷された索引を作成することに関連したものであった。最初のシリーズである12の索引は、香港のCommercial Pressで印刷され、完売となった(各500部づつ刷り、各250部は日本に売られた)。
この大規模計画の第一段階は、102の中国文献を索引の形で刊行することにある。現在のところ、スタッフは、テキストを編集し脚注を作成する研究者一人と、コンピュータ担当者一人、それに三人の助手からなる。ひと月に一索引のペースが計画されている。
環境:データはBIGー5コードで入力され、次に研究所の一人物の手によって完全に編集され、句読点が打たれ、それから大学の学生によって七回、校正読みが行われる。そして、最後に中国人の学者によって、もう一度校正読みが行われる。この手続きから、データの高い信頼性が期待できる。研究所の総費用のうち、ほとんど半分が、テキスト編集と校正のために費やされている。
頒布:印刷された索引が完売されたと見るや、この研究所はテキストデータと検索ソフト(各テキスト個別に)の公開を計画するようになった。こうしたテキストデータの公開がいつから始まるのかは、まだはっきりしていないが、データ価格は印刷された本(平均40ドル)の二倍半の金額になる見込みである。すなわち、一つのテキストのデータは、100ドルに達することになる。このような価格政策は、他の機関を刺激して重複入力をすることになりかねないし、この研究機関自身が計画しているように、後の段階でCDーROMが公開されれば、たいした意味を持た
なくなるだろう。データは印刷本に近いフォーマット(ポップアップ・ウィンドウに脚注があり、BIGー5に含まれていない文字は自家製)で、IBMコンパチ用の専用索引ソフトとともに、供給される予定である。
禅知識ベース
研究機関:花園大学国際禅学研究所
担当者:ウルス・アップ
住所: 京都市中京区西ノ京壷の内町8ー1
電話: (075) 811-5181 ext. 280
Fax: (075) 811-9664
沿革:この計画は1990年に創設され、四つの段階からなっている。1)基本的研究とソフト開発(1990-93)、2)メインデータ入力段階(1993-1996)、3)データ結合とソフト開発、4)全データセットの公開。
1990年以来、様々のソフトを公開してきている(下の記事のリストと説明参照)。また、最初の充分に校正された禅テキストが、まじかに公開されんとしている(1993年夏)。
内容:この計画の目的は、原典資料に中心をおいた、中国・韓国・日本の禅学研究に関する百科辞典的知識ベースを構築することにある。
・主に大正大蔵経と続蔵経による電子禅テキスト。
・研究ソフト(関連辞書類の索引、文献名と著者名のリスト、テキスト説明など)。
・電子ツール(自動索引生成プログラム、テキストファイル整形プログラム、検索ツール、コード変換プログラムなど)。
最初の試験的段階で、手入力及びOCR入力(JISコード)によって、この研究所は約40のテキスト(主に禅)を大正大蔵経から入力した(no. 475, 842, 1857, 1881, 1985, 1986AB, 1987AB, 1988, 1991, 1997, 1998, 2004, 2005, 2007, 2009, 2010, 2012A, 2012B, 2013, 2014, 2015, 2016, 2017, 2018, 2019A, 2021, 2022, 2023, 2024, 2025, 2831, 2832, 2834, 2833, 2835, 2836, 2837, 2887, and 2901)。
これらのデータの大部分は、まだ校正されていない。JISコードの変換性の悪さは、大量のデータ入力(続蔵経の禅宗部〔約千五百万字〕と史伝部〔約千八百万字〕の全体)において、別の方法を採用せざるをえなくなった理由の一つであった。別の方法とは、異体字処理に関しては、厳密なガイドラインを用い、BIGー5コードで入力する。CCCIIコードによって、データをマスター化する。そして、ユーザーの希望(JIS、KS、Big-5、GB、CCCII、ユニコード)に応じて、どのコードでも頒布する、ということである。
環境:現在までに公開されたソフト・ユーティリティ(たとえば禅語仮名漢字変換辞書)は、JISで書かれており、NECー9801用、IBM用、マッキントッシュ用がある。新しいユーティリティ・セット(1993年秋)に含まれているプログラムの一つは、特にコード環境の問題に焦点を絞っている。すなわち、JISからBIGー5や韓国のKSコードへ、そして逆方向も可能なコード変換プログラムである。コード変換専門プログラムを使うことにより、電子禅テキストは、CCCIIコードによるマスターデータから、ユーザーの必要に応じて、様々なコードに変換されることになる
Bパソコン用の主なハードとソフト環境は、すべて、この研究所で使用されている。
頒布:1993年より、充分に校正された電子テキストデータが、継続的に公開される予定。** 参照。未校正のデータは、校正過程を引き受ける意志のある方には提供する。
韓國佛教全書計画
研究機関:Paeng Nyon 佛教文化基金
担当者:Won Young師
住所:同左
内容:韓國佛教全書の入力。最初のものは元暁である。彼の著作(約七十万字)の入力は、ちょうど中国で完了したところである。
禅文化研究所データベース
研究機関:禅文化研究所
担当者:吉沢勝弘
住所: 〒604京都市中京区西の京壷の内町8−1
電話: (075) 811-5189
Fax: (075) 811-1432
沿革:1986年前後から、この研究所は多くのテキストを日本及び中国の業者によって入力してきた。その目的は、第一に索引を作成することであり、そのような一連の索引が出版されている。現在、この研究所はまた、他の中国文献データ(500卷の太平御覧のような)を入力している。その指向するところは、今や、中国口語の研究をも含んでいる。この研究所は、電子テキストよりも、もっぱら印刷された索引の制作に専念している。このために、コードの決定や、データ校正は、研究所で使用されているハードウェアに依存している(NECー9801型の装置と富
士通のプリンター)。今までのところ、電子テキスト、あるいはプログラムで、公開されたものはない。
内容:入力に関わった会社と国が、種々に異なることから、データの質にも非常なバラつきがある。索引が作成されたデータに関してのみ、校正が行われている。校正されたデータは、次の通り(JISによっており、1000字以上のアルファベット二文字による代替記号が使われている):祖堂集、景徳伝灯録、及び大正大蔵経no. 2003 と 2004。未校正のもの:大正大蔵経no. 2003, 2004, 2005, 2015, 2017, 2025, 2059, 2060, 2061, 2062, 2548, 2551, 2566, 2574, 及び数多くの卍続蔵経99卷収載のテキスト(下の一覧参照)。これに加えて、いくつかの参考
}書索引や禅語一覧が入力されている。
データの大部分が、日本及び中国の種々の会社によって、いくつかの方法で(あるものはJISを使い、あるものは簡体字を使うといったふうに)入力された。このために、その質には大きなバラつきがある。印刷された索引に使用されたデータのみ、校正が行われている。
環境:すべてのデータは、日本のJISコードで入力されている。JISに含まれていない多くの文字は、現在のところ、アルファベット二文字による代替記号で入力されているが、初期のデータでは、こうした文字にただ一つの代替記号しか使っておらず、検索を困難にしている。
頒布:禅文化研究所は、研究所内においてデータのいくつかを利用することを認めているが、その所有する電子テキストを公開する計画は持っていない。ただし、例外はある。
法寶義林データベース
研究機関:法寶義林研究所
担当者:Hubert Durt
住所:京都市上京区相国寺林光院内法寶義林研究所
電話: (075) 256-4179
内容:次の計画が、現在入力段階にある。
・法寶義林(日本語と中国語の読みがついた大正大蔵経のカタログ)の増補の電子版。
・法寶義林百科事典の多言語電子索引。
沿革:故アンナ・ザイデルの先見の明により、法寶義林研究所は、八十年代以来、継続的にそのコンピュータ関連の活動を拡充してきた。研究所の仏・英二か国語による定期刊行物、カイエ・デクストレーマジの第六号は、マッキントッシュ・システムによって、完全に設定され、印刷された。そして、法寶義林百科事典の次の卷も、そうなる予定である。このようなツールの電子媒体への移行は、多言語電子索引の作成とともに、この研究所による国際的仏教研究への、もう一つの主要な貢献となるに違いない。
立正日蓮データベース
研究機関:立正大学
担当者: 三友健容教授
住所: 〒141東京都品川区尾崎2−16−4
立正大学
電話:(03) 3492-8528
Fax: (03) 5487-3352
内容:東京の立正大学は、日蓮上人遺文の鎌倉版影印のCDを作成した。テキスト資料はグラフィック情報として保存されているために、テキスト内の言葉を検索することはできない。このグラフィックファイルに加えて、辞書(日蓮上人御遺文辞典)が収録されている。これによって、ユーザーは、いくらかの言葉やテーマを間接的に見つけることができ、テキストに使われている術語の意味に関する情報を得ることができる。
環境:このCDは日立の専用システムを必要とし、通常の日本のパソコン装置では使えず、IBMやアップル型のマシンでも使えない。
頒布:多くの専用ハードが必要なために、立正大学以外の場所で使うのは、おそらく実用的ではないであろう。
仏教大学図書カタログ
研究機関:仏教大学図書間
住所: 京都府京都市北区紫野北花ノ坊町96
電話:(075) 491-2141
FAX: (075) 493-9042
内容:仏教大学は、所蔵図書の一部のCD−ROM目録を公刊した。NEC9801タイプの装置用で、専用ソフトを使っている。これは、本質的に図書システムであるが、内容別のリストもある。書名、キーワード、著者名、発行年月日、言語の各項目によって検索できる。初版は1990年に発行されたが、今までのところ、改版は出ていない。
曹洞宗宗学研究所データベース
研究機関:曹洞宗宗学研究所
担当者:Ozaki氏
住所: 宗学研究所、駒沢大学
〒154東京都世田谷区駒沢1−23−1
電話:
FAX:
内容:東京駒沢大学にある曹洞宗の研究機関、宗学研究所は、様々な曹洞禅関連のデータ入力を開始しており、また将来、そうした活動を拡充していゆく計画である。道元の三百則、十二卷本正法眼蔵、それに最初の三卷本永平広録がすでに入力されている。
沿革:現在までのところ、データ入力は主として索引作成の目的(その最初のものは三百則索引)で行われているが、曹洞宗全書の資料入力が増加するとともに、重点が電子テキストとオンライン検索へと移行することが望まれる。この研究所は、道元とともに、他の重要な曹洞宗の代表的人物(瑩山のような)の資料入力も計画している。
環境:データはJISコードで入力され、主に電子達摩第二号に説明したOCRの方法を使っている。
浄土真宗教学研究所データベース
研究機関:浄土真宗教学研究所
担当者:内藤昭文氏
住所: 浄土真宗教学研究所
〒600京都市下京区油小路正面角
電話: (075) 371-9244
Fax:
内容:教学研究所は、大正大蔵経の様々なテキストを入力している(no. 1521, 1749, 1876, 1958, 1978, 1963, 2646, 2682)。
環境:データはJISコードで入力され、主に電子達摩第二号で説明したOCRの方法を使っている。
日本の諸大学における個人的計画
日本の大学における入力計画は、雨後の竹の子のよう
に続々と出てきている。あるものは研究所自体によって推進され、あるものは個人的に研究者や教師、あるいは学生によっており、様々なやり方でデータ入力が行われている。とりわけ人気があるのは、当研究所の大正大蔵経用漢字字形ファイル(OCRツールセットに含まれている)を使ったOCR入力の方法である。この方法は、多くの研究者個人に使われているだけでなく、あまたの研究所によっても使用されている(たとえば、京都大学、広島大学、龍谷大学など)。
入力されるテキストは、通常、主な計画実行者にとって関心のあるものに限られ、全面的な計画が含まれていることはほとんどない。こうした革命の黎明期として、自然なことではあるが、実行者たちは、より広範な利用者の関心よりも、もっぱら自分たちの関心に即応している。このため、データの質において、個人使用としては許容できても、他の研究者や研究機関の利用には受け入れ難いレベルで、妥協してしまう傾向がある。このことはまた、ほとんど誰も、JIS以外のもっと総合的なコードによる入力を、検討することさえしないように見える理由でもある
Bいまだに、内輪の小グループ用入力(それにおそらくは索引作成)と、電子刊行物用データ入力との違いに気がつかず、JISにない文字を単純に黒丸や黒四角で置き換えることが、しばしばある。
私は、次の日本の研究機関における個人的入力の努力について、情報を得ることができた:京都の長尾雅人教授は、大正大蔵経のno. 1592, 1593, 1594, 1596 を入力した(OCR, JIS)。Jonathan Silk 氏(Univ. of Michigan) もまた、OCR によって、大正大蔵経のno. 18 (部分), 23, 31, 43, 44, 46, 220 (no. 7), 232, 233, 350, 351, 352, 659 (juan 7), 1469 を入力した。 最後の五つのデータは、校正もされている。Katsura 教授(広島大学 とHayashima 教授(九州大学) の学生は、瑜伽師地論100卷(大正大蔵経no. 1579)全体を入力し、チャンドラキー
泣eィのプラサンナ・パダーや、アサンガのマハーヤナスートラ・ランカーラ(大正1604)など、いくつかの他のテキストも入力したとのことである。花園大学の沖本教授は、以前は学生にいくつかのテキスト(大正 no. 273, 670, 1484, 1558, 1666, 2883, 2901)を手入力させていたが、最近では我々の辞書を使用したOCRの方法を使って、さらにいくつかのテキストを入力している(大正no. 7, 842)。
龍谷大学の能仁氏は、大智度論(no. 1509)を入力するために、同じOCRの装備を使っており(八十卷がすでに入力され終わっている)、大正大蔵経のno. 643, 360, 366, 1749, それに417の一部分を入力し終わっている。大正大学の幾人かの教授は、種々の浄土資料入力を計画している。私は、もっともっと多くの、こうした個人的入力計画が行われているに違いないと思う。つい先日も、大阪ノートルダム聖心女学院の瀬間教授が、經律異相(大正53NO.2121)全50卷を入力したと耳にした。
環境:JISコードを使い、欠字を補うために様々な個人的工夫を凝らしている。ほとんどのデータは、NECー9801タイプの装置上で作成されている。あるものは、欠字に関して未定義のままのテキストファイルであり、これらはマッキントッシュやIBM装置上でも使うことができる。別のものは、ワープロソフト(一太郎、松など)によるファイルで、これらはJISに含まれていない文字を独自に定義することが多く、それらが作成された環境を離れた外部では使用できない。
アメリカにおける個人的入力計画
個人によって資金が調達され、運営されている多数の仏教関連の入力計画がある。たとえば、ジャミー・ヒューバード(e-mail JHUBBARD@SMITH.bitnet)は、三階教資料の入力を計画しており、バークレイ東アジア言語学部のポール・ハーンは、韓国のSamguk SagiとSamguk Yusaの歴史の入力を計画している。
環境:これらのテキストは、ETENを使い、BIGー5で入力されている。
仏教絵画データベース
担当者:John Huntington氏
住所: 同左
内容:仏教絵画のデータベース。現在のデータ量:約3ギガバイト。
沿革:ハンティングトン教授は、アジア全土から仏教美術に関する膨大な量のスライドを蒐集し、それらをテーマと特定の要素に従って分類した。彼は、この膨大な情報の貯蔵庫に、新しい方法でアクセスするための方法を開発中である。たとえば、言葉によるだけでなく、図像的要素や視覚的基準によってアクセスすることができるようにすることなどである。
環境:マッキントッシュとレーザーディスク。
日本仏教年次刊行文献
研究機関:インド学仏教学研究会デ−タベ−スセンタ
担当者:江島教授
住所: 〒113東京都文京区本郷3−33−5日本しんぱんビル7F東京大学仏教青年会
内容:1988年以来、インド学仏教学研究会は、仏教に関する日本の二次文献データベースを編纂してきている。情報は、1868年以降の、85の学術的定期刊行物に発表された全論文を網羅する予定である。表題、著者、刊行文献情報、それにキーワードの入力が、26の日本の大学で目下進行中である。
環境:NEC9801タイプの装置。区分発音記号表示のために、通常利用されているほとんどのソフトとコンパチでないデバイス・ドライバーが使われている。IBMおよびそのコンパチマシン上では、情報の一部(区分発音記号のついた文字)が失われる。
頒布:この研究会自身の定期刊行物(インド学仏教学研究)に発表された論文の表題に関するデータセットは、1989年以来、販売されている。リレーショナル・データベースとして設計されており、テキスト形式で利用するのは難しい。
クームズペーパー・データベース
研究機関:オ−ストラリア国立大学
担当者:Matthew Ciolek氏
住所: 同左
沿革:クームズペーパー・データバンクは、1991年松に創設された。
内容:クームズペーパー・データベース(電子メール住所は、**)は、1991年末に創設され、発展し続けている。これは、仏教及びその他のアジア宗教に関する電子アーカイブとデータベースを結合するシステムであり、クームズクエストと呼ばれる、より広範な情報システムの「特別計画」になっている。
社会科学及び人文科学の資料のなかに、かなりの量の東洋宗教一般と仏教に関する情報が含まれている(電子仏教アーカイブ)。このデータベースには文献一覧情報、仏教を主題とした論文、それに講話やインタビュー(ほとんどは禅師との)などが含まれている。
クームズクエストはまた、台湾の国立中央大学の中国仏典アーカイブや、ワシントンの仏典アーカイブを検索することも可能である。
ダルマフェアラー・データベース
研究機関:ダルマフェアラー共同体
担当者:Dh Vidyananda
住所: 同左
内容:東南アジアの仏教研究機関と共同体に関するデータベース。
電子掲示板上の仏教情報
内容:様々な仏教関連の資料(テキスト、翻訳、文献一覧、討論、論文など)が、世界中の電子掲示板上に掲示されている。
住所:
・日本:ニフティサーブ・ネットワークのヴィハーラ利益団体は、個人によって入力された仏教文献のディレクトリを持っている。これらのテキストには、たとえば、起信論や維摩経、それに歎異鈔など、いくつかの浄土資料などが含まれている。これらは、日本の僧侶や居士が、紙に筆で書くかわりに、コンピュータ上で入力したものである。PCバン・ネットワークのオリエント利益団体は、テキストの掲示はないが、仏教研究者に関心のある他の資料を掲示している。
・オーストラリア:住所coombs.anu.edu.au、ディレクトリ /coombspapers/otherwork/electronic-buddhist-archives/ には、文献一覧を含めて、仏教に関する様々な資料がある。
・ビットネット:buddhist@jpntuvm0には、仏教に関する自由で忌憚のない討論の場がある。これは仙台東北大学のコンピュータセンターの、川添教授によって組織されたものである。川添教授は、仏教分野における様々なコンピュータ計画に関わってきた。住所Buddha-L@ULKYVMもまた、仏典の翻訳も含めて、仏教に関する学術情報を提供している。
・アメリカ:ゲリー・レイ(GaryRay@f658.n125.z1 .fidonet.org)によって運営されているダルマネット(バークレイ)がある。このネットワークは、様々な形の仏教会議や冥想、チベットニュースなどを呼び物にしている。
・インド学:ディレクトリ/pub/indic/ のblackbox.hacc. washington.edu は、ブッダチャリタなどのような、数多くの重要な仏典の電子版を含んでいる。
・その他の接触先:ヘルガ・ディック(e-mail address UMIH@CCU. UMANITOBA.CA)は、電子ジャーナルに関して近く開催される会議の情報を持っている。シカゴ大学コンピュータセンター長のスパーバーグ・マックイーン(e-mail U35395@UICVM.UIC.EDU)は、SGML及びテキスト符合化推進会に精通している。これは、電子テキストのフォーマットと処理を標準化するための試みである。
アメリカン・宗教アカデミー・データベース
研究機関:アメリカン・宗教アカデミー(AAR)
担当者:L. Lancaster氏(電子刊行委員会会長)
住所: 同左
沿革:アカデミーの刊行委員会は、電子刊行に関する分課を創設した。この委員会は、宗教に関するデータベースの推進、その流通、及びその利用(訓練とユーザーサポート)に努力を傾注している。
内容:アメリカン・宗教アカデミー(AAR)は、マヒドール大学のパーリ語CDを頒布する予定である。また、AARの14の定期刊行物と電子学位論文シリーズのバックナンバーを収録したCDを刊行することも計画している。
研究者個人による資料
パソコン使用の増加にともなって、数多くの研究者が個人的に、自分たちの仕事(学位論文、仏典の翻訳、一般の論文、文献一覧など)を電子媒体の形で、仲間の研究者や学生が利用できるようにしている。単語や概念を検索することを可能にし、引用文をもう一度タイプする必要がなくなるために、電子版へのアクセスは、極めて役に立つ。こうした電子媒体の形での交換、及び将来における刊行(特に原本とともに翻訳)を促進するためには、著者の電子テキストの著作権保持が保証されねばならない。
オックスフォード・アーカイブ
研究機関:オックスフォ−ド電子テキスト蔵
担当者:L. Barnard氏, A. Morrison氏
住所: Lou Barnard & Alan Morrison
Oxford Text Archives
Oxford University Computing Services
13, Banbury Road
Oxford OX2 6NN
England
Tel.: (865) 273-238
e-mail: archive@vax.oxford.ac.uk
オックスフォード・テキストアーカイブには、ただ一つの仏典がしかないようである。それは、大般涅槃経のパーリ版で、ランス・カズン氏(マンチェスター大学)によって入力された。
Author:Urs APP
Last updated: 95.4.16