Kyoto University, Institute for Research in Humanities

平成15年度漢籍担当職員講習会: 文字コードとテキスト処理の歴史

 Author: クリスティアン・ウィッテルン
   Date:    2003-10-01

目次

東アジア情報処理の概要

基本概念と用語

符号化方式

ロケールに依存しない符号化方式

ロケール固有の符号化方式

東アジアの符号化方式を比較する

国際符号化方式

国際基準

コード 漢字数
ISO 10646-1:1993 (2000) 20902
Unicode 1.0.0 (October, 1991) 20902
Unicode 2.1.2 (May, 1998) 21204
Unicode 3.0.0 (September, 1999) 27484
Unicode 3.1.0 (March, 2001) 70195
Unicode 4.0.0 (April, 2003) 70195 + 64 (易經の六十四卦)

漢字コードの問題点

テキストの変化と発展

過去 — アナログ 媒体

現在・未来 — ディジタル 中国の二十五正史

漢籍仏教関係の電子資料

電子仏典推進協議会。

1993年以来、電子仏典推進協議会がいくつかのミーティングやワーク・ショップを行った。電子仏典推進協議会の目的はさまざまな仏典関係入力計画の横の連絡・情報交換・方法コオディネーションにある。

CD-ROM の出版物

大規模漢文データベース作成のため

ウルス・アップ氏による、電子達磨 第3号 (http://www.iijnet.or.jp/iriz/irizhtml/maketext/guidelinj.htm)

電子化テキストの記述方法

SGMLとは?

SGMLの関連規格

SGMLに関連した,次のような規格があります。

XML 拡張可能なマーク付け言語。ネットワークでの文書交換を効果的にするために,SGMLの一部の規格を制限したものです。W3Cによって制定されました。
HTML ハイパーテキストマーク付け言語。ウェブで使われている文書様式で,SGMLの一つの文書型です。W3Cによって制定されました。
TEI TEIコンソーシアムによって制定されました、人文科学関係資料や全文データベース作成のためのSGML文書型。

SGMLの概念

SGML関連情報

テキスト・エンコーディング・イニシアチブ(TEI) とは何か

TEI の現在

TEI の未来

TEI の目標

既存の優れた実践を踏まえたユーザ主体の法則化。

TEI の作業方針

TEI P4 の成果

TEI の利用者

http://www.tei-c.org/Applications を参照。

TEI 関連情報


Date:    2003-10-01,  Author: クリスティアン・ウィッテルン.