情報検索課題 (version 980625)
-----------------------------
1998年6月25日
1.イントロダクション
3.交換データフォーマット
IREXから参加者へ配布する検索課題のフォーマットと、参加者からIREXに提出
する検索結果フォーマットを定義する。
* {}内は、その意味を表わす。
* EUC文字列には、いかなる半角文字(アルファベット、半角数字、半角記号、半角ス
ペース、タブ、改行)も含まない。
* 隣接するタグの間には0個以上の改行が含まれる。
3.1.検索課題フォーマット
検索課題ファイル := 検索課題*
検索課題 := 検索課題内容
検索課題内容 := 検索課題ID 検索要求 検索要求説明
検索課題ID := 検索課題ID内容
検索課題ID内容 := [0-9]* {検索課題のID番号}
検索要求 := 検索要求内容
検索要求内容 := EUC文字列
{検索要求の簡潔な表現。主に修飾語を伴なった名詞句。}
検索要求説明 := 検索要求説明内容
検索要求説明内容 := EUC文字列
{人間が見て可能な限り曖昧なく判断ができる程度に詳細な検索要求の記述。
複数の文で表現され、必要ならば、辞書記述、同義語、具体例も含む。}
3.2.検索結果フォーマット
検索結果ファイル := 検索結果*
検索結果 := 検索結果内容
検索結果内容 := 検索課題ID 検索結果記事情報*
検索課題ID := 検索課題ID内容
検索課題ID内容 := [0-9]* {検索課題のID番号}
検索結果記事情報 := 記事ID
{RANKは該当記事の検索結果における順位を示す。順位は上であるほど、より
検索課題に該当する可能性が高いとシステムが判断した事を意味する。}
記事ID := [0-9]*
{記事のID番号。毎日新聞をmai2sgml.plのプログラムで変更した際に
得られるIDを利用する。}