BABYL OPTIONS: Version: 5 Labels: Note: This is the header of an rmail file. Note: If you are seeing it in rmail, Note: it means the file has no messages in it.  1, filed,, Summary-line: 13-Mar to: irex@karc.crl.go.jp #[irex 172] IREX NE Restricted topic definition Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id MAA26773 for ; Sat, 13 Mar 1999 12:47:59 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id MAA10820 for ; Sat, 13 Mar 1999 12:50:29 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id CAA08641; Sun, 14 Mar 1999 02:44:54 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id CAA19542; Sun, 14 Mar 1999 02:44:53 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id CAA11709; Sun, 14 Mar 1999 02:39:32 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id CAA11704 for ; Sun, 14 Mar 1999 02:39:31 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id CAA25129 for ; Sun, 14 Mar 1999 02:38:23 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id CAA19537 for ; Sun, 14 Mar 1999 02:44:49 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id CAA27131 for ; Sun, 14 Mar 1999 02:44:47 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id MAA25502; Sat, 13 Mar 1999 12:44:31 -0500 (EST) Date: Sat, 13 Mar 1999 12:44:31 -0500 (EST) From: Satoshi Sekine Message-Id: <199903131744.MAA25502@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 172 Subject: [irex 172] IREX NE Restricted topic definition Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 868 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Sat, 13 Mar 1999 12:44:31 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 172 Subject: [irex 172] IREX NE Restricted topic definition Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 868 IREXメイリングリストの皆様: This message concerns IREX NE restricted topic test. As far as I know, all participants of the task can read Japanese, so this message is writen only in Japanese. If you need information in English, please let me know. Thank you. IREX-NEのトピック限定のトピック(このメイル)と、 そのトレーニングデータ(次のメイル)を公開します。 -- definition.txt ---- IREX-NEのトピック限定試験のトピック 逮捕に関する記事で、警察庁、警視庁、各都道府県警察、 諸外国の同等機関が容疑者を逮捕したという情報がある記事。 別の話題に関連して、過去の逮捕が述べられている場合なども含む。 ただし、逮捕状の請求、告訴、書類送検のみの情報のものは除く。 ---------------------- 上記の定義は、将来のIREXパッケージでは、NE_RESTRICT/definition.txt というファイルとなります。  1, answered, filed,, Summary-line: 13-Mar to: irex@karc.crl.go.jp #[irex 173] IREX-NE restricted topic - training data Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id MAA26782 for ; Sat, 13 Mar 1999 12:50:31 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id MAA10836 for ; Sat, 13 Mar 1999 12:53:01 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id CAA08677; Sun, 14 Mar 1999 02:47:38 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id CAA19597; Sun, 14 Mar 1999 02:47:36 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id CAA11725; Sun, 14 Mar 1999 02:42:16 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id CAA11720 for ; Sun, 14 Mar 1999 02:42:15 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id CAA25133 for ; Sun, 14 Mar 1999 02:41:06 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id CAA19592 for ; Sun, 14 Mar 1999 02:47:32 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id CAA27148 for ; Sun, 14 Mar 1999 02:47:16 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id MAA25505; Sat, 13 Mar 1999 12:47:16 -0500 (EST) Date: Sat, 13 Mar 1999 12:47:16 -0500 (EST) From: Satoshi Sekine Message-Id: <199903131747.MAA25505@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 173 Subject: [irex 173] IREX-NE restricted topic - training data Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 23908 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Sat, 13 Mar 1999 12:47:16 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 173 Subject: [irex 173] IREX-NE restricted topic - training data Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 23908 IREX-NEトピック限定試験のトレーニングデータです。 -- instruction.txt ------------ NERT (IREX-NE Restricted topic training data) の復元方法 -------------------------------------------------------- 1. IREXパッケージをインストールしてください。 (この目的のためには、990215以上のバージョンを使用してください。) パッケージのトップディレクトリをIREX_ROOTと呼びます。 また、IREX_ROOT/NE_TOOLS/mai2sgml/mai2sgml.plに従って 毎日新聞の94年版データをSGML化し、IREX_ROOT/MAINICHIの ディレクトリに置いてください。 2. あなたの環境にあったteaプログラムを作成します。 cd IREX_ROOT/NE_TOOLS/tea Solarisを使用している場合: ln -s tea_solaris tea SlunOSを使用している場合: ln -s tea_slunos tea それ以外: make teaというプログラムが実行可能になっている筈です。 3. このメイルの"---NERT.idx---"以下の部分を適当な場所に NERT.idxという名前でセーブします。(将来のIREXパッケージでは IREX_ROOT/NE_RESTRICT以下に置かれます。 4. 新聞記事データを復元します。 NERT.idxのあるディレクトリで、 IREX_ROOT/NE_TOOLS/tea/tea -a NERT.idx IREX_ROOT/MAINICHI/mai94.sgml > NERT.sgml と実行してください。 新たに作成されたNERT.sgmlがトピック限定のNEにおける トレーニングデータです。 ---NERT.idx------ # # TEST for test.key # TAGSET ORGANIZATION TAGSET PERSON TAGSET LOCATION TAGSET ARTIFACT TAGSET DATE TAGSET TIME TAGSET MONEY TAGSET PERCENT TAGSET OPTIONAL TAGSET ? DOCNO 940414247 @ 3 9 日本興業銀行 @ 12 16 ワリコー @ 20 23 1万円 @ 37 41 大阪府警 @ 43 45 大阪 @ 47 53 日本興業銀行 @ 60 64 ワリコー @ 71 79 大阪府警捜査二課 @ 80 84 曽根崎署 @ 85 88 十三日 @ 105 108 山崎悟 @ 169 173 ワリコー @ 185 188 警察庁 @ 202 205 一万円 @ 221 225 ワリコー @ 296 298 山崎 @ 326 330 長底楢雄 @ 340 344 冨田正幸 @ 371 375 今月五日 @ 376 378 山崎 @ 382 388 大阪市中央区 @ 442 444 山崎 @ 500 504 ワリコー @ 542 546 ワリコー @ 582 584 長底 @ 585 587 冨田 DOCNO 940414254 @ 3 6 鹿児島 @ 12 28 鹿児島ペーパードライバーサービス @ 42 44 大阪 @ 64 68 鹿児島市 @ 112 119 兵庫県警防犯課 @ 120 127 近畿郵政監察局 @ 130 133 十三日 @ 134 140 鹿児島市武三 @ 147 163 鹿児島ペーパードライバーサービス @ 172 176 六十二円 @ 215 219 熊谷仁男 @ 229 232 紫原一 @ 238 243 春田多恵子 @ 253 255 武三 @ 260 263 郵便法 @ 289 291 熊谷 @ 346 350 六十二円 @ 399 402 郵政省 DOCNO 940414257 @ 4 12 アトニー外語学院 @ 33 37 兵庫県警 @ 39 41 大阪 @ 45 46 英 @ 51 59 アトニー外語学院 @ 64 69 大阪市北区 @ 95 103 兵庫県警尼崎北署 @ 104 107 十三日 @ 108 117 大阪府守口市外島町 @ 124 128 新見英明 @ 148 151 逸見明 @ 159 168 兵庫県西宮市大社町 @ 196 198 新見 @ 202 204 逸見 @ 212 215 十二日 @ 215 216 夜 @ 217 225 尼崎市南塚口町一 @ 229 232 塚口校 @ 240 256 ピーター・フレデリック・ゴードン @ 265 269 ゴードン DOCNO 940414264 @ 3 5 大阪 @ 6 8 旭区 @ 9 15 天理教分教会 @ 36 38 大阪 @ 40 43 十三日 @ 43 48 午後零時半 @ 51 59 大阪市旭区中宮五 @ 60 69 天理教八阪木分教会 @ 71 76 松尾多喜三 @ 86 88 富子 @ 114 116 松尾 @ 138 146 大阪府警捜査一課 @ 147 149 旭署 @ 160 162 前夜 @ 164 166 松尾 @ 179 185 大阪市福島区 @ 192 198 伊豆嶋登美子 @ 218 222 京都府警 @ 280 283 伊豆嶋 @ 287 291 午前十時 @ 298 300 富子 DOCNO 940414308 @ 4 7 イラク @ 22 27 ベイルート @ 29 32 カイロ @ 32 35 14日 @ 35 39 田嶌徳弘 @ 40 45 ベイルート @ 56 59 イラク @ 68 79 タレブ・アリ・スヘイル @ 85 88 十二日 @ 88 89 夜 @ 90 95 ベイルート @ 104 108 レバノン @ 113 116 十三日 @ 117 123 イラク大使館 @ 139 143 スヘイル @ 146 149 イラク @ 150 154 フセイン @ 163 171 自由イラク評議会 @ 182 184 昨夏 @ 185 188 イラク DOCNO 940414349 @ 3 5 滋賀 @ 17 20 18日 @ 39 41 大阪 @ 43 46 滋賀県 @ 48 53 昨年十一月 @ 84 87 東京都 @ 89 95 群馬、静岡県 @ 130 133 警察庁 @ 134 137 十四日 @ 138 141 警視庁 @ 142 153 滋賀、静岡、群馬各県警 @ 162 165 十八日 @ 183 187 滋賀県警 @ 203 207 下山信一 @ 239 241 下山 @ 246 250 滋賀県警 @ 257 263 東京都足立区 @ 265 270 昨年十二月 @ 279 282 小林正 @ 310 314 数百万円 @ 354 357 警察庁 DOCNO 940414364 @ 3 10 テクノ電機産業 @ 41 43 大阪 @ 57 64 テクノ電機産業 @ 66 72 大阪市中央区 @ 73 77 昨年九月 @ 103 110 大阪地検特捜部 @ 121 125 二宮順治 @ 165 169 数千万円 @ 197 200 十四日 @ 324 330 松下電器産業 @ 331 337 大阪府門真市 @ 339 341 テ社 @ 378 380 テ社 @ 421 423 テ社 @ 453 455 数% @ 471 475 松下電器 @ 483 488 一昨年九月 @ 499 501 テ社 @ 510 514 二十億円 @ 530 532 二宮 @ 560 562 テ社 @ 573 576 一昨年 @ 618 620 二宮 @ 635 639 一昨年夏 @ 699 701 二宮 @ 709 713 松下電器 DOCNO 940414380 @ 32 35 ロシア @ 36 39 ロシア @ 40 47 ウラジオストク @ 110 112 共同 DOCNO 940414386 @ 3 8 コロンビア @ 21 23 NY @ 26 28 日本 @ 64 69 コロンビア @ 98 103 六、七億円 @ 114 117 十四日 @ 118 125 警視庁捜査三課 @ 126 129 大塚署 @ 138 145 米ニューヨーク @ 269 277 モラーノ・ロペス @ 301 305 今年一月 @ 307 309 先月 @ 345 352 イバン・ダリオ @ 382 384 千葉 @ 385 388 神奈川 @ 393 397 昨年一月 @ 490 495 コロンビア @ 516 521 コロンビア @ 525 534 サンタフェデボゴタ @ 538 544 ニューヨーク @ 545 550 一九九〇年 @ 584 590 ニューヨーク @ 614 616 日本 @ 644 648 昨年初め @ 650 652 東京 @ 678 681 ダリオ @ 689 693 昨年四月 @ 732 735 千葉市 @ 969 978 サンタフェデボゴタ DOCNO 940414388 @ 30 33 横須賀 @ 34 37 十三日 @ 37 45 午後十時五十五分 @ 48 58 神奈川県横須賀市佐原 @ 63 72 横浜市金沢区野島町 @ 77 81 竹内逸人 @ 111 119 横須賀市阿部倉町 @ 122 126 鈴木照夫 @ 144 146 長瀬 @ 149 153 佐藤賀一 @ 172 175 浦賀署 @ 176 178 竹内 @ 204 206 竹内 DOCNO 940414391 @ 12 14 川崎 @ 20 23 川崎市 @ 25 28 十一日 @ 28 29 夜 @ 48 51 川崎署 @ 54 60 連合捜査本部 @ 61 64 十四日 @ 67 76 横浜市港南区日野南 @ 115 118 十一日 @ 118 123 午後七時半 @ 126 137 川崎市川崎区大師駅前二 @ 144 147 川中島 @ 185 190 九万一千円 @ 203 207 二十分後 @ 210 213 渡田四 @ 236 241 九千五百円 @ 260 263 川崎市 @ 274 280 先月三十一日 @ 281 287 横浜市港北区 @ 326 329 十三日 @ 329 330 朝 @ 331 341 川崎市中原、宮前両区 DOCNO 940415082 @ 3 9 イラク大使館 @ 23 27 レバノン @ 27 28 外 @ 30 35 ベイルート @ 45 49 レバノン @ 50 53 ブエズ @ 53 54 外 @ 56 59 14日 @ 60 63 イラク @ 82 86 レバノン @ 87 93 イラク大使館 @ 129 132 イラク @ 133 137 フセイン @ 152 157 ベイルート @ 172 175 カイロ DOCNO 940415198 @ 20 23 5万円 @ 30 32 中国 @ 40 42 大阪 @ 111 114 警察庁 @ 121 124 アジア @ 151 155 兵庫県警 @ 156 159 十四日 @ 181 184 五万円 @ 231 239 神戸市中央区元町 @ 246 252 先月三十一日 @ 273 275 中国 @ 278 281 生田署 @ 283 295 出入国管理及び難民認定法 @ 391 395 今月四日 @ 416 419 アジア @ 536 538 中国 @ 546 549 五万円 @ 552 554 中国 @ 602 608 二十―三十倍 @ 617 619 元町 @ 630 634 四百万円 DOCNO 940415201 @ 15 17 上田 @ 44 46 大阪 @ 48 51 警察庁 @ 82 86 上田宜範 @ 116 119 十四日 @ 161 163 静岡 @ 204 213 大阪、長野両府県警 @ 287 289 上田 @ 293 298 一九九〇年 @ 301 308 静岡県御殿場市 @ 362 367 ブロバリン @ 401 403 上田 @ 418 421 大阪府 @ 422 428 大和川河川敷 @ 470 475 大阪府堺市 @ 554 556 上田 @ 560 564 昨年十月 @ 565 569 一昨年夏 @ 590 596 大阪市住吉区 DOCNO 940415212 @ 3 6 柏井耕 @ 24 28 大阪地検 @ 30 32 大阪 @ 34 38 大阪地検 @ 39 41 上田 @ 45 48 十五日 @ 49 56 大阪市東淀川区 @ 60 64 藤原三平 @ 99 102 十九日 @ 104 111 大阪市住之江区 @ 118 121 柏井耕 DOCNO 940415341 @ 3 7 国沢鉄山 @ 34 38 大阪府警 @ 40 42 大阪 @ 44 50 大阪市生野区 @ 51 58 一九九一年八月 @ 59 63 会津小鉄 @ 68 72 国沢鉄山 @ 107 115 大阪府警捜査四課 @ 131 134 山口組 @ 141 145 冨永国昭 @ 170 173 十五日 @ 173 174 朝 @ 176 185 京都府綴喜郡田辺町 @ 203 205 国沢 @ 249 251 冨永 @ 260 264 浅山重道 @ 276 278 九日 @ 278 283 午前九時半 @ 286 292 大阪市生野区 @ 296 298 国沢 @ 324 328 午後三時 @ 331 341 京都府乙訓郡大山崎町 @ 356 358 国沢 @ 388 390 十日 @ 390 392 未明 @ 393 396 田辺町 DOCNO 940415345 @ 3 5 タイ @ 27 29 大阪 @ 30 33 水上署 @ 35 37 大阪 @ 39 46 大阪府警水上署 @ 47 50 十五日 @ 54 56 タイ @ 91 96 大麻取締法 @ 99 102 関税法 @ 115 119 大阪地検 @ 128 138 大阪市住吉区我孫子五 @ 139 142 橋爪暁 @ 149 158 東住吉区住道矢田四 @ 159 162 三国勉 @ 167 177 兵庫県西宮市青葉台一 @ 178 182 戸田貴久 @ 187 198 大阪府四条畷市江瀬美町 @ 199 202 竹中聡 @ 215 222 大阪市住之江区 @ 230 234 昨年九月 @ 245 251 スタジオワン @ 258 264 昨年八月中旬 @ 266 271 十二月下旬 @ 279 281 タイ @ 299 303 七十万円 @ 337 341 大阪税関 DOCNO 940416087 @ 3 7 スマトラ @ 23 24 華 @ 42 47 ジャカルタ @ 47 50 15日 @ 50 54 柳田博信 @ 55 61 インドネシア @ 63 68 スマトラ島 @ 73 76 メダン @ 77 85 十四、十五の両日 @ 128 129 華 @ 216 217 日 @ 226 237 メダン駐在日本総領事館 @ 257 260 十五日 @ 261 262 日 @ 266 273 PT・SOCI @ 274 294 シナル・オレオケミカル・インタナショナル @ 295 299 深沢正昭 @ 327 329 日本 @ 366 370 二時間後 @ 445 449 日本油脂 @ 450 453 資生堂 @ 454 456 丸紅 @ 457 461 日立造船 @ 493 494 日 @ 516 517 華 @ 526 531 一九八〇年 @ 532 540 ジャワ島スマラン @ 552 553 華 @ 589 591 先月 @ 625 628 十五日 @ 628 629 夜 @ 666 670 メダン市 @ 681 682 華 @ 687 690 一四% @ 698 704 インドネシア @ 735 737 米国 @ 771 772 華 @ 780 784 六億ドル DOCNO 940416205 @ 3 5 中国 @ 20 22 大阪 @ 23 26 八尾署 @ 28 30 大阪 @ 32 42 大阪府八尾市高砂町五 @ 50 52 中国 @ 54 57 劉躍先 @ 92 95 八尾署 @ 96 99 十五日 @ 102 105 幸町一 @ 114 118 中島一郎 @ 153 156 幸町五 @ 163 166 林正美 @ 178 182 高砂町一 @ 187 189 正人 @ 197 204 岸和田市下松町 @ 205 208 東孝俊 @ 224 226 中島 @ 247 249 前日 @ 250 253 十三日 @ 253 254 夕 @ 255 257 中島 @ 312 314 中国 @ 356 357 劉 DOCNO 940416213 @ 29 31 大阪 @ 39 47 神奈川県警防犯課 @ 48 51 鶴見署 @ 52 55 十五日 @ 108 117 大阪市大正区泉尾七 @ 122 126 酒井紀之 @ 216 218 酒井 @ 222 226 昨年二月 @ 254 260 東京都大田区 @ 289 294 二万四千円 @ 303 305 酒井 @ 367 369 酒井 @ 376 379 北海道 @ 381 383 九州 DOCNO 940416268 @ 23 25 大阪 @ 26 29 心斎橋 @ 31 33 大阪 @ 35 38 十六日 @ 38 44 午前五時五分 @ 47 58 大阪市中央区心斎橋筋二 @ 65 72 平野区平野西一 @ 77 81 丸谷靖史 @ 132 134 丸谷 @ 164 166 丸谷 @ 189 195 大阪府警南署 @ 208 221 奈良県宇陀郡榛原町天満台西 @ 225 228 南勝也 @ 236 244 大阪市浪速区大国 @ 249 253 仲林英樹 DOCNO 940416312 @ 17 21 NY市警 @ 23 29 ニューヨーク @ 29 32 15日 @ 32 36 田原護立 @ 37 47 ニューヨーク市警本部 @ 48 51 十五日 @ 52 63 マンハッタン・ハーレム @ 113 117 三〇分署 @ 181 186 数十万ドル @ 215 219 一年半前 @ 237 242 連邦検察局 DOCNO 940417159 @ 3 6 富岡市 @ 32 34 群馬 @ 35 43 群馬県警捜査二課 @ 44 47 富岡署 @ 48 51 十六日 @ 54 57 富岡市 @ 70 82 東京都中央区日本橋本町四 @ 89 93 浅野工事 @ 95 99 雑賀俊一 @ 103 105 東京 @ 109 112 綿津洋 @ 117 126 千葉県我孫子市古戸 @ 137 141 土橋正共 @ 146 155 千葉市花見川区畑町 @ 193 196 富岡市 @ 242 247 富岡営業所 @ 249 253 本郷嘉康 @ 261 270 東京都文京区春日一 @ 284 293 一九九二年八月中旬 @ 294 296 本郷 @ 300 303 富岡市 @ 305 309 広木康二 @ 324 328 五百万円 @ 335 337 広木 @ 344 350 二十日ほど後 @ 367 369 本郷  1, filed,, Summary-line: 13-Mar to: irex@karc.crl.go.jp #[irex 174] IREX-NE restricted topic - discussion Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id NAA27307 for ; Sat, 13 Mar 1999 13:21:54 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id NAA11097 for ; Sat, 13 Mar 1999 13:24:18 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id DAA08798; Sun, 14 Mar 1999 03:18:53 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id DAA19882; Sun, 14 Mar 1999 03:18:52 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id DAA11795; Sun, 14 Mar 1999 03:13:32 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id DAA11790 for ; Sun, 14 Mar 1999 03:13:31 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id DAA25144 for ; Sun, 14 Mar 1999 03:12:22 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id DAA19864 for ; Sun, 14 Mar 1999 03:18:48 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id DAA27337 for ; Sun, 14 Mar 1999 03:18:42 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id NAA25540; Sat, 13 Mar 1999 13:18:41 -0500 (EST) Date: Sat, 13 Mar 1999 13:18:41 -0500 (EST) From: Satoshi Sekine Message-Id: <199903131818.NAA25540@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 174 Subject: [irex 174] IREX-NE restricted topic - discussion Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 506 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Sat, 13 Mar 1999 13:18:41 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 174 Subject: [irex 174] IREX-NE restricted topic - discussion Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 506 IREX-NEトピック限定試験のトレーニングデータを作成した際に 作成者間(江里口さん(NTTデータ)と関根)の間で交された 電子メイルも公開します。IREXホームページの過去のメイルに ポインタがあります。(実際には以下のアドレス) http://cs.nyu.edu/cs/projects/proteus/irex/ML/eriseki2.txt 最初は違う課題を考えていたので、前半はちょっと別の話に なっていますが、NEのタグ付けの話としては同じなのでそのまま 載せておきます。 関根  1, filed, answered,, Summary-line: 17-Mar tokunaga@adin.co.jp #[irex 177] Processing time Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id FAA26213 for ; Wed, 17 Mar 1999 05:55:26 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id FAA07741 for ; Wed, 17 Mar 1999 05:57:59 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id TAA10128; Wed, 17 Mar 1999 19:48:26 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id TAA25425; Wed, 17 Mar 1999 19:48:25 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id TAA14110; Wed, 17 Mar 1999 19:43:05 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id TAA14105 for ; Wed, 17 Mar 1999 19:43:03 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id TAA01518 for ; Wed, 17 Mar 1999 19:41:52 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id TAA25417 for ; Wed, 17 Mar 1999 19:48:20 +0900 (JST) Received: from azusa.adin.co.jp (mail.adin.co.jp [202.213.164.130]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id TAA19308 for ; Wed, 17 Mar 1999 19:48:19 +0900 (JST) Received: from tukuba.adin.co.jp (tukuba.adin.co.jp [172.16.16.12]) by azusa.adin.co.jp (8.8.8/8.8.8) with ESMTP id TAA28492; Wed, 17 Mar 1999 19:48:34 +0900 (JST) Received: from tukuba.adin.co.jp (localhost.adin.co.jp [127.0.0.1]) by tukuba.adin.co.jp (8.8.5/8.8.5) with ESMTP id UAA18661; Wed, 17 Mar 1999 20:18:41 +0900 (JST) Message-Id: <199903171118.UAA18661@tukuba.adin.co.jp> To: irex@karc.crl.go.jp cc: tokunaga@adin.co.jp Date: Wed, 17 Mar 1999 20:18:41 +0900 From: Masahiko Tokunaga Reply-to: tokunaga@adin.co.jp X-Sequence: irex 177 Subject: [irex 177] Processing time Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 887 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f To: irex@karc.crl.go.jp cc: tokunaga@adin.co.jp Date: Wed, 17 Mar 1999 20:18:41 +0900 From: Masahiko Tokunaga Reply-to: tokunaga@adin.co.jp X-Sequence: irex 177 Subject: [irex 177] Processing time Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 887 IR参加予定のアドイン研究所の徳永です。 今まで、処理時間に関して議論がされていないようですが、 機能と処理時間はトレードオフであり、処理時間も重要なファクターで あると思います。 参考情報として後から参照可能な形でどこかに記述していただくことは 可能でしょうか? 既にシステム作成もかなり進んでいると思いますので、結果フォーマットを 修正することは無理としても、試験終了後のアンケートに項目を用意する などで対応していただければと思います。 よろしくお願いいたします。 ------------------------------------------------------------------ __ 徳永 雅彦 (株)アドイン研究所 /| | | TEL: 03-3288-7314 FAX: 03-3288-7334 / _|| |/| e-mail: tokunaga@adin.co.jp /_|_||_| | URL: http://www.adin.co.jp/ ------------------------------------------------------------------  1, filed,, Summary-line: 17-Mar to: irex@karc.crl.go.jp #[irex 178] Processing time Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id IAA26894 for ; Wed, 17 Mar 1999 08:22:57 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id IAA08334 for ; Wed, 17 Mar 1999 08:25:31 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id WAA11260; Wed, 17 Mar 1999 22:20:39 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id WAA28519; Wed, 17 Mar 1999 22:20:37 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id WAA15073; Wed, 17 Mar 1999 22:15:18 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id WAA15067 for ; Wed, 17 Mar 1999 22:15:17 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id WAA01599 for ; Wed, 17 Mar 1999 22:14:06 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id WAA28511 for ; Wed, 17 Mar 1999 22:20:33 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id WAA20845 for ; Wed, 17 Mar 1999 22:20:32 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id IAA00767; Wed, 17 Mar 1999 08:19:52 -0500 (EST) Date: Wed, 17 Mar 1999 08:19:52 -0500 (EST) From: Satoshi Sekine Message-Id: <199903171319.IAA00767@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu, tokunaga@adin.co.jp In-reply-to: Masahiko Tokunaga's message of Wed, 17 Mar 1999 20:18:41 +0900 <199903171118.UAA18661@tukuba.adin.co.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 178 Subject: [irex 178] Processing time Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2487 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Wed, 17 Mar 1999 08:19:52 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu, tokunaga@adin.co.jp In-reply-to: Masahiko Tokunaga's message of Wed, 17 Mar 1999 20:18:41 +0900 <199903171118.UAA18661@tukuba.adin.co.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 178 Subject: [irex 178] Processing time Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2487 徳永様、御意見ありがとうございます。 試験後のアンケートには、NACSISで使用されたアンケートと 同じものを使用させていただく事をNACSISから許可をもらっており その予定でいます。このアンケートには処理時間を記載する箇所が ありますので、御指摘の点はカバーされております。 また、個人的に、先日私が募集した結果分析についての質問が ありました。内容は、一般に公開されない情報が分析者に渡るので はないかという危惧でした。基本的には、そのような事はありません。 IRの結果については参加者には、各判定者の判断や各システムの 結果も含んだファイルを公開する事を前に決めています。(議事録2。 もちろんシステムの名前はSYSTEM-IDであり、実名ではありません)。 分析作業はこれらの情報を基に行なってもらいます。NEの方は 各システムの個々の結果は一般に公開されませんが、私が想定して いた分析では、ここまでの情報を利用するものではありません。 各システムのタグ種類毎の総合結果が、同じくSYSTEM-IDと共に 公開されます。これだけを基に分析を行ってもらうつもりです。 したがって、上記の危惧は特にご心配いただく事はありません。 もちろん、分析者にアイデアがあって、それが妥当だと認められる 時にはNEの内部の情報を分析者にお渡ししたいと思う事があるかも しれませんが、その時には皆さんの許可を乞います。 という事で、誰でもできる分析ではあるのですが、ワークショップ までに結果を出して、そこで発表していただければという目的で 分析者を募集いたしました。残念ながら今の所応募がないのですが、 たとえば、データフュージョンや、情報検索システムの精度向上 の研究などに最適なテーマだと思います。19日までに応募がない場合は その後も募集を受け付けますのでよろしくお願いいたします。 関根 ------------------ 議事録2から抜粋 2.5 データ公開  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ・NE,IR共、正解データは一般に公開する。 ・ただし、IRについては作成に手間がかかるのと、参加を促すために、以下の ように 公開内容に差をつける。 * IR参加者、審判者には、各システムが出したランクの情報、各判定者の判 定結果と それにかかった時間などのIRの詳細データを公開。 * それ以外の人には(IREXに無関係な人も含む)、IRのデータは関連記事かど うかの 最終判断として作られた0/1のデータのみを公開。 [意見] ・規定に同意しなければデータをダウンロードできないようにするなど、もう 少し 制約をつけてはどうか。  1, filed,, Summary-line: 19-Mar to: irex@karc.crl.go.jp #[irex 179] Q and A Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id OAA17095 for ; Fri, 19 Mar 1999 14:42:12 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id OAA12739 for ; Fri, 19 Mar 1999 14:44:48 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id EAA02362; Sat, 20 Mar 1999 04:39:25 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id EAA04966; Sat, 20 Mar 1999 04:39:24 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id EAA05810; Sat, 20 Mar 1999 04:34:05 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id EAA05805 for ; Sat, 20 Mar 1999 04:34:04 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id EAA05203 for ; Sat, 20 Mar 1999 04:32:51 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id EAA04961 for ; Sat, 20 Mar 1999 04:39:20 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id EAA26756 for ; Sat, 20 Mar 1999 04:39:18 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id OAA03013; Fri, 19 Mar 1999 14:39:18 -0500 (EST) Date: Fri, 19 Mar 1999 14:39:18 -0500 (EST) From: Satoshi Sekine Message-Id: <199903191939.OAA03013@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 179 Subject: [irex 179] Q and A Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1226 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Fri, 19 Mar 1999 14:39:18 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 179 Subject: [irex 179] Q and A Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1226 IREX MLの皆様: IRの試験についてとシステムIDについて質問がありました。 皆様にも関係する内容なので、メイリングリストにも返答します。 > 1)新聞記事データのバグについて > ルール中の > 「毎日新聞記事データの95年8月23、24日のデータではID番号が重複している部 > 分が > ある。システムがこの部分を結果として返したとしても、評価ではこれを含めな > い。」 > という記述について、ここで、評価には含めない「この部分」というのは、95 > 年8月23,24日のデータ全部を指すのでしょうか、それともID番号が重複し > ている部分のみを指すのでしょうか? たしかにこれは曖昧でした。 予備試験では23、24日のすべてのデータを対象外としました。 本試験でも同様に95年8月23、24日のデータすべてを対象外と します。 > 2)システムIDについて > 私どもは、予備試験に参加していないためか、まだシステムIDを頂いておりませ > ん。 > これはいずれ連絡があるのでしょうか? 予備試験に参加された方は同じIDを使用してください。 まだ連絡差し上げてない方にはなるべく早く御連絡いたします。 関根  1, filed,, Summary-line: 24-Mar to: irex@karc.crl.go.jp #[irex 180] system ID & IR judge Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA23744; Wed, 24 Mar 1999 09:19:43 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA01374; Wed, 24 Mar 1999 09:22:21 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id XAA01445; Wed, 24 Mar 1999 23:17:58 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id XAA07797; Wed, 24 Mar 1999 23:17:57 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id XAA07033; Wed, 24 Mar 1999 23:12:39 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id XAA07028 for ; Wed, 24 Mar 1999 23:12:38 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id XAA06855 for ; Wed, 24 Mar 1999 23:11:21 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id XAA07792 for ; Wed, 24 Mar 1999 23:17:53 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id XAA18322 for ; Wed, 24 Mar 1999 23:17:51 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id JAA06213; Wed, 24 Mar 1999 09:17:51 -0500 (EST) Date: Wed, 24 Mar 1999 09:17:51 -0500 (EST) From: Satoshi Sekine Message-Id: <199903241417.JAA06213@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 180 Subject: [irex 180] system ID & IR judge Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1169 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Wed, 24 Mar 1999 09:17:51 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 180 Subject: [irex 180] system ID & IR judge Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1169 Dear IREX-ML members: 1. We distributed system ID for the participants who have not yet got one. 2. If you want to participate IR judge , please let me know. (Of course you have to be able to read Japanese...) ------------------------- 1.システムID まだシステムIDをお知らせしていなかった参加者にシステムIDを お送りしました。システムIDが不明な方、問題のある方が いらっしゃいましたら、関根までメイルをください。 2. IR判定者 そろそろ本試験が近付いております。IRの判定者を募集します。 予備試験でやっていただいた方には原則やっていただけるものと 思っておりますが、問題のある方は御知らせください。また、 予備試験では参加しなかったけれども、参加したいという方が いらっしゃいましたら御知らせください。今回は課題の数が5倍 ありますので、多くの方に参加していただきたく思います。 学生の方においては、近くの学生などを誘ってみてください。 (アルバイト料、作業方針などは予備試験と同様です。) 前に決めましたとおり、IRのデータは、評価に参加した方と判定に 参加した方には、細い情報まで公開しますので、どうぞお願いします。 関根  1, filed,, Summary-line: 31-Mar to: irex@karc.crl.go.jp #[irex 181] I will be in Japan. Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id IAA17943; Wed, 31 Mar 1999 08:27:32 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id IAA19631; Wed, 31 Mar 1999 08:30:17 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.3+3.1W/3.7W) with ESMTP id WAA10699; Wed, 31 Mar 1999 22:26:45 +0900 (JST) Received: from po.crl.go.jp (localhost [127.0.0.1]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id WAA14206; Wed, 31 Mar 1999 22:26:43 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id WAA03059; Wed, 31 Mar 1999 22:21:26 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id WAA03054 for ; Wed, 31 Mar 1999 22:21:25 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id WAA00854 for ; Wed, 31 Mar 1999 22:20:04 +0900 (JST) Received: from mailgate.crl.go.jp (localhost [127.0.0.1]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id WAA14202 for ; Wed, 31 Mar 1999 22:26:39 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id WAA00872 for ; Wed, 31 Mar 1999 22:26:37 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id IAA10851; Wed, 31 Mar 1999 08:26:36 -0500 (EST) Date: Wed, 31 Mar 1999 08:26:36 -0500 (EST) From: Satoshi Sekine Message-Id: <199903311326.IAA10851@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 181 Subject: [irex 181] I will be in Japan. Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1553 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Wed, 31 Mar 1999 08:26:36 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 181 Subject: [irex 181] I will be in Japan. Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1553 IREX-MLの皆様: 以下、個人的な事ですが、IREX-MLの皆様には予め報告します。 私は5月から、8月のIREXワークショップの直前まで、これまで とは違った新しい枠組の自然言語処理技術の創造を目標にSONY-CSLに Visiting Researcherとして滞在します。 私自身、NYUでの研究もあり、招待を受け迷っていたのですが、IREX が佳境になっている丁度いい時期に日本にいれる事、将来のIREXについて、 直接皆さんと相談できる事なども考え、招待を受けました。 CSLでの研究内容は、IREXでやっている情報検索、情報抽出とは直接の 関係はないのですが、御存知の通り、CSLでは北野さんがロボカップの委 員長をされていますし、長尾さんがDiaLeagueの幹事をなさっているなど、 このような分野には理解があるようです。上司になる飯田さんからも、 IREXの仕事をする事を認めていただいています。 もちろん、IREXの将来をCSLに委ねようという意図はありません。IREX はできるかぎり公器であるべきだと考えています。 日本滞在中は、出来るだけ多くの方と直接お会いして意見交換をしたい と思っています。IREXの今後に向けて、一層のご支援をお願いいたします。 また、実際には個人的な事情から、4月1日に日本にたちます。4月は NYUの仕事をするのですが、物理的には通総研などにおります。機会が ありましたら、皆様とお会いしたいと思います。メイルアドレスは、 現在のもの(sekine@cs.nyu.edu)を使用していただければ、読めるように 設定してあります。 どうぞ、よろしくお願いいたします。 関根  1,, Received: from griffin.cs.nyu.edu (griffin.cs.nyu.edu [128.122.140.54]) by noreen.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA13141 for <\sekine@noreen.cs.nyu.edu>; Sun, 4 Apr 1999 09:11:04 -0400 (EDT) Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA25628; Sun, 4 Apr 1999 09:07:58 -0400 (EDT) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA26134; Sun, 4 Apr 1999 09:10:48 -0400 (EDT) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.3+3.1W/3.7W) with ESMTP id WAA08592; Sun, 4 Apr 1999 22:07:28 +0900 (JST) Received: from po.crl.go.jp (localhost [127.0.0.1]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id WAA20524; Sun, 4 Apr 1999 22:07:26 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id WAA02502; Sun, 4 Apr 1999 22:02:10 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id WAA02497 for ; Sun, 4 Apr 1999 22:02:09 +0900 (JST) Received: from dandelion.crl.go.jp (dandelion [133.243.71.22]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id WAA02371 for ; Sun, 4 Apr 1999 22:00:44 +0900 (JST) Received: (from sekine@localhost) by dandelion.crl.go.jp (8.8.8/3.6W) id WAA03359; Sun, 4 Apr 1999 22:04:37 +0900 (JST) Date: Sun, 4 Apr 1999 22:04:37 +0900 (JST) Message-Id: <199904041304.WAA03359@dandelion.crl.go.jp> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 182 Subject: [irex 182] IREX IR Formal Run topics Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 10726 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Sun, 4 Apr 1999 22:04:37 +0900 (JST) To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 182 Subject: [irex 182] IREX IR Formal Run topics Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 10726 Dear IREX-ML member: This is the IREX IR formal run topics. Please submit your results (up to 2 results) to irex-submit@karc.crl.go.jp by the end of April 12, 1999 (Japanese standard time). If you have two results, please put an alphabet "a" and "b" to the system ID for each result (For example, 1001a and 1001b). Follow the submission format written in IR_DEF/df981031.txt of the IREX package. The file has not changed since last October, but as we discussed in our ML, the section 4 is applicable for the formal run, too. The topic ID starts with 1007, which follows the last ID at the dry run. ------------------ IREX-IRの本試験の検索課題です。 各参加者は結果を日本時間1999年4月12日の23時59分までに irex-submit@karc.crl.go.jpに提出してください。 (大きくなる場合にはgzip+uuencodeしてもらっても構いません。) 各参加者は2つまでの結果を提出できます。2つの結果を提出する 場合には、お送りしたシステムIDに"a","b"のアルファベットを最後に 付けたものをそれぞれのシステムIDとして御使用ください。 (例えば、1001a,1001bというように) 提出結果のフォーマットはIREXパッケージのIR_FORMAL/df981031.txt に従ってください。このファイルの4節では予備試験におけるNEGの 話しがありますが、メイリングリストで議論した通り、本試験でも このNEGは採用されています。 トピックIDは予備試験の最後の番号の次の番号である1007番から 始まっています。 関根 ------------------------------------------------- 1007 駅伝の結果 スポーツとしての駅伝の結果が報道されている記事。競歩駅伝、クロスカントリー駅伝、予戦、海外での駅伝なども含む。結果の報道でなかったり、前年の結果が参照されているだけのような物は含まない。 1008 学校でのコンピュータ教育 小学校、中学校でのコンピュータに関する教育やコンピュータを利用した教育に関する記事。学校にコンピュータを導入した例や、その計画、学校内でのコンピュータ教育に関する政府や民間の会議、報告、議論などを含む。 1009 歌舞伎座での公演 歌舞伎座で演じられた歌舞伎などの公演に関する記事。出演者の話など公演自体でなくても公演に少しでも関係する話題ならばよい。大阪の新歌舞伎座の話題は除く。 1010 柑橘類の輸入 オレンジ、レモン、グレープフルーツなどの柑橘系果物の日本への輸入の記事。政府の市場解放や輸入による日本生産地の影響、値段への影響や消費者の反応などの記事を含む。 1011 関東の強盗事件の容疑者逮捕 関東(東京都、埼玉県、千葉県、神奈川県、栃木県、群馬県、茨城県)で起きた強盗事件の容疑者、犯人の逮捕が述べられている記事。強盗殺人などの複数の容疑での逮捕や、別件で逮捕された人の説明に関東での強盗容疑の逮捕が述べられている場合なども含む。事件が関東で起きている事が記事から明確である事。 1012 癌の告知 実際に癌の告知が行なわれた患者、家族の話や、癌の告知に関する医師、患者、家族などの意見の記事。癌を告知されている事が明かな場合も含める。物語など創作の話は除く。 1013 紀元前の遺跡、遺物 紀元前の遺跡、遺物についての発見、解説、展示などに関する記事。紀元前とは日本の場合は、ほぼ弥生時代中期までをいう。 1014 金融機関の不良債権の処理 銀行、証券などの金融機関における不良債権の具体的な処理についての記事。金融機関や政府、日銀などが不良債権の処理に対して具体的な決定をした施策や経営改善計画の発表などについて述べられた記事。国民や評論家、当局担当者個人の意見、まだ案の段階のもの、引用的に用いられているものなど、具体性に欠くものは除く。 1015 携帯電話、簡易型携帯電話のサービス 携帯電話、簡易型携帯電話(PHS)のサービスを提供し事業を行なう組織、そのサービス、事業内容に関する記事。サービスの開始や、サービスの拡大などサービスの内容に触れているものなら良い。携帯電話器の販売や製造のみに関する記事は除く。 1016 ゴルフのニック・プライス ゴルフ選手のニック・プライスの動向に関する記事。ゴルフの結果やインタビュー、彼に関する解説、予想や期待の記事。ゴルフ以外での動向も含める。 1017 社名変更 会社の社名変更に関する記事。社名変更の報道だけではなく、過去にあった社名変更に関する記事でもよい。合弁や合併で新しくできた会社の新会社名は除く。 1018 政治改革に対する一般国民の意見 政治改革に対する一般国民からの投書、一般国民を対象とした世論調査や街頭インタビューなど政治改革に対する一般国民の意見が述べられている記事。意見や調査対象が政治改革であることが明確であれば、どのような内容でも政治改革であるとする。政治家、政治評論家の意見、社説は一般国民の意見とはしない。 1019 台風による死者、行方不明者 日本国内における、現在または過去の台風による死者、行方不明者に言及した記事。記事中で、台風に関連した死者、行方不明者の情報があれば、主題が台風の報道でなくてもよい。また、報道は公式発表に限らない。 1020 チェチェン紛争における停戦 チェチェン紛争における停戦、戦闘の終結、休止に関する記事。停戦の提案、条件、交渉、実行、破棄など停戦に関連する物である事。 1021 電気料金の制度 日本の電気料金の制度、電気料金の値上げ、値下に関する議論についての記事。電気料金の制度に関連しない個別世帯の電気料金の話や、電化製品の電気消費量といった意味での電気料金の話は除く。 1022 南極の環境 南極の自然、生体系などを含めた広い意味での環境に関する記事。南極の探検、観測、基地、オゾンホール、政治、平和利用、国際会議に関するものでも環境に言及していれば含める。単なる、南極探検の報道、記録などは除く。 1023 南米の経済問題 南米の経済についての政治的、経済的重要人物の発言、南米での企業の経済活動、南米経済状況、その他の南米の経済に関する記事。条約名や会議名などに南米の国名、地名が使用されていても、南米の経済について直接言及していない場合には含まない。 1024 偽札事件 偽札に関する事件の記事。国内外の紙幣の偽造に関する事件、事件容疑、逮捕に関する記事。 1025 外国人の参政権 日本における外国人の選挙権や被選挙権などの参政権について少しでも触れられている記事。 1026 年金改革の財源 年金改革における財源についての記事。例えば、保険率のアップ、国庫からの借り入れ、目的税の設立、支給年齢の引き上げなどを含む。政府による決定だけではなく、案、提言、国民の声、社説による年金改革の財源に関する記事を含む。 1027 ハイビジョンテレビ ハイビジョンテレビ(高精細度テレビ、HDTV)に関する政治、企業、ユーザーなどからの情報を含む記事。ハイビジョンの標準化、実験、放送やハイビジョンの売れ行き、国内外の動向、各種論議も含む。 1028 東ティモール問題 インドネシアの東ティモール併合に関連した東ティモールの民族自決の運動に関する記事。問題の解説をはじめ、海外の反応や国際会議、国連その他の仲介の努力などを含む。 1029 病院内での感染 病院内での医師、看護婦、他の患者への二次感染について述べられている記事。病院内感染の発生、感染の予防、対策に関する記事。 1030 小説に対する文学賞の発表 小説が対象となり得る文学賞の発表の報道記事。詩、俳句、短歌、シナリオなど、小説以外のもののみが対象となる賞は含まない。また、人物の紹介や略歴に過去の受賞として載せられていたり、授賞式の報道や前年の受賞者の紹介などのみの記事も除く。 1031 米国三大自動車メーカーの日本市場での活動 米国三大自動車メーカー(ゼネラル・モーターズ、フォード、クライスラー)の日本市場での活動。活動には、日本での自動車販売、日本企業との協力、買収、販売店網の運営などを含む。 1032 米国の財政改革 米国連邦政府の赤字財政の改革方法や改革の状況などに言及した記事。財政改革との関連が明確に記されている事が必要。 1033 便秘の原因と対策 便秘の原因と対策について具体的に書かれている記事。原因については、個人的な経験や、医師などによる一般的な説明などが含まれる。対策については便秘薬や自然療法、日頃の生活の改善などどのような物でも具体的な対策であればよい。 1034 北方領土問題に対するロシアの動向 北方領土問題に対するロシア及びサハリンなどロシアの地方政府の動向に関する記事。動向には、政治家、文化人などの言動、北方領土での武力の移動、北方領土領海での違法操業拿捕なども含む。 1035 列車の脱線事故 列車、汽車、電車の脱線事故。脱線事故について述べられていれば過去の物でもよい。 1036 労働時間短縮 労働時間短縮に関する議論、実施されたという報道、実施の要求などの記事。  1,, Received: from griffin.cs.nyu.edu (griffin.cs.nyu.edu [128.122.140.54]) by noreen.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id BAA13476 for <\sekine@noreen.cs.nyu.edu>; Mon, 5 Apr 1999 01:54:16 -0400 (EDT) Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id BAA01659; Mon, 5 Apr 1999 01:51:00 -0400 (EDT) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id BAA02189; Mon, 5 Apr 1999 01:53:52 -0400 (EDT) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.3+3.1W/3.7W) with ESMTP id OAA14186; Mon, 5 Apr 1999 14:29:32 +0900 (JST) Received: from po.crl.go.jp (localhost [127.0.0.1]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id OAA02518; Mon, 5 Apr 1999 14:29:27 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990222) id OAA02326; Mon, 5 Apr 1999 14:28:06 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990222) id OAA02321 for ; Mon, 5 Apr 1999 14:28:02 +0900 (JST) Received: from dandelion.crl.go.jp (dandelion [133.243.71.22]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id OAA02723 for ; Mon, 5 Apr 1999 14:22:40 +0900 (JST) Received: (from sekine@localhost) by dandelion.crl.go.jp (8.8.8/3.6W) id OAA03904; Mon, 5 Apr 1999 14:26:33 +0900 (JST) Date: Mon, 5 Apr 1999 14:26:33 +0900 (JST) Message-Id: <199904050526.OAA03904@dandelion.crl.go.jp> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 183 Subject: [irex 183] Re: IREX IR Formal Run topics Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1220 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Date: Mon, 5 Apr 1999 14:26:33 +0900 (JST) To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 183 Subject: [irex 183] Re: IREX IR Formal Run topics Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1220 Dear IREX-ML, This mail concerns the definition of the IR formal run. As fas as I know, all of the IREX-IR participants can read Japanese, I will write this in Japanese. If you would like to know the contents in English, please let me (sekine@cs.nyu.edu) know. IREX-IRについて質問がありましたのでMLにて返事をします。 IREX/df981031.txtに提出ファイルの例があります。この例では 記事IDが10桁になっていますが、実際には9桁です。 例の更新をしていませんでしたが、次のバージョンでは更新したい と思います。すみませんでした。 それから、最新の定義は981031ではなく、990214でした。 違いは95年8月23、24日のデータのバグの件と、複数の システムIDの作成方法の話しだけなので、フォーマットには変更が ありません。混乱を招いた方には申し訳ありません。 この定義にある内容を守り提出していただけるようにお願いします。 特に2.3.にあるように、試験は一回のみ(2つの結果を提出される方は それぞれのシステムあたり一回づつ)、課題内容を見ない事など 注意してください。 # 990214の2.3.に提出数が1とありますが、これは誤りです。 # 別にお知らせしている通り、2つまで提出可能です。 関根  1,, Received: from griffin.cs.nyu.edu (griffin.cs.nyu.edu [128.122.140.54]) by noreen.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id WAA14683 for <\sekine@noreen.cs.nyu.edu>; Tue, 6 Apr 1999 22:39:20 -0400 (EDT) Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id WAA27830; Tue, 6 Apr 1999 22:36:03 -0400 (EDT) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id WAA08934; Tue, 6 Apr 1999 22:38:57 -0400 (EDT) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.3+3.1W/3.7W) with ESMTP id LAA04123; Wed, 7 Apr 1999 11:17:43 +0900 (JST) Received: from po.crl.go.jp (localhost [127.0.0.1]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id LAA18976; Wed, 7 Apr 1999 11:17:31 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id LAA15906; Wed, 7 Apr 1999 11:16:10 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id LAA15901 for ; Wed, 7 Apr 1999 11:16:09 +0900 (JST) Received: from dandelion.crl.go.jp (dandelion [133.243.71.22]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id LAA06003 for ; Wed, 7 Apr 1999 11:10:47 +0900 (JST) Received: (from sekine@localhost) by dandelion.crl.go.jp (8.8.8/3.6W) id LAA05552; Wed, 7 Apr 1999 11:14:40 +0900 (JST) Date: Wed, 7 Apr 1999 11:14:40 +0900 (JST) Message-Id: <199904070214.LAA05552@dandelion.crl.go.jp> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 184 Subject: [irex 184] IREX-IR, NE Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 7083 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Date: Wed, 7 Apr 1999 11:14:40 +0900 (JST) To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 184 Subject: [irex 184] IREX-IR, NE Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 7083 IREX-MLの皆様: IRの試験では、一部、こちらのミスでMLに登録されていない方がおり その方への課題配布が遅れましたが、〆切を変更せずに提出して いただけると申し出ていただきました。ありがとうございます。 また、その方には、この場を借りて、再度陳謝いたします。 (このメイルは届いていますか?関根まで確認のメイルを下さい。) 1.最新IREXパッケージ 4月6日のバージョンのIREXパッケージを作りしました。 IR課題やNEトピック限定についてのデータおよびこれまでML で散発的に出ていた情報を加えた事以外には、判定者用の データを本試験のものにした点(IR_JUDGE_TRIAL)、次に述べる IREX-IRのアンケート(IR_DEF/survey990406.txt)を加えた という点が変更点です。 ########################## ##試験に影響するような重要な変更はありません。## ########################## 2.IREX-IRのアンケート アンケートを作成しました。このメイルの最後にもつけますが IRに参加された方にはデータの提出と同時にこちらの提出も お願いいたします。 3.IREX-NEシステム開発の凍結 ホームページにもありますように、4月13日でNEのシステム開発を 凍結していただきます。よろしくお願いします。 4. 結果分析について 結果分析の方はいまだに申しでがありません。興味のある方が いらっしゃいましたら連絡してください。また、これによって 一部だけに流出してしまう情報があることを危惧されている方が いらっしゃるようなので、そのようなことはないようにすることに いたします。どうぞよろしくお願いします。 関根 ----------------------------------- IREX-IR システム アンケート --------------------------- IREX-IRに参加したチームは、各システムごとに1通づつ、このフォームを作成し 結果提出と同時にirex-submit@karc.crl.go.jpに送付してください。 (結果ファイルとは別のメイルでお送りください。) 計算機処理しますので、記入は:または=の後のみに1行で書いてください。 それ以外の部分は書き換えないようにお願いします。 :の後は、自由文で回答してください。 =の後は、「はい」「いいえ」「不明」のいずれかか、適切な数字または 記号で回答してください。 上記の印(:、=)がない行には、何も記入する必要はありません。 それぞれ、:や=の次の半角スペースは削らないでください。 極力上記の制約をお守りください。どうしても不可能な場合には =の後に自由文で回答していただいても結構です。 このアンケートはNACSIS Collectionで使用されたアンケートを基に作成されて おります。使用を許可していただいたNACSISの方に感謝します。 ---------------------------------------------------------------------------- 0. システムID = 0.1. IREX固有の情報 0.1.1. 使用した検索課題中の情報(DESCRIPTIONのみ(D)、NARRATIVEのみ(N)、DESCRIPTIONとNARRATIVE両方(D&N))= 0.1.2. NEGのタグは利用しましたか? = 0.1.3. システム開発に関連して過去に94、95年毎日新聞を使用したことがありますか? = 0.1.4. 95年8月24、25日のデータのバグについて予め対処してありますか? = 1. 索引づけ 1.1. 索引づけに用いた方法 1.1.1 日本語の索引単位は何か?(uni-gram,bi-gram,その他のn-gram,単語,フレーズ,その他) : 1.1.2. どのような方法を用いて索引づけをしたか?(辞書、形態素解析、その他) : 1.1.3. 索引語の選択方法は何か?(例:ストップワード、字種、品詞など) : 1.1.4. 語彙(文字)の正規化を行なったか? = 1.1.5. ステミングアルゴリズムを用いたか? = 1.1.6. 語の重みづけを用いたか? = 1.1.7. フレーズ単位で索引づけをしたか? = 1.1.8. フレーズの種類は? = 1.1.9. フレーズの見つけ方は?(統計的、構文的、その他) : 1.1.10. 構文解析は行なったか? = 1.1.11. シソーラスや用語集などを用いたか? = 1.1.12. 語義の曖昧性解消は行なったか? = 1.1.13. 誤字脱字やスペルのチェックは行なったか? = 1.1.14. 誤字脱字やスペルの修正は行なったか? = 1.1.15. 固有名詞を識別したか? = 1.1.16. どのような方法で索引単位に分割したか? : 1.1.17. 日本語のヨミを用いたか? = 1.1.18. ヨミを用いた場合、ヨミはどのように生成したか? : 1.1.19. 索引づけに用いたその他の方法(具体的に) : 1.2. 毎日新聞から構築された索引データの構造 1.2.1. 索引の構造の種類 1.2.1.1. クラスタ : 1.2.1.2. シグネチャファイル : 1.2.1.3. Pat木 : 1.2.1.4. 知識ベース : 1.2.1.5. その他(具体的に) : 1.2.2. 索引の概要 1.2.2.1. 索引の規模[MB] = 1.2.2.2. 構築に要した時間[時間] = 1.2.2.3. 実行過程は自動化されているか? = 1.2.2.4. 語の出現位置(オフセット)は使用したか? = 1.3. 毎日新聞以外の情報源から索引作成のために利用したデータ 1.3.1. 独自に構築したデータ(種類=シソーラス、知識ベース、辞書など) : 1.3.2. 外部で構築されたデータ(種類とデータ名) : 2. 検索式の作成 2.1. 検索式を作成するのに要した時間(1課題当たりの平均CPU時間[秒]) = 2.2. 検索式作成に使用した方法 2.2.1. 索引単位への分割(uni-gram,bi-gram,その他のn-gram,単語,フレーズ,その他) : 2.2.2. フレーズの抽出 : 2.2.3. 構文解析 : 2.2.4. 語義の曖昧性解消 : 2.2.5. 固有名詞の識別 : 2.2.5. 検索式の自動拡張 : 2.2.5.1. シソーラスなど既存のツール : 2.2.5.2. 自動レレバンスフィードバック : 2.2.5.3. ローカルコンテクストアナリシス : 2.2.5.4. その他(具体的に) : 2.2.6. ブール演算子や近接演算子などの自動的付与 : 2.2.7. その他(具体的に) : 3. 検索実行 3.1. 検索時間(1検索式に対する平均CPU時間[秒]) = 3.2. プロセスサイズ[MB] = 3.3. 計算機についての情報 3.3.1. 実験に使用した計算機 : 3.3.2. その計算機は専用か共用か : 3.3.3. ハードディスクの総容量[GB] = 3.3.4. RAMの総容量[MB] = 3.3.5. CPUのクロック数[MHz] = 4. 検索モデル 4.1. ベクトル空間型を用いたか? = 4.2. 確率型を用いたか? = 4.3. その他(具体的に) : 4.4. ランクづけの要素 4.4.1. TF(語の出現頻度)を使用したか? = 4.4.2. IDFを使用したか? = 4.4.3. その他の重みづけ(具体的に) : 4.4.4. 意味の近さを使用したか? = 4.4.5. 文書中の位置を使用したか? = 4.4.6. 構文的な手がかりを使用したか? = 4.4.7. 語の近接(距離)を使用したか? = 4.4.8. 文書の長さを使用したか? = 4.4.9. その他(具体的に) : 5. その他 5.1. 上の質問で回答していないシステムの特色 : 5.2. チームの構成員 5.2.1. 日本語を母国語とする人がいますか? = 5.2.2. 日本語のわかる人がいますか? = 5.3. 関連データの利用 5.3.1. BMIR-1を利用しましたか? = 5.3.2. BMIR-2を利用しましたか? = 5.3.3. NACSIS-collectionを利用しましたか? = 5.3.4. IREX-IR予備試験データを利用しましたか? = 5.3.5. TRECデータを利用しましたか? =  1,, Summary-line: 7-Apr to: irex@karc.crl.go.jp #[irex 185] Re: IREX-IR, NE Mail-from: From owner-irex@po.crl.go.jp Wed Apr 7 13:14:56 1999 Received: from carrot.crl.go.jp (carrot [133.243.71.3]) by dandelion.crl.go.jp (8.8.8/3.6W) with ESMTP id NAA05744 for ; Wed, 7 Apr 1999 13:14:56 +0900 (JST) Received: from po.crl.go.jp (po [133.243.25.120]) by carrot.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with ESMTP id NAA05042 for ; Wed, 7 Apr 1999 13:14:43 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id NAA17725; Wed, 7 Apr 1999 13:16:14 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id NAA17720 for ; Wed, 7 Apr 1999 13:16:13 +0900 (JST) Received: from dandelion.crl.go.jp (dandelion [133.243.71.22]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id NAA06075 for ; Wed, 7 Apr 1999 13:10:50 +0900 (JST) Received: (from sekine@localhost) by dandelion.crl.go.jp (8.8.8/3.6W) id NAA05734; Wed, 7 Apr 1999 13:14:44 +0900 (JST) Date: Wed, 7 Apr 1999 13:14:44 +0900 (JST) Message-Id: <199904070414.NAA05734@dandelion.crl.go.jp> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 185 Subject: [irex 185] Re: IREX-IR, NE Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Date: Wed, 7 Apr 1999 13:14:44 +0900 (JST) To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 185 Subject: [irex 185] Re: IREX-IR, NE Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp IREX-IRアンケートに関して質問をいただきました。 > > 5.3. 関連データの利用 > > 5.3.1. BMIR-1を利用しましたか? = > > 5.3.2. BMIR-2を利用しましたか? = > > 5.3.3. NACSIS-collectionを利用しましたか? = > > 5.3.4. IREX-IR予備試験データを利用しましたか? = > > 5.3.5. TRECデータを利用しましたか? = > > ひとくちに「利用」と言っても、いくつかのレベルが > あると思います。ここでいう「利用」とは、どこまで > を指すのでしょうか? > > (1) 上記データからシソーラスなどを構築し、IREX用 > システムに直接利用した。 > (2) IREX用システムの内部評価用データとして利用した。 > (3) 他の目的に利用したことがあり、その経験は恐らく > IREX用システム作りにも反映されているはず。 確かにこの情報は重要ですので、可能な方は 「はい」の後にどのように利用したか書いて下さい。 上記の(1),(2),(3)のいずれかの場合には、それぞれ 「直接利用した」「評価データとして利用した」「間接的に利用した」 としてください。 よろしくお願いいたします。 関根  1,, Summary-line: 7-Apr to: irex@karc.crl.go.jp #[irex 186] IREX-IR submission Mail-from: From owner-irex@po.crl.go.jp Wed Apr 7 15:20:02 1999 Received: from carrot.crl.go.jp (carrot [133.243.71.3]) by dandelion.crl.go.jp (8.8.8/3.6W) with ESMTP id PAA05840 for ; Wed, 7 Apr 1999 15:20:02 +0900 (JST) Received: from po.crl.go.jp (po [133.243.25.120]) by carrot.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with ESMTP id PAA05089 for ; Wed, 7 Apr 1999 15:19:49 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id PAA20003; Wed, 7 Apr 1999 15:21:20 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id PAA19996 for ; Wed, 7 Apr 1999 15:21:18 +0900 (JST) Received: from dandelion.crl.go.jp (dandelion [133.243.71.22]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id PAA06216 for ; Wed, 7 Apr 1999 15:15:56 +0900 (JST) Received: (from sekine@localhost) by dandelion.crl.go.jp (8.8.8/3.6W) id PAA05833; Wed, 7 Apr 1999 15:19:50 +0900 (JST) Date: Wed, 7 Apr 1999 15:19:50 +0900 (JST) Message-Id: <199904070619.PAA05833@dandelion.crl.go.jp> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 186 Subject: [irex 186] IREX-IR submission Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Date: Wed, 7 Apr 1999 15:19:50 +0900 (JST) To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 186 Subject: [irex 186] IREX-IR submission Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp 皆様: IREX-IRの提出を受けとった際には、こちらから確認のメイルを お送りします。提出後24時間以内に確認のメイルを受けとらなかった 場合には御連絡ください。 万が一に備えて、提出したメイルを保存しておいてください。 井佐原、関根  1,, Mail-from: From owner-irex@po.crl.go.jp Thu Apr 8 15:15:45 1999 Received: from carrot.crl.go.jp (carrot [133.243.71.3]) by dandelion.crl.go.jp (8.8.8/3.6W) with ESMTP id PAA06748 for ; Thu, 8 Apr 1999 15:15:44 +0900 (JST) Received: from po.crl.go.jp (po [133.243.25.120]) by carrot.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with ESMTP id PAA05598 for ; Thu, 8 Apr 1999 15:15:31 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id PAA02276; Thu, 8 Apr 1999 15:16:53 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id PAA02271 for ; Thu, 8 Apr 1999 15:16:51 +0900 (JST) Received: from dandelion.crl.go.jp (dandelion [133.243.71.22]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id PAA06901 for ; Thu, 8 Apr 1999 15:11:29 +0900 (JST) Received: (from sekine@localhost) by dandelion.crl.go.jp (8.8.8/3.6W) id PAA06737; Thu, 8 Apr 1999 15:15:23 +0900 (JST) Date: Thu, 8 Apr 1999 15:15:23 +0900 (JST) Message-Id: <199904080615.PAA06737@dandelion.crl.go.jp> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 187 Subject: [irex 187] Workshop schedule & place Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Date: Thu, 8 Apr 1999 15:15:23 +0900 (JST) To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu From: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 187 Subject: [irex 187] Workshop schedule & place Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Dear IREX-ML member, ============================================================== [English Annoucement] Brief information about "IREX Workshop" o Schedule - August 6, 1999: Submission of camera-ready copy for the proceedings (All participants can make their presentation) - Sept. 1-3, 1999: IREX meeting - Sept. 1: Keynote Speech & Panel (with NACSIS; open to public) - Sept. 2-3, 1999: IREX meeting (open to public)  # August 30-31: NTCIR Workshop meeting (NTCIR Workshop participants only) o Meeting place - KKR Hotel Tokyo 1-4-1 Ohtemachi, Chiyoda-ku, Tokyo 100-0004 JAPAN Phone: +81-3-3287-2921 Fax: +81-3-3287-2913 Detail information such as the fee, procedure of paper submission and registration, and lodging will be announced next week. We look forward to seeing you at the workshop. Thank you. Satoshi Sekine ============================================================== [Japanese Annoucement] IREX-MLの皆様: ワークショップの日程などを御連絡いたします。 ○日程  8月6日(土):会議録論文提出締切 口頭発表申込というものはありません。 すべての参加者がそのまま発表の機会があります。 辞退する場合にはその旨、連絡を下さい。  - 9月1日(水)〜3日(金)は IREXワークショップ   - 9月1日:記念講演他(IREX と合同。IREX参加者以外の出席も可)   - 9月2日(木)〜3日(金)は IREX の成果報告会 (IREX参加者以外の出席も可) # 8月30、31日:NTCIR 口頭発表(NTCIR ワークショップ参加者のみ) ○会場  KKR ホテル東京(東京、竹橋) 〒100-0004 千代田区大手町1-4-1 TEL: 03-3287-2921 Fax: 03-3287-2913 以上、取り急ぎご連絡いたしました。今からご予定に組み入れていた だければ幸いです。 なお、会費、会議録論文、参加申込手続き、宿泊など詳細については、 来週ご案内する予定です。 関根 # ホテルが変更になっています。これはNACSISの神門さんが下見に行かれた # 際に、ホテルの空気が悪く気分が悪くなったということによります。 # 特に問題はないと思いますが、そのような方がいらっしゃいましたら # 申し訳ありません。  1, answered,, Summary-line: 8-Apr borthwic@cs.nyu.edu #[irex 188] Re: IREX-IR, NE Mail-from: From owner-irex@po.crl.go.jp Fri Apr 9 07:59:23 1999 Received: from carrot.crl.go.jp (carrot [133.243.71.3]) by dandelion.crl.go.jp (8.8.8/3.6W) with ESMTP id HAA06908 for ; Fri, 9 Apr 1999 07:59:22 +0900 (JST) Received: from po.crl.go.jp (po [133.243.25.120]) by carrot.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with ESMTP id HAA05796 for ; Fri, 9 Apr 1999 07:59:09 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id HAA08848; Fri, 9 Apr 1999 07:58:24 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id HAA08843 for ; Fri, 9 Apr 1999 07:58:23 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id HAA07153 for ; Fri, 9 Apr 1999 07:53:00 +0900 (JST) Received: from mailgate.crl.go.jp (localhost [127.0.0.1]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id HAA12109 for ; Fri, 9 Apr 1999 07:58:22 +0900 (JST) Received: from johnson.cs.nyu.edu (JOHNSON.CS.NYU.EDU [128.122.140.74]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id HAA10487 for ; Fri, 9 Apr 1999 07:57:14 +0900 (JST) Received: from localhost (borthwic@localhost) by johnson.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id SAA05309; Thu, 8 Apr 1999 18:53:14 -0400 (EDT) Date: Thu, 8 Apr 1999 18:53:13 -0400 (EDT) From: Andrew Borthwick To: irex@karc.crl.go.jp cc: Satoshi Sekine In-Reply-To: <199904070214.LAA05552@dandelion.crl.go.jp> Message-ID: MIME-Version: 1.0 Content-Type: TEXT/PLAIN; charset=X-UNKNOWN Reply-To: irex@karc.crl.go.jp X-Sequence: irex 188 Subject: [irex 188] Re: IREX-IR, NE Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Date: Thu, 8 Apr 1999 18:53:13 -0400 (EDT) From: Andrew Borthwick To: irex@karc.crl.go.jp cc: Satoshi Sekine In-Reply-To: <199904070214.LAA05552@dandelion.crl.go.jp> MIME-Version: 1.0 Content-Type: TEXT/PLAIN; charset=X-UNKNOWN Reply-To: irex@karc.crl.go.jp X-Sequence: irex 188 Subject: [irex 188] Re: IREX-IR, NE Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Hi, Does this concern me? I'm doing the NE evaluation, but not IR and I can't ready Japanese. Thanks, Andrew Borthwick On Wed, 7 Apr 1999 sekine@cs.nyu.edu wrote: > > IREX-MLの皆様: > > > IRの試験では、一部、こちらのミスでMLに登録されていない方がおり > その方への課題配布が遅れましたが、〆切を変更せずに提出して > いただけると申し出ていただきました。ありがとうございます。 > また、その方には、この場を借りて、再度陳謝いたします。 > (このメイルは届いていますか?関根まで確認のメイルを下さい。) > > > 1.最新IREXパッケージ > > 4月6日のバージョンのIREXパッケージを作りしました。 > IR課題やNEトピック限定についてのデータおよびこれまでML > で散発的に出ていた情報を加えた事以外には、判定者用の > データを本試験のものにした点(IR_JUDGE_TRIAL)、次に述べる > IREX-IRのアンケート(IR_DEF/survey990406.txt)を加えた > という点が変更点です。 > > ########################## > ##試験に影響するような重要な変更はありません。## > ########################## > > > 2.IREX-IRのアンケート > > アンケートを作成しました。このメイルの最後にもつけますが > IRに参加された方にはデータの提出と同時にこちらの提出も > お願いいたします。 > > > 3.IREX-NEシステム開発の凍結 > > ホームページにもありますように、4月13日でNEのシステム開発を > 凍結していただきます。よろしくお願いします。 > > > 4. 結果分析について > > 結果分析の方はいまだに申しでがありません。興味のある方が > いらっしゃいましたら連絡してください。また、これによって > 一部だけに流出してしまう情報があることを危惧されている方が > いらっしゃるようなので、そのようなことはないようにすることに > いたします。どうぞよろしくお願いします。 > > > 関根 > > ----------------------------------- > > IREX-IR システム アンケート > --------------------------- > > IREX-IRに参加したチームは、各システムごとに1通づつ、このフォームを作成し > 結果提出と同時にirex-submit@karc.crl.go.jpに送付してください。 > (結果ファイルとは別のメイルでお送りください。) > > 計算機処理しますので、記入は:または=の後のみに1行で書いてください。 > それ以外の部分は書き換えないようにお願いします。 > > :の後は、自由文で回答してください。 > =の後は、「はい」「いいえ」「不明」のいずれかか、適切な数字または > 記号で回答してください。 > 上記の印(:、=)がない行には、何も記入する必要はありません。 > > それぞれ、:や=の次の半角スペースは削らないでください。 > 極力上記の制約をお守りください。どうしても不可能な場合には > =の後に自由文で回答していただいても結構です。 > > このアンケートはNACSIS Collectionで使用されたアンケートを基に作成されて > おります。使用を許可していただいたNACSISの方に感謝します。 > ---------------------------------------------------------------------------- > > 0. システムID = > > 0.1. IREX固有の情報 > > 0.1.1. 使用した検索課題中の情報(DESCRIPTIONのみ(D)、NARRATIVEのみ(N)、DESCRIPTIONとNARRATIVE両方(D&N))= > > 0.1.2. NEGのタグは利用しましたか? = > > 0.1.3. システム開発に関連して過去に94、95年毎日新聞を使用したことがありますか? = > > 0.1.4. 95年8月24、25日のデータのバグについて予め対処してありますか? = > > 1. 索引づけ > > 1.1. 索引づけに用いた方法 > > 1.1.1 日本語の索引単位は何か?(uni-gram,bi-gram,その他のn-gram,単語,フレーズ,その他) : > > 1.1.2. どのような方法を用いて索引づけをしたか?(辞書、形態素解析、その他) : > > 1.1.3. 索引語の選択方法は何か?(例:ストップワード、字種、品詞など) : > > 1.1.4. 語彙(文字)の正規化を行なったか? = > > 1.1.5. ステミングアルゴリズムを用いたか? = > > 1.1.6. 語の重みづけを用いたか? = > > 1.1.7. フレーズ単位で索引づけをしたか? = > > 1.1.8. フレーズの種類は? = > > 1.1.9. フレーズの見つけ方は?(統計的、構文的、その他) : > > 1.1.10. 構文解析は行なったか? = > > 1.1.11. シソーラスや用語集などを用いたか? = > > 1.1.12. 語義の曖昧性解消は行なったか? = > > 1.1.13. 誤字脱字やスペルのチェックは行なったか? = > > 1.1.14. 誤字脱字やスペルの修正は行なったか? = > > 1.1.15. 固有名詞を識別したか? = > > 1.1.16. どのような方法で索引単位に分割したか? : > > 1.1.17. 日本語のヨミを用いたか? = > > 1.1.18. ヨミを用いた場合、ヨミはどのように生成したか? : > > 1.1.19. 索引づけに用いたその他の方法(具体的に) : > > 1.2. 毎日新聞から構築された索引データの構造 > > 1.2.1. 索引の構造の種類 > > 1.2.1.1. クラスタ : > > 1.2.1.2. シグネチャファイル : > > 1.2.1.3. Pat木 : > > 1.2.1.4. 知識ベース : > > 1.2.1.5. その他(具体的に) : > > 1.2.2. 索引の概要 > > 1.2.2.1. 索引の規模[MB] = > > 1.2.2.2. 構築に要した時間[時間] = > > 1.2.2.3. 実行過程は自動化されているか? = > > 1.2.2.4. 語の出現位置(オフセット)は使用したか? = > > 1.3. 毎日新聞以外の情報源から索引作成のために利用したデータ > > 1.3.1. 独自に構築したデータ(種類=シソーラス、知識ベース、辞書など) : > > 1.3.2. 外部で構築されたデータ(種類とデータ名) : > > 2. 検索式の作成 > > 2.1. 検索式を作成するのに要した時間(1課題当たりの平均CPU時間[秒]) = > > 2.2. 検索式作成に使用した方法 > > 2.2.1. 索引単位への分割(uni-gram,bi-gram,その他のn-gram,単語,フレーズ,その他) : > > 2.2.2. フレーズの抽出 : > > 2.2.3. 構文解析 : > > 2.2.4. 語義の曖昧性解消 : > > 2.2.5. 固有名詞の識別 : > > 2.2.5. 検索式の自動拡張 : > > 2.2.5.1. シソーラスなど既存のツール : > > 2.2.5.2. 自動レレバンスフィードバック : > > 2.2.5.3. ローカルコンテクストアナリシス : > > 2.2.5.4. その他(具体的に) : > > 2.2.6. ブール演算子や近接演算子などの自動的付与 : > > 2.2.7. その他(具体的に) : > > 3. 検索実行 > > 3.1. 検索時間(1検索式に対する平均CPU時間[秒]) = > > 3.2. プロセスサイズ[MB] = > > 3.3. 計算機についての情報 > > 3.3.1. 実験に使用した計算機 : > > 3.3.2. その計算機は専用か共用か : > > 3.3.3. ハードディスクの総容量[GB] = > > 3.3.4. RAMの総容量[MB] = > > 3.3.5. CPUのクロック数[MHz] = > > 4. 検索モデル > > 4.1. ベクトル空間型を用いたか? = > > 4.2. 確率型を用いたか? = > > 4.3. その他(具体的に) : > > 4.4. ランクづけの要素 > > 4.4.1. TF(語の出現頻度)を使用したか? = > > 4.4.2. IDFを使用したか? = > > 4.4.3. その他の重みづけ(具体的に) : > > 4.4.4. 意味の近さを使用したか? = > > 4.4.5. 文書中の位置を使用したか? = > > 4.4.6. 構文的な手がかりを使用したか? = > > 4.4.7. 語の近接(距離)を使用したか? = > > 4.4.8. 文書の長さを使用したか? = > > 4.4.9. その他(具体的に) : > > 5. その他 > > 5.1. 上の質問で回答していないシステムの特色 : > > 5.2. チームの構成員 > > 5.2.1. 日本語を母国語とする人がいますか? = > > 5.2.2. 日本語のわかる人がいますか? = > > 5.3. 関連データの利用 > > 5.3.1. BMIR-1を利用しましたか? = > > 5.3.2. BMIR-2を利用しましたか? = > > 5.3.3. NACSIS-collectionを利用しましたか? = > > 5.3.4. IREX-IR予備試験データを利用しましたか? = > > 5.3.5. TRECデータを利用しましたか? = > >  1,, Summary-line: 8-Apr borthwic@cs.nyu.edu #[irex 189] Re: IREX-IR, NE Mail-from: From owner-irex@po.crl.go.jp Fri Apr 9 08:01:54 1999 Received: from carrot.crl.go.jp (carrot [133.243.71.3]) by dandelion.crl.go.jp (8.8.8/3.6W) with ESMTP id IAA07040 for ; Fri, 9 Apr 1999 08:01:54 +0900 (JST) Received: from po.crl.go.jp (po [133.243.25.120]) by carrot.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with ESMTP id IAA05812 for ; Fri, 9 Apr 1999 08:01:40 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id HAA08861; Fri, 9 Apr 1999 07:59:54 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id HAA08856 for ; Fri, 9 Apr 1999 07:59:53 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id HAA07156 for ; Fri, 9 Apr 1999 07:54:30 +0900 (JST) Received: from mailgate.crl.go.jp (localhost [127.0.0.1]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id IAA12156 for ; Fri, 9 Apr 1999 08:00:35 +0900 (JST) Received: from johnson.cs.nyu.edu (JOHNSON.CS.NYU.EDU [128.122.140.74]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id HAA10539 for ; Fri, 9 Apr 1999 07:58:35 +0900 (JST) Received: from localhost (borthwic@localhost) by johnson.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id SAA05313; Thu, 8 Apr 1999 18:54:35 -0400 (EDT) Date: Thu, 8 Apr 1999 18:54:35 -0400 (EDT) From: Andrew Borthwick To: irex@karc.crl.go.jp cc: Satoshi Sekine In-Reply-To: <199904070414.NAA05734@dandelion.crl.go.jp> Message-ID: MIME-Version: 1.0 Content-Type: TEXT/PLAIN; charset=X-UNKNOWN Reply-To: irex@karc.crl.go.jp X-Sequence: irex 189 Subject: [irex 189] Re: IREX-IR, NE Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Date: Thu, 8 Apr 1999 18:54:35 -0400 (EDT) From: Andrew Borthwick To: irex@karc.crl.go.jp cc: Satoshi Sekine In-Reply-To: <199904070414.NAA05734@dandelion.crl.go.jp> MIME-Version: 1.0 Content-Type: TEXT/PLAIN; charset=X-UNKNOWN Reply-To: irex@karc.crl.go.jp X-Sequence: irex 189 Subject: [irex 189] Re: IREX-IR, NE Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp I'm also wondering about this message. Does it concern me? Thanks, Andrew On Wed, 7 Apr 1999 sekine@cs.nyu.edu wrote: > > IREX-IRアンケートに関して質問をいただきました。 > > > > 5.3. 関連データの利用 > > > 5.3.1. BMIR-1を利用しましたか? = > > > 5.3.2. BMIR-2を利用しましたか? = > > > 5.3.3. NACSIS-collectionを利用しましたか? = > > > 5.3.4. IREX-IR予備試験データを利用しましたか? = > > > 5.3.5. TRECデータを利用しましたか? = > > > > ひとくちに「利用」と言っても、いくつかのレベルが > > あると思います。ここでいう「利用」とは、どこまで > > を指すのでしょうか? > > > > (1) 上記データからシソーラスなどを構築し、IREX用 > > システムに直接利用した。 > > (2) IREX用システムの内部評価用データとして利用した。 > > (3) 他の目的に利用したことがあり、その経験は恐らく > > IREX用システム作りにも反映されているはず。 > > 確かにこの情報は重要ですので、可能な方は > 「はい」の後にどのように利用したか書いて下さい。 > 上記の(1),(2),(3)のいずれかの場合には、それぞれ > 「直接利用した」「評価データとして利用した」「間接的に利用した」 > としてください。 > > よろしくお願いいたします。 > > > 関根 >  1,, Mail-from: From owner-irex@po.crl.go.jp Fri Apr 9 10:16:49 1999 Received: from carrot.crl.go.jp (carrot [133.243.71.3]) by dandelion.crl.go.jp (8.8.8/3.6W) with ESMTP id KAA06854 for ; Fri, 9 Apr 1999 10:16:49 +0900 (JST) Received: from po.crl.go.jp (po [133.243.25.120]) by carrot.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with ESMTP id KAA05828 for ; Fri, 9 Apr 1999 10:16:35 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id KAA09840; Fri, 9 Apr 1999 10:14:47 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id KAA09835 for ; Fri, 9 Apr 1999 10:14:46 +0900 (JST) Received: from dandelion.crl.go.jp (dandelion [133.243.71.22]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id KAA07194 for ; Fri, 9 Apr 1999 10:09:23 +0900 (JST) Received: (from sekine@localhost) by dandelion.crl.go.jp (8.8.8/3.6W) id KAA07175; Fri, 9 Apr 1999 10:13:18 +0900 (JST) Date: Fri, 9 Apr 1999 10:13:18 +0900 (JST) Message-Id: <199904090113.KAA07175@dandelion.crl.go.jp> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu From: sekine@cs.nyu.edu In-reply-to: (message from Andrew Borthwick on Thu, 8 Apr 1999 18:53:13 -0400 (EDT)) Reply-To: irex@karc.crl.go.jp X-Sequence: irex 190 Subject: [irex 190] Re: IREX-IR, NE Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Date: Fri, 9 Apr 1999 10:13:18 +0900 (JST) To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu From: sekine@cs.nyu.edu In-reply-to: (message from Andrew Borthwick on Thu, 8 Apr 1999 18:53:13 -0400 (EDT)) Reply-To: irex@karc.crl.go.jp X-Sequence: irex 190 Subject: [irex 190] Re: IREX-IR, NE Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Andrew and other people who can't read Japanese, Usually, I write messages in English as well, if it concerns people who can't read Japanese. Recent messages are talking about IR. In the IR evaluatin, all participants have Japanese people. (Actually, I beleive all participants are Japanese..) Thanks, Satoshi Sekine  1,, Mail-from: From owner-irex@po.crl.go.jp Fri Apr 9 12:03:17 1999 Received: from carrot.crl.go.jp (carrot [133.243.71.3]) by dandelion.crl.go.jp (8.8.8/3.6W) with ESMTP id MAA07302 for ; Fri, 9 Apr 1999 12:03:16 +0900 (JST) Received: from po.crl.go.jp (po [133.243.25.120]) by carrot.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with ESMTP id MAA05917 for ; Fri, 9 Apr 1999 12:03:03 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id MAA11752; Fri, 9 Apr 1999 12:04:34 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id MAA11747 for ; Fri, 9 Apr 1999 12:04:32 +0900 (JST) Received: from dandelion.crl.go.jp (dandelion [133.243.71.22]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id LAA07324 for ; Fri, 9 Apr 1999 11:59:11 +0900 (JST) Received: (from sekine@localhost) by dandelion.crl.go.jp (8.8.8/3.6W) id MAA07286; Fri, 9 Apr 1999 12:03:05 +0900 (JST) Date: Fri, 9 Apr 1999 12:03:05 +0900 (JST) Message-Id: <199904090303.MAA07286@dandelion.crl.go.jp> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: <199904082236.SAA05126@trumpet.teragram.com> (message from Shinko Tamura on Thu, 8 Apr 1999 18:08:41 +0900) From: sekine@cs.nyu.edu (Satoshi SEKINE) Reply-To: sekine@cs.nyu.edu X-Sequence: irex 191 Subject: [irex 191] Re: IREX NE TEXTS Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Date: Fri, 9 Apr 1999 12:03:05 +0900 (JST) To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: <199904082236.SAA05126@trumpet.teragram.com> (message from Shinko Tamura on Thu, 8 Apr 1999 18:08:41 +0900) From: sekine@cs.nyu.edu (Satoshi SEKINE) Reply-To: sekine@cs.nyu.edu X-Sequence: irex 191 Subject: [irex 191] Re: IREX NE TEXTS Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Dear IREX-ML members: This message concerns the NE evaluation. There was a question concerning data format. The format of the articles will be the same as that of dry-run. It means that it is the same as the format of the file you got by tea program and MAICHINI corpus. There will be NO hankaku-moji's or 1 byte characters in the text and header reagion (although SGML tags and newline are writen in 1-byte ASCII chracters). We will send the articles as it is. You don't have to run tea program to recover the articles. To Andrew (NYU): This just means that the data format is acceptable by the program I created for you. There is nothing you have to worry about. The system "freeze" date is April 13, 1999. You have to stop your system development at the end of the day (Japanese Standard Time). In New York and Boston, it will be 10:00AM, April 13, 1999. This is to avoid the possibility that the american participants get advantage of knowing the events in the 14 hours. Satoshi Sekine -------------------------------------------------------- IREXメイリングリストの皆様: NEデータのフォーマットについて質問を受けました。フォーマットは 予備試験と同様です。つまりteaプログラムで得たもの、というかmai2sgml で得た形のものをそのままお送りします。テキストの内部には半角の文字は リターン以外にはありません。(各段落間にリターンが入ります) また、SGMLのタグは半角です。 繰り返しますが、システムの開発を4月13日に凍結してください。 アメリカの参加者(ニューヨークとボストン)は時差14時間ですが、 その14時間の間に大きな出来事などが起き、アメリカの参加者が 有利になることを避けるために日本時間ということにします。 (例えば、大地震があったら、その地名を知っていると有利になるという ことを避ける目的です。) よろしくお願いいたします。 関根  1,, Mail-from: From owner-irex@po.crl.go.jp Tue Apr 13 06:47:02 1999 Received: from carrot.crl.go.jp (carrot [133.243.71.3]) by dandelion.crl.go.jp (8.8.8/3.6W) with ESMTP id GAA09897 for ; Tue, 13 Apr 1999 06:47:02 +0900 (JST) Received: from po.crl.go.jp (po [133.243.25.120]) by carrot.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with ESMTP id GAA07235 for ; Tue, 13 Apr 1999 06:46:47 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id GAA11324; Tue, 13 Apr 1999 06:48:15 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.9.3+3.1W/3.7Wpl2-990405) id GAA11319 for ; Tue, 13 Apr 1999 06:48:14 +0900 (JST) Received: from dandelion.crl.go.jp (dandelion [133.243.71.22]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id GAA08987 for ; Tue, 13 Apr 1999 06:42:53 +0900 (JST) Received: (from sekine@localhost) by dandelion.crl.go.jp (8.8.8/3.6W) id GAA09896; Tue, 13 Apr 1999 06:46:50 +0900 (JST) Date: Tue, 13 Apr 1999 06:46:50 +0900 (JST) Message-Id: <199904122146.GAA09896@dandelion.crl.go.jp> To: irex@karc.crl.go.jp From: sekine@dandelion.crl.go.jp (Satoshi SEKINE) Cc: sekine@dandelion.crl.go.jp Reply-To: sekine@dandelion.crl.go.jp X-Sequence: irex 192 Subject: [irex 192] IREX-IR formal run is over Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po using -f Date: Tue, 13 Apr 1999 06:46:50 +0900 (JST) To: irex@karc.crl.go.jp From: sekine@dandelion.crl.go.jp (Satoshi SEKINE) Cc: sekine@dandelion.crl.go.jp Reply-To: sekine@dandelion.crl.go.jp X-Sequence: irex 192 Subject: [irex 192] IREX-IR formal run is over Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Dear IREX-ML members: The IREX-IR formal run is over. We received 22 submissions from 15 sites. Thank you very much for your submissions. There is a list of the system ID in this mail. If you are not in the list even if you submited, please let us (irex-submit@karc.crl.go.jp) know. Please send us the original message as well. It seems that the mailing system at NYU is out of order, I can't read e-mail sent to sekine@cs.nyu.edu. (Should be forwarded to my accounts in Japan.) Please send e-mail to the following addresses. Thank you. sekine@dandelion.crl.go.jp sekine@csl.sony.co.jp sekine@cs.titech.ac.jp As I don't have permissions to login these machines remotely and I will not go to the offices very often this week, my responses may be delayed. Satoshi Sekine ----------- IREXメイリングリストの皆様: IREX-IRの本試験が終了しました。 15の団体から22システムの提出を受けとりました。 最後にリストを載せますので、もし、提出したのにこのリストに SystemIDがない方は至急、irex-submit@karc.crl.go.jpに申しでて 下さい。その際には期限内に出したという証拠のメイルも 沿えてください。 また、NYUの計算機の調子が悪いらしく、sekine@cs.nyu.eduに出された メイルは土曜の夜くらいから読めていません。以下のメイルアドレスに メイルをしていただけますようにお願いします。現在のところ、私は どのマシンにもリモートにログインすることができませんので、 3つのアドレスすべてに出して下さい。また、今週はあまりメイルを 見ることができませんので、メイルへの反応は遅れることが予想されます。 予め御了承ください。 sekine@dandelion.crl.go.jp sekine@csl.sony.co.jp sekine@cs.titech.ac.jp 関根 ----------- 1103a 1103b 1106 1110 1112 1120 1122a 1122b 1126 1128a 1128b 1132 1133a 1133b 1135a 1135b 1142 1144a 1144b 1145a 1145b 1146