BABYL OPTIONS: Version: 5 Labels: Note: This is the header of an rmail file. Note: If you are seeing it in rmail, Note: it means the file has no messages in it.  1, filed,, Summary-line: 22-Dec to: irex@karc.crl.go.jp #[irex 118] IREX IR judge Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id NAA21009 for ; Tue, 22 Dec 1998 13:10:39 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id NAA01116 for ; Tue, 22 Dec 1998 13:11:40 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id DAA20591; Wed, 23 Dec 1998 03:06:32 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id DAA14556; Wed, 23 Dec 1998 03:06:30 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id DAA19008; Wed, 23 Dec 1998 03:00:50 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id DAA19003 for ; Wed, 23 Dec 1998 03:00:49 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id DAA05516 for ; Wed, 23 Dec 1998 03:00:40 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id DAA14551 for ; Wed, 23 Dec 1998 03:06:26 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id DAA28651 for ; Wed, 23 Dec 1998 03:06:25 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id NAA28737; Tue, 22 Dec 1998 13:06:23 -0500 (EST) Date: Tue, 22 Dec 1998 13:06:23 -0500 (EST) From: Satoshi Sekine Message-Id: <199812221806.NAA28737@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 118 Subject: [irex 118] IREX IR judge Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 4489 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Tue, 22 Dec 1998 13:06:23 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 118 Subject: [irex 118] IREX IR judge Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 4489 IREXメイリングリストの皆様: The judgements for the IREX IR dryrun were completed. We would like to discuss issues regarding the judgement and IR in general. Please post your opinion to the list. Thank you! Satoshi Sekine ===================================== IREXのIRの予備試験の判定が終了しました。 現在データを整理中ですが、今週中には他の新しいデータ等と共に公開 予定です。また検索結果の評価も今週中を目処に各参加者にお送りします。 まずは、判定者の皆様、ありがとうございました。 本試験に向けて貴重な経験ができたと思っております。 本試験でもどうぞよろしくお願いいたします。 判定者などから意見が寄せられています。 参加者全員に関係する事だと思いますので、このメイリングリストで 議論をしたいと思います。よろしくお願いします。 関根 ===================================== 判定結果の統計 -------------- 判定結果の数としては以下のような形になっています。 (この数には、前に指摘しました元データのバグである 950823|24のデータが入ったままです) より詳しい統計を用意しますので、お待ちください。 Aが100くらいになる事を目標に検索要求を作成したのですが、 そんなに悪くない結果になっていると思います。 :-) TOPIC-ID # of Doc Final Judgement A B C 1001: 931 80 145 706 1002: 1096 89 61 946 1003: 1316 42 407 867 1004: 1480 108 66 1306 1005: 1099 50 41 1008 1006: 1356 66 77 1213 検索要求の細かさについて ------------------------ > ・検索要求(とそれに付けられているコメント)が正解判定を行なうのに > 十分詳細であるとは言えなかったので、グレーゾーンの判定に頭を悩ま > した。コメントをもう少し詳細化してもらえる方が嬉しい。 > また、第1段の判定者が判定中に気がついた点をコメントしてもらえる > と嬉しい。 理想的には、迷う事がないような検索要求を作成できるといいのですが、 その為には、このような検索をすべてやって、その上で検索要求を作成 しなければいけないという事になってしまいます。現実的にそれは無理で すので、ほぼ現在の状況以上の事はできかねると思います。ただ、私も 判定をしましたが、グレーな部分はどうしても存在します。それに対し 判定者が実際にそのように判定をしたか。または、判定者が判定した 基準を文章化して、コメントとして残す事は可能だと思います。今回の 予備試験では、そのような要求を予めしていなかったのですが、本試験 では、このようなコメントを判定者に作成してもらって、公開するデータに 付与する事によって、より役に立つデータを作成する事ができるのでは と思います。特に判定者になった方には、その可能性について、参加者 の方には、試験における問題点について議論いただけるとありがたいです。 学生判定の調整について ---------------------- > ・本番の時には、検索要求がふえるので、上級判定者の担当も増えることが > 予想されるが、(個人的な問題かも知れないが)IREX の作業は業務の > 合間にやるので、できるだけ上級判定者の作業を減らして欲しいと思う。 > そこで、例えば、第1段の判定者同士で調整する機会を作り、それでも > 合意できなかったもののみ上級判定者が判定するというような手順に > できないでしょうか? 学生判定者の方どうでしょうか? 合意できなかったものを見付けるという のは、土屋君のツールを使えば簡単にできますが、調整をする事がいい事 なのか、それが可能なのかについては多少疑問が残ります。ケアレスミスを 消すという意味では有効かもしれませんが、最終判定の時にはケアレスミス の部分にはあまり時間はかかりませんでした。やはり本質的にグレーの部分 の判定が大変でした。私の経験ですが。 参加団体の提出システム数について -------------------------------- それから、判定にかかった時間ですが、学生判定は8-10時間程度の人が ほとんどで、実際の判定はそんなに時間のかからなかったもののようです。 最終判定は、現在は2人の情報だけですが、3時間と4時間弱という事です。 したがって、これまでは各団体あたり提出システムの数を1としていましたが その数を2としたいと思います。 その他 ------ その他、過去のメイルを見ながら議論になっている所を捜していますが、 すでに私や判定者メイリングリストに投稿されたものも含め、皆様の方 からも、メイリングリストに投稿願います。 判定者メイリングリストの内容、江里口さんと関根の間でのNE定義に関 する議論についても、今週中にホームページなどから公開する予定です。 関根  1, filed,, Summary-line: 22-Dec to: irex@karc.crl.go.jp #[irex 119] IREX: announcement of the top, bottom and mean score Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id NAA21093 for ; Tue, 22 Dec 1998 13:16:55 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id NAA01156 for ; Tue, 22 Dec 1998 13:17:56 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id DAA20656; Wed, 23 Dec 1998 03:12:46 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id DAA14664; Wed, 23 Dec 1998 03:12:44 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id DAA19029; Wed, 23 Dec 1998 03:07:05 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id DAA19024 for ; Wed, 23 Dec 1998 03:07:04 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id DAA05522 for ; Wed, 23 Dec 1998 03:06:54 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id DAA14659 for ; Wed, 23 Dec 1998 03:12:41 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id DAA28699 for ; Wed, 23 Dec 1998 03:12:39 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id NAA28744; Tue, 22 Dec 1998 13:12:35 -0500 (EST) Date: Tue, 22 Dec 1998 13:12:35 -0500 (EST) From: Satoshi Sekine Message-Id: <199812221812.NAA28744@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 119 Subject: [irex 119] IREX: announcement of the top, bottom and mean score Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 634 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Tue, 22 Dec 1998 13:12:35 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 119 Subject: [irex 119] IREX: announcement of the top, bottom and mean score Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 634 IREXメイリングリストの皆様: Upon requests, I'm thinking to announce the scores of the best, worst and mean systems (just the scores, without the name of the systems or the participants) in the IR&NE dryruns. If there is no objection until the end of the month, I will do so in the early next month. Satoshi Sekine ===================================== 数名の方から、IR,NE共に自分のシステムの相対的な位置を 把握するために最高点、最低点と中間点を公表して欲いという リクエストがありました。もし、12月中にどなたからも異論が なければ、来月頭を目処に公表したいと考えています。 関根聡  1, filed,, Summary-line: 23-Dec ishikawa@ulis.ac.jp #[irex 120] Re: IREX IR judge Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id UAA27094 for ; Tue, 22 Dec 1998 20:08:21 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id UAA08599 for ; Tue, 22 Dec 1998 20:09:19 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id KAA21958; Wed, 23 Dec 1998 10:04:12 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id KAA17957; Wed, 23 Dec 1998 10:04:10 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id JAA20021; Wed, 23 Dec 1998 09:58:30 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id JAA20016 for ; Wed, 23 Dec 1998 09:58:29 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id JAA05592 for ; Wed, 23 Dec 1998 09:58:19 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id KAA17952 for ; Wed, 23 Dec 1998 10:04:06 +0900 (JST) Received: from goat.ipc.ulis.ac.jp (root@goat.ipc.ulis.ac.jp [133.51.184.12]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id KAA00668 for ; Wed, 23 Dec 1998 10:04:05 +0900 (JST) Received: from [133.51.40.42] (peace.ulis.ac.jp [133.51.40.42]) by goat.ipc.ulis.ac.jp (8.8.6 (PHNE_14041)/8.8.6) with ESMTP id KAA12843 for ; Wed, 23 Dec 1998 10:05:56 +0900 (JST) Message-Id: <199812230105.KAA12843@goat.ipc.ulis.ac.jp> X-Sender: ishikawa@pop.ipc.ulis.ac.jp X-Mailer: Macintosh Eudora Pro Version 3.1.1-J In-Reply-To: <199812221806.NAA28737@noreen.cs.nyu.edu> Mime-Version: 1.0 Content-Transfer-Encoding: 7bit Date: Wed, 23 Dec 1998 10:26:23 +0900 To: irex@karc.crl.go.jp From: Tetsuya Ishikawa Reply-To: irex@karc.crl.go.jp X-Sequence: irex 120 Subject: [irex 120] Re: IREX IR judge Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="ISO-2022-JP" Content-Length: 1216 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f X-Sender: ishikawa@pop.ipc.ulis.ac.jp X-Mailer: Macintosh Eudora Pro Version 3.1.1-J In-Reply-To: <199812221806.NAA28737@noreen.cs.nyu.edu> Mime-Version: 1.0 Content-Transfer-Encoding: 7bit Date: Wed, 23 Dec 1998 10:26:23 +0900 To: irex@karc.crl.go.jp From: Tetsuya Ishikawa Reply-To: irex@karc.crl.go.jp X-Sequence: irex 120 Subject: [irex 120] Re: IREX IR judge Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="ISO-2022-JP" Content-Length: 1216 石川@図情大です。 At 1:06 PM -0500 98.12.22, Satoshi Sekine wrote: >IREXのIRの予備試験の判定が終了しました。 >まずは、判定者の皆様、ありがとうございました。 御苦労さまでした。J1の時に経験しましたが、神経を使う大変な仕事です。 心から感謝します。 >判定者などから意見が寄せられています。 >参加者全員に関係する事だと思いますので、このメイリングリストで >議論をしたいと思います。よろしくお願いします。 >判定者が実際にそのように判定をしたか。または、判定者が判定した >基準を文章化して、コメントとして残す事は可能だと思います。 Q+Narrativeに対して、判定コメントを公開すること、大切と考えます。 グレーな記事は当然あるでしょう。それだけにどう判断したか、 IR機能研究の為に、強いては情報要求の多様性を知る意味で意義あると 考えます。 ----------------------------- 石川徹也  図書館情報大学    〒305-8550 つくば市春日1ー2 Tel.0298-59-1399, Fax.0298-59-1093 URL---http://www.ulis.ac.jp/~ishikawa/index.html Tetsuya Ishikawa University of Library and Information Science 1-2 Kasuga, Tsukuba, 305-8550 Japan, Fax. +81 298 59 1093 ----------------------------  1, filed, answered,, Summary-line: 24-Dec FRzdXlvc2hpIEtpdGFuGyhK?= #[irex 121] IREX IR judge Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id FAA06036 for ; Thu, 24 Dec 1998 05:17:24 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id FAA00435 for ; Thu, 24 Dec 1998 05:18:27 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id TAA05028; Thu, 24 Dec 1998 19:13:17 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id TAA24743; Thu, 24 Dec 1998 19:13:15 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id TAA03161; Thu, 24 Dec 1998 19:07:36 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id TAA03156 for ; Thu, 24 Dec 1998 19:07:35 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id TAA06336 for ; Thu, 24 Dec 1998 19:07:24 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id TAA24738 for ; Thu, 24 Dec 1998 19:13:12 +0900 (JST) Received: from ms.nttdata.co.jp (ms1.nttdata.co.jp [163.135.193.232]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id TAA19212 for ; Thu, 24 Dec 1998 19:13:11 +0900 (JST) Received: from mx0.nttdata.co.jp (mx0.nttdata.co.jp [163.135.10.11]) by ms.nttdata.co.jp (8.8.8/3.6W-NTTDATA-TOP-09/17/98) with ESMTP id TAA15149 for ; Thu, 24 Dec 1998 19:13:10 +0900 (JST) Received: from pluto.rd.nttdata.co.jp ([163.135.16.10]) by mx0.nttdata.co.jp (8.8.5/3.5Wpl4-mx0/98091611) with ESMTP id TAA10761 for ; Thu, 24 Dec 1998 19:13:10 +0900 (JST) Received: from mail.lit.rd.nttdata.co.jp (litchi.lit.rd.nttdata.co.jp [163.135.200.130]) by pluto.rd.nttdata.co.jp (8.9.0/3.6W) with ESMTP id TAA05579 for ; Thu, 24 Dec 1998 19:13:09 +0900 (JST) Received: from litmus.lit.rd.nttdata.co.jp (litmus.lit.rd.nttdata.co.jp [163.135.200.132]) by mail.lit.rd.nttdata.co.jp (8.8.8+Sun/3.6W-lit-server-05/22/98) with ESMTP id TAA21391 for ; Thu, 24 Dec 1998 19:13:08 +0900 (JST) Received: by litmus.lit.rd.nttdata.co.jp with Internet Mail Service (5.5.1960.3) id ; Thu, 24 Dec 1998 19:09:23 +0900 Message-ID: From: =?iso-2022-jp?B?GyRCTFpDKxsoSiAbJEI2LxsoSiAvIFRzdXlvc2hpIEtpdGFuGyhK?= =?iso-2022-jp?B?aQ==?= To: "'irex@karc.crl.go.jp'" Date: Thu, 24 Dec 1998 19:09:17 +0900 MIME-Version: 1.0 X-Mailer: Internet Mail Service (5.5.1960.3) Reply-To: irex@karc.crl.go.jp X-Sequence: irex 121 Subject: [irex 121] IREX IR judge Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="iso-2022-jp" Content-Length: 1608 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f From: =?iso-2022-jp?B?GyRCTFpDKxsoSiAbJEI2LxsoSiAvIFRzdXlvc2hpIEtpdGFuGyhK?= =?iso-2022-jp?B?aQ==?= To: "'irex@karc.crl.go.jp'" Date: Thu, 24 Dec 1998 19:09:17 +0900 MIME-Version: 1.0 X-Mailer: Internet Mail Service (5.5.1960.3) Reply-To: irex@karc.crl.go.jp X-Sequence: irex 121 Subject: [irex 121] IREX IR judge Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="iso-2022-jp" Content-Length: 1608 NTTデータの木谷です。 判定に関するコメントです。 (1) A判定とB判定の区別について(確認です。)  記事に主題は複数ありうるので、記事の一部が検索要求と関連 している場合でもA判定とする。特に長い記事の場合は、いくつか の話題が含まれていることが多いです。 (2) topic 1005「琵琶湖の環境問題」に関して 1005 琵琶湖の環境問題 琵琶湖の環境問題、汚れ、赤潮、アオコの発生、または、 その改善、調査、訴えに関する記事。埋立など環境を変化させるような 物、また琵琶湖に影響を及ぼす可能性が指摘されている問題も含む。  このトピックに関連する記事として、雨不足のため琵琶湖の 水位が下がり、取水制限をしたという記事が多数あります。 Narrativeを広く解釈すると、琵琶湖に影響を及ぼす可能性があり、 環境を変化させる物としてこの事象は正解になります。しかし私は、 Narrativeの第二文は第一文の補足と理解したので、環境問題を 水の汚れなどの狭義にとらえました。したがって、ただの渇水 の事象は不正解としています。ただし、渇水が琵琶湖の環境に 与えた影響が記述されている場合は、正解にしています。この 問題を判定された皆様はどのように考えますか? ちなみに私は「琵琶湖の環境問題」の正解判定をしましたが、 6時間くらいかかりました。学生さんのC判定についてもさっと 確認し、3名の判定が異なる場合はコメントを入れました。 (3)コメントについて  どなたかが指摘されていたと思いますが、学生さんにも迷った ときだけでもいいですから、コメントを入れて欲しいと思います。 木谷  1,, Summary-line: 24-Dec to: irex@karc.crl.go.jp #[irex 122] IREX IR judge Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id LAA07387 for ; Thu, 24 Dec 1998 11:19:36 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id LAA02228 for ; Thu, 24 Dec 1998 11:20:31 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id BAA06848; Fri, 25 Dec 1998 01:15:26 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id BAA00246; Fri, 25 Dec 1998 01:15:24 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id BAA04600; Fri, 25 Dec 1998 01:09:45 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id BAA04595 for ; Fri, 25 Dec 1998 01:09:44 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id BAA06402 for ; Fri, 25 Dec 1998 01:09:32 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id BAA00241 for ; Fri, 25 Dec 1998 01:15:20 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id BAA22290 for ; Fri, 25 Dec 1998 01:15:19 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id LAA29938; Thu, 24 Dec 1998 11:15:06 -0500 (EST) Date: Thu, 24 Dec 1998 11:15:06 -0500 (EST) From: Satoshi Sekine Message-Id: <199812241615.LAA29938@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: =?iso-2022-jp?B?GyRCTFpDKxsoSiAbJEI2LxsoSiAvIFRzdXlvc2hpIEtpdGFuGyhK?= =?iso-2022-jp?B?aQ==?='s message of Thu, 24 Dec 1998 19:09:17 +0900 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 122 Subject: [irex 122] IREX IR judge Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2292 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Thu, 24 Dec 1998 11:15:06 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: =?iso-2022-jp?B?GyRCTFpDKxsoSiAbJEI2LxsoSiAvIFRzdXlvc2hpIEtpdGFuGyhK?= =?iso-2022-jp?B?aQ==?='s message of Thu, 24 Dec 1998 19:09:17 +0900 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 122 Subject: [irex 122] IREX IR judge Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2292 木谷さんありがとうございます。 このように問題点を出す事も、予備試験の目的ですので、このような 指摘を歓迎します。 (1) A判定とB判定の区別について(確認です。)  記事に主題は複数ありうるので、記事の一部が検索要求と関連 している場合でもA判定とする。特に長い記事の場合は、いくつか の話題が含まれていることが多いです。 ガイドラインに書いてあるように、A判定の基準は A: その記事の主題を一文で表現した際に、検索課題がその一文の表現 と密接に関係する事が明白であること。 という事です、確かに複数の主題があるという事は考えられますし、 主題とは何かというのも、かなり難しい所だと思います。(これも主観的で しかありえないという意味です) (2) topic 1005「琵琶湖の環境問題」に関して 1005 琵琶湖の環境問題 琵琶湖の環境問題、汚れ、赤潮、アオコの発生、または、 その改善、調査、訴えに関する記事。埋立など環境を変化させるような 物、また琵琶湖に影響を及ぼす可能性が指摘されている問題も含む。  このトピックに関連する記事として、雨不足のため琵琶湖の 水位が下がり、取水制限をしたという記事が多数あります。 Narrativeを広く解釈すると、琵琶湖に影響を及ぼす可能性があり、 環境を変化させる物としてこの事象は正解になります。しかし私は、 Narrativeの第二文は第一文の補足と理解したので、環境問題を 水の汚れなどの狭義にとらえました。したがって、ただの渇水 の事象は不正解としています。ただし、渇水が琵琶湖の環境に 与えた影響が記述されている場合は、正解にしています。この 問題を判定された皆様はどのように考えますか? そうですね。「汚染」と「環境」は違う事なのですね。 (3)コメントについて  どなたかが指摘されていたと思いますが、学生さんにも迷った ときだけでもいいですから、コメントを入れて欲しいと思います。 たしか、判定者へのメイルにはそのように書いたと思いますが、 すべての人がコメントを書いたという事ではないようです。 本試験では、「最終的にあなたが判定した結果全体に対し、検索課題を 作り直してください。」という仕事を加えようかと思っていますが どうでしょうか? 難しすぎるでしょうか? 関根  1, filed,, Summary-line: 24-Dec to: irex@karc.crl.go.jp #[irex 123] NE definition Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id RAA09056 for ; Thu, 24 Dec 1998 17:26:01 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id RAA04336 for ; Thu, 24 Dec 1998 17:27:05 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id HAA08021; Fri, 25 Dec 1998 07:22:13 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id HAA02873; Fri, 25 Dec 1998 07:22:12 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id HAA05261; Fri, 25 Dec 1998 07:16:32 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id HAA05256 for ; Fri, 25 Dec 1998 07:16:31 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id HAA06455 for ; Fri, 25 Dec 1998 07:16:20 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id HAA02868 for ; Fri, 25 Dec 1998 07:22:08 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id HAA23893 for ; Fri, 25 Dec 1998 07:22:06 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id RAA00147; Thu, 24 Dec 1998 17:22:04 -0500 (EST) Date: Thu, 24 Dec 1998 17:22:04 -0500 (EST) From: Satoshi Sekine Message-Id: <199812242222.RAA00147@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: Satoshi Sekine's message of Thu, 24 Dec 1998 11:15:06 -0500 (EST) <199812241615.LAA29938@noreen.cs.nyu.edu> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 123 Subject: [irex 123] NE definition Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 547 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Thu, 24 Dec 1998 17:22:04 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: Satoshi Sekine's message of Thu, 24 Dec 1998 11:15:06 -0500 (EST) <199812241615.LAA29938@noreen.cs.nyu.edu> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 123 Subject: [irex 123] NE definition Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 547 Dear IREX mailing list member: Ragarding NE definition, percentage expression. ------------- NE定義について質問が来ました。 1対2というような比率的な表現をPERCENTとするかという事です。 野球の試合結果のような物は、PERCENTではないと断言してしまって いいと思いますが、 AとBを1対2の割合で混ぜる のような場合にはOPTIONALを使用したいと思います。 (「1:2」や似たような表現も同様です。) 反論異論があったらよろしくお願いします。 関根  1, filed,, Summary-line: 26-Dec to: irex@karc.crl.go.jp #[irex 124] A new IREX package (IREX981224.tar.gz) Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id PAA14762 for ; Sat, 26 Dec 1998 15:49:17 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id PAA21885 for ; Sat, 26 Dec 1998 15:50:23 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id FAA22034; Sun, 27 Dec 1998 05:45:18 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id FAA12125; Sun, 27 Dec 1998 05:45:17 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id FAA18440; Sun, 27 Dec 1998 05:39:38 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id FAA18435 for ; Sun, 27 Dec 1998 05:39:37 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id FAA07418 for ; Sun, 27 Dec 1998 05:39:24 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id FAA12120 for ; Sun, 27 Dec 1998 05:45:13 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id FAA13858 for ; Sun, 27 Dec 1998 05:45:11 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id PAA01078; Sat, 26 Dec 1998 15:45:04 -0500 (EST) Date: Sat, 26 Dec 1998 15:45:04 -0500 (EST) From: Satoshi Sekine Message-Id: <199812262045.PAA01078@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 124 Subject: [irex 124] A new IREX package (IREX981224.tar.gz) Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 499 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Sat, 26 Dec 1998 15:45:04 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 124 Subject: [irex 124] A new IREX package (IREX981224.tar.gz) Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 499 Dear IREX mailing list member: A new IREX package is ready. It contains the result of IR dryrun (document ID with the judgement). > ftp cs.nyu.edu ftp> cd pub/local/sekine ftp> binary ftp> get IREX981224.tar.gz Merry Christmas & Happy New Year! Satoshi Sekine ====================== 皆様 新しいIREXパッケージを公開します。(IREX981224.tar.gz) これには、IRの判定結果、(少し)新しいNE定義が含まれております。 それではよいお年を! 関根  1, filed,, Summary-line: 28-Dec isahara@crl.go.jp #[irex 125] AI gakkai Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA22729 for ; Mon, 28 Dec 1998 09:07:59 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA06851 for ; Mon, 28 Dec 1998 09:09:07 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id XAA02828; Mon, 28 Dec 1998 23:04:11 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id XAA11061; Mon, 28 Dec 1998 23:04:09 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id WAA28550; Mon, 28 Dec 1998 22:58:31 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id WAA28545 for ; Mon, 28 Dec 1998 22:58:30 +0900 (JST) Received: from ipsgw.crl.go.jp (ipsgw [133.243.25.239]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id WAA07959 for ; Mon, 28 Dec 1998 22:58:16 +0900 (JST) Received: from ripeness.crl.go.jp (ripeness [133.243.71.201]) by ipsgw.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with SMTP id WAA06776 for ; Mon, 28 Dec 1998 22:50:26 +0900 (JST) Received: from localhost by ripeness.crl.go.jp (4.1/6.4J.6-karc/s) id AA11259; Mon, 28 Dec 98 23:03:08 JST Message-Id: <9812281403.AA11259@ripeness.crl.go.jp> To: irex@karc.crl.go.jp Date: Mon, 28 Dec 1998 23:03:07 +0900 From: Isahara Hitoshi Reply-To: irex@karc.crl.go.jp X-Sequence: irex 125 Subject: [irex 125] AI gakkai Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 474 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f To: irex@karc.crl.go.jp Date: Mon, 28 Dec 1998 23:03:07 +0900 From: Isahara Hitoshi Reply-To: irex@karc.crl.go.jp X-Sequence: irex 125 Subject: [irex 125] AI gakkai Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 474 通信総研の井佐原です。 来年開催するIREXの会議に、人工知能学会が助成金10万円を提供す る条件として、 >>・当会の全国大会で中間報告をしていただく >>・関係者に当会に会員になっていただく の2点が挙げられています。 2点目については、特に厳しい要求ということではないということですが、 未加入の方で、今回のことをきっかけに人工知能学会に興味を持った方が いらっしゃれば、ぜひ、ご加入下さい。 井佐原@通信総研  1, filed,, Summary-line: 11-Jan to: irex@karc.crl.go.jp #[irex 126] IREX dryrun result summary Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id LAA03750 for ; Mon, 11 Jan 1999 11:59:56 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id MAA21922 for ; Mon, 11 Jan 1999 12:01:20 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id BAA10065; Tue, 12 Jan 1999 01:56:20 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id BAA12813; Tue, 12 Jan 1999 01:56:19 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id BAA20941; Tue, 12 Jan 1999 01:50:44 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id BAA20936 for ; Tue, 12 Jan 1999 01:50:43 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id BAA13127 for ; Tue, 12 Jan 1999 01:50:19 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id BAA12808 for ; Tue, 12 Jan 1999 01:56:15 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id BAA14828 for ; Tue, 12 Jan 1999 01:56:13 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id LAA09849; Mon, 11 Jan 1999 11:56:08 -0500 (EST) Date: Mon, 11 Jan 1999 11:56:08 -0500 (EST) From: Satoshi Sekine Message-Id: <199901111656.LAA09849@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 126 Subject: [irex 126] IREX dryrun result summary Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 884 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Mon, 11 Jan 1999 11:56:08 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 126 Subject: [irex 126] IREX dryrun result summary Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 884 IREXメイリングリストの皆様: This is the IREX dryrun result summary (the best, median, and worst results). 昨年末に約束した、結果のサマリーをお送りします。 これらの正解は最新のIREXパッケージ(IREX981224) に含まれております。 関根 ----------------------------------------------- IR (10 systems): Average Precision A as the answer best 0.3675 median (5th) 0.1980 worst 0.0486 A and B as the answer best 0.5173 median (5th) 0.3047 worst 0.0937 NE (12 systems): F-measure when NE_DRYRUN03.idx is the answer best 68.23 median (6th) 58.39 worst 17.41 # Note that the NE results distributed to the participants are based on NE_DRYRUN01.idx. Those are about 1 or 2 less F-measure.  1, filed,, Summary-line: 20-Jan to: irex@karc.crl.go.jp #[irex 127] Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id NAA04683 for ; Wed, 20 Jan 1999 13:41:08 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id NAA04185 for ; Wed, 20 Jan 1999 13:42:39 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id DAA02573; Thu, 21 Jan 1999 03:36:52 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id DAA15251; Thu, 21 Jan 1999 03:36:50 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id DAA13383; Thu, 21 Jan 1999 03:31:18 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id DAA13378 for ; Thu, 21 Jan 1999 03:31:17 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id DAA25747 for ; Thu, 21 Jan 1999 03:30:46 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id DAA15246 for ; Thu, 21 Jan 1999 03:36:46 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id DAA20141 for ; Thu, 21 Jan 1999 03:36:43 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id NAA14178; Wed, 20 Jan 1999 13:36:38 -0500 (EST) Date: Wed, 20 Jan 1999 13:36:38 -0500 (EST) From: Satoshi Sekine Message-Id: <199901201836.NAA14178@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 127 Subject: [irex 127] Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2735 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Wed, 20 Jan 1999 13:36:38 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 127 Subject: [irex 127] Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2735 IREXメイリングリストの皆様: I would like to hear discussion about the future IREX. In particular, I'm wondering if we should apply IPA found whose due date is February 5th. Please welcome an additional advisor, Mr.Iida (CSL/SONY,ATR) who is currently the president of the Association of NLP, Japan. --------------------- IPAの公募(2月5日締切)がありましたが、それに関連して 皆様からIREXの将来についての意見を伺いたく思います。 これまでにも、何人もの方からIREXを続けていく事の意義や希望を 伺っていますが、皆様はどう思われますか? また、今回のIPAに応募すべきかどうか。応募するのならどのような 形態ですべきかという事について意見を伺いたく思います。 現在の所、IPAへ応募するかどうかに関しては以下のような賛成意見と 消極意見があります。また、やる場合の運営方法の私の私案も載せます。 賛成意見: * IREXを続けていく事は重要であるし、その為の資金獲得の機会が あれば、積極的に行なうべきだ。IPAのプロジェクト規模はIREXに 適しているし、目的もデータの構築や、それに関するパブリックなツールの 作成とすれば、IPAの内容にも合致する。IPAが公的資金である事も IREXの精神にとって良い。 * IPAは倍率が高く、出したからって当るものではない。時期を考えるのは 後まわしにしてでも機会があれば、とりあえず出すべきだ(消極意見への反論) 消極意見: * IREX1が終了していない段階で先走るのは良くない。この結果を待ち 課題や今後の展開を熟考した上で先に進むべきだ。 * 参加者がどのくらいになるか分らないのに、規模を大きくしてやる事は 大丈夫なのか? 運営私案: これまでの経過も考え、NYU,通総研、計量計画研究所の3者が提案の中心に なり、大学、公的研究機関なども提案者として参加していただきたく思います。 企業にも提案者に加わってもらった方がいいかどうかは各企業での手続きの 繁雑さや、コンテストの公平感などの要因から、私は何とも言えません。 課題は、情報検索、情報抽出だけに限らず、要約、照応、その他のNLの 技術なども含めて7、8課題としたいと思います。すべての課題を今のように 私が担当するのは不可能ですから、それぞれの課題毎に担当者(グループ)を 決めて、それぞれやっていくという形にし、データ作成の予算をプロジェクト費 から分配します。 どのような些細な点でも構いませんので、是非御意見を下さい。 (ML宛でも、私個人宛でも構いません。) どうぞよろしくお願いいたします。 また、SONY/CSL,ATRの飯田さん(現在、言語処理学会会長)にもIREXの顧問に なっていただく事をお願いした所、快諾を得ました。 これで、歴代の言語処理学会の会長に顧問になっていただいた事になります。 関根  1, filed,, Summary-line: 20-Jan to: irex@karc.crl.go.jp #[irex 128] Question Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id QAA08348 for ; Wed, 20 Jan 1999 16:32:09 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id QAA07289 for ; Wed, 20 Jan 1999 16:33:41 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id GAA03253; Thu, 21 Jan 1999 06:28:14 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id GAA16723; Thu, 21 Jan 1999 06:28:13 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id GAA13926; Thu, 21 Jan 1999 06:22:41 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id GAA13921 for ; Thu, 21 Jan 1999 06:22:40 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id GAA25785 for ; Thu, 21 Jan 1999 06:22:09 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id GAA16718 for ; Thu, 21 Jan 1999 06:28:09 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id GAA20972 for ; Thu, 21 Jan 1999 06:28:06 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id QAA14289; Wed, 20 Jan 1999 16:28:04 -0500 (EST) Date: Wed, 20 Jan 1999 16:28:04 -0500 (EST) From: Satoshi Sekine Message-Id: <199901202128.QAA14289@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 128 Subject: [irex 128] Question Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1988 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Wed, 20 Jan 1999 16:28:04 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 128 Subject: [irex 128] Question Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1988 Question from NE tagging. Satoshi Sekine -------------------------- 私の知識不足から以下の単語の意味(固有名種類)が分りません。 (身近にある辞書などは引いたのですが載っていないものです) 御存知の方がありましたら、お教えください。 (直接私にメイルをください) どうもありがとうございます。 関根 -------------------------- 単語:「コスタボダ」  一七四二年に創立されたコスタは、スウェーデン最古の工場。三百人を超 える従業員が「コスタボダ」製品を作っている。この工房からはこれまでに 多くの工芸家が育ち、ざん新な作品を発表している。 単語:「マルチ・マックス」  チャゲアスの活動のユニークなところは、大体、一年間を二分して、デュ オとしての活動を半年、残りをソロにしている点だ。チャゲは、昨年末に、 ソロの拠点としているマルチ・マックスのアルバムを発売、飛鳥も、新年に ソロ・シングル、二月末にはアルバムを予定している。 単語:「ワーヤード」 (最初にある「彼」とはナラダ・マイケル・ウォルデンという人)  彼の仕事はプロデューサーである。ケニーG、ホイットニー、シーナ・イ ーストンなど80年代以降、手掛けた作品のほとんどがプラチナ・アルバム となっている。  元々は、ドラマー。フュージョン時代の『マハビシュヌ・オーケストラ』 を経て、ジェフ・ベックと「ワーヤード」も作った。体力派である。 単語:「カモカ」  「ヤツは何のために働くかというと夕食と晩しゃくのためだそうである。 私も全くその通りだと思う」。田辺聖子さんの言葉だ。ヤツとはカモカのお っちゃん。よわい五十に近づいて、私にもこの心境が、しみじみわかるよう になった。 単語:「恭順派」の「恭順」  創業者の大橋佐平は五十歳で、新潟の長岡から上京、博文館を起こした。 「祖父、乙羽が佐平の長女と結婚、養子に。日記を出した明治二十八年には 支配人でした」。佐平は海外事情にも明るく、戊辰戦争では恭順派。窮状を みかねた支藩からの救援米を、ひもじさを我慢し、長岡再興のため学校をた てる資本にしたという、山本有三の戯曲「米百俵」。  1, filed,, Summary-line: 20-Jan mine@dfki.de #[irex 129] Re: Question Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id QAA08720 for ; Wed, 20 Jan 1999 16:51:57 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id QAA07637 for ; Wed, 20 Jan 1999 16:53:32 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id GAA03342; Thu, 21 Jan 1999 06:48:31 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id GAA16925; Thu, 21 Jan 1999 06:48:30 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id GAA13990; Thu, 21 Jan 1999 06:42:58 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id GAA13985 for ; Thu, 21 Jan 1999 06:42:57 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id GAA25793 for ; Thu, 21 Jan 1999 06:42:26 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id GAA16920 for ; Thu, 21 Jan 1999 06:48:26 +0900 (JST) Received: from clichy.dfki.uni-sb.de (root@clichy.dfki.uni-sb.de [134.96.187.26]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id GAA21069 for ; Thu, 21 Jan 1999 06:48:24 +0900 (JST) Organization: DFKI Saarbruecken GmbH, D 66123 Saarbruecken Received: from localhost (loriot [134.96.187.116]) by clichy.dfki.uni-sb.de (8.8.8/8.8.8) with ESMTP id WAA15074 for ; Wed, 20 Jan 1999 22:48:21 +0100 (MET) To: irex@karc.crl.go.jp In-Reply-To: Your message of "Wed, 20 Jan 1999 16:28:04 -0500 (EST)" <199901202128.QAA14289@noreen.cs.nyu.edu> References: <199901202128.QAA14289@noreen.cs.nyu.edu> X-Mailer: Mew version 1.93 on Emacs 20.3 / Mule 4.0 (HANANOEN) X-URL: http://www.dfki.de/~mine/ Mime-Version: 1.0 Content-Transfer-Encoding: 7bit Message-Id: <19990120224820N.mine@dfki.de> Date: Wed, 20 Jan 1999 22:48:20 +0100 From: Tsunenori Mine X-Dispatcher: imput version 980905(IM100) Lines: 41 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 129 Subject: [irex 129] Re: Question Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 1789 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Organization: DFKI Saarbruecken GmbH, D 66123 Saarbruecken To: irex@karc.crl.go.jp In-Reply-To: Your message of "Wed, 20 Jan 1999 16:28:04 -0500 (EST)" <199901202128.QAA14289@noreen.cs.nyu.edu> References: <199901202128.QAA14289@noreen.cs.nyu.edu> X-Mailer: Mew version 1.93 on Emacs 20.3 / Mule 4.0 (HANANOEN) X-URL: http://www.dfki.de/~mine/ Mime-Version: 1.0 Content-Transfer-Encoding: 7bit Date: Wed, 20 Jan 1999 22:48:20 +0100 From: Tsunenori Mine X-Dispatcher: imput version 980905(IM100) Lines: 41 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 129 Subject: [irex 129] Re: Question Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 1789 From: Satoshi Sekine Subject: [irex 128] Question Date: Wed, 20 Jan 1999 16:28:04 -0500 (EST) Message-ID: <199901202128.QAA14289@noreen.cs.nyu.edu> > -------------------------- > 私の知識不足から以下の単語の意味(固有名種類)が分りません。 > (身近にある辞書などは引いたのですが載っていないものです) > 御存知の方がありましたら、お教えください。 > (直接私にメイルをください) > 単語:「マルチ・マックス」 > >  チャゲアスの活動のユニークなところは、大体、一年間を二分して、デュ > オとしての活動を半年、残りをソロにしている点だ。チャゲは、昨年末に、 > ソロの拠点としているマルチ・マックスのアルバムを発売、飛鳥も、新年に > ソロ・シングル、二月末にはアルバムを予定している。 歌手の「チャゲ&飛鳥」の「チャゲ」の方がリーダとして率いている グループの名前です。 > 単語:「恭順派」の「恭順」 > >  創業者の大橋佐平は五十歳で、新潟の長岡から上京、博文館を起こした。 > 「祖父、乙羽が佐平の長女と結婚、養子に。日記を出した明治二十八年には > 支配人でした」。佐平は海外事情にも明るく、戊辰戦争では恭順派。窮状を > みかねた支藩からの救援米を、ひもじさを我慢し、長岡再興のため学校をた > てる資本にしたという、山本有三の戯曲「米百俵」。 恭順は広辞苑では、 ”つつしんで従うこと。心から服従すること。「―の意を表する」” とあり、長岡藩は幕府側で、政府軍は戦っていますから、 恭順派=「服従派」 ということだと思います。 -------------------------------------------------------------------- Tsunenori Mine [mine@dfki.de] TEL)+49-681-302-4933 FAX) -5338 DFKI(Deutsches Forschungszentrum fuer Kuenstliche Intelligenz,GmbH) Stuhlsatzenhausweg 3, 66123 Saarbruecken, Germany --------------------------------------------------------------------  1,, Summary-line: 20-Jan mine@dfki.de #[irex 130] Re: Question Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id QAA08753 for ; Wed, 20 Jan 1999 16:54:08 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id QAA07665 for ; Wed, 20 Jan 1999 16:55:44 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id GAA03378; Thu, 21 Jan 1999 06:50:49 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id GAA16986; Thu, 21 Jan 1999 06:50:48 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id GAA14003; Thu, 21 Jan 1999 06:45:16 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id GAA13998 for ; Thu, 21 Jan 1999 06:45:15 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id GAA25796 for ; Thu, 21 Jan 1999 06:44:44 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id GAA16979 for ; Thu, 21 Jan 1999 06:50:44 +0900 (JST) Received: from clichy.dfki.uni-sb.de (root@clichy.dfki.uni-sb.de [134.96.187.26]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id GAA21090 for ; Thu, 21 Jan 1999 06:50:42 +0900 (JST) Organization: DFKI Saarbruecken GmbH, D 66123 Saarbruecken Received: from localhost (loriot [134.96.187.116]) by clichy.dfki.uni-sb.de (8.8.8/8.8.8) with ESMTP id WAA15889 for ; Wed, 20 Jan 1999 22:50:40 +0100 (MET) To: irex@karc.crl.go.jp In-Reply-To: Your message of "Wed, 20 Jan 1999 22:48:20 +0100" <19990120224820N.mine@dfki.de> References: <19990120224820N.mine@dfki.de> X-Mailer: Mew version 1.93 on Emacs 20.3 / Mule 4.0 (HANANOEN) X-URL: http://www.dfki.de/~mine/ Mime-Version: 1.0 Content-Transfer-Encoding: 7bit Message-Id: <19990120225039Z.mine@dfki.de> Date: Wed, 20 Jan 1999 22:50:39 +0100 From: Tsunenori Mine X-Dispatcher: imput version 980905(IM100) Lines: 54 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 130 Subject: [irex 130] Re: Question Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 2429 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Organization: DFKI Saarbruecken GmbH, D 66123 Saarbruecken To: irex@karc.crl.go.jp In-Reply-To: Your message of "Wed, 20 Jan 1999 22:48:20 +0100" <19990120224820N.mine@dfki.de> References: <19990120224820N.mine@dfki.de> X-Mailer: Mew version 1.93 on Emacs 20.3 / Mule 4.0 (HANANOEN) X-URL: http://www.dfki.de/~mine/ Mime-Version: 1.0 Content-Transfer-Encoding: 7bit Date: Wed, 20 Jan 1999 22:50:39 +0100 From: Tsunenori Mine X-Dispatcher: imput version 980905(IM100) Lines: 54 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 130 Subject: [irex 130] Re: Question Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 2429 すいません、間違って、MLの方に流してしまいました。(_o_) 捨てて下さい。 From: Tsunenori Mine Subject: Re: [irex 128] Question Date: Wed, 20 Jan 1999 22:48:20 +0100 Message-ID: <19990120224820N.mine@dfki.de> > From: Satoshi Sekine > Subject: [irex 128] Question > Date: Wed, 20 Jan 1999 16:28:04 -0500 (EST) > Message-ID: <199901202128.QAA14289@noreen.cs.nyu.edu> > > -------------------------- > > 私の知識不足から以下の単語の意味(固有名種類)が分りません。 > > (身近にある辞書などは引いたのですが載っていないものです) > > 御存知の方がありましたら、お教えください。 > > (直接私にメイルをください) > > 単語:「マルチ・マックス」 > > > >  チャゲアスの活動のユニークなところは、大体、一年間を二分して、デュ > > オとしての活動を半年、残りをソロにしている点だ。チャゲは、昨年末に、 > > ソロの拠点としているマルチ・マックスのアルバムを発売、飛鳥も、新年に > > ソロ・シングル、二月末にはアルバムを予定している。 > > 歌手の「チャゲ&飛鳥」の「チャゲ」の方がリーダとして率いている > グループの名前です。 > > > 単語:「恭順派」の「恭順」 > > > >  創業者の大橋佐平は五十歳で、新潟の長岡から上京、博文館を起こした。 > > 「祖父、乙羽が佐平の長女と結婚、養子に。日記を出した明治二十八年には > > 支配人でした」。佐平は海外事情にも明るく、戊辰戦争では恭順派。窮状を > > みかねた支藩からの救援米を、ひもじさを我慢し、長岡再興のため学校をた > > てる資本にしたという、山本有三の戯曲「米百俵」。 > > 恭順は広辞苑では、 > ”つつしんで従うこと。心から服従すること。「―の意を表する」” > とあり、長岡藩は幕府側で、政府軍は戦っていますから、 > > 恭順派=「服従派」 > > ということだと思います。 > > -------------------------------------------------------------------- > Tsunenori Mine [mine@dfki.de] TEL)+49-681-302-4933 FAX) -5338 > DFKI(Deutsches Forschungszentrum fuer Kuenstliche Intelligenz,GmbH) > Stuhlsatzenhausweg 3, 66123 Saarbruecken, Germany > -------------------------------------------------------------------- -------------------------------------------------------------------- Tsunenori Mine [mine@dfki.de] TEL)+49-681-302-4933 FAX) -5338 DFKI(Deutsches Forschungszentrum fuer Kuenstliche Intelligenz,GmbH) Stuhlsatzenhausweg 3, 66123 Saarbruecken, Germany --------------------------------------------------------------------  1, filed, answered,, Summary-line: 21-Jan tsuya.sakai@toshiba.co.jp #[irex 131] Re: Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id CAA18795 for ; Thu, 21 Jan 1999 02:46:31 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id CAA17309 for ; Thu, 21 Jan 1999 02:48:07 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id QAA08601; Thu, 21 Jan 1999 16:42:26 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id QAA03730; Thu, 21 Jan 1999 16:42:24 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id QAA21054; Thu, 21 Jan 1999 16:36:47 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id QAA21048 for ; Thu, 21 Jan 1999 16:36:46 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id QAA26036 for ; Thu, 21 Jan 1999 16:36:15 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id QAA03711 for ; Thu, 21 Jan 1999 16:42:15 +0900 (JST) Received: from inet-tsb.toshiba.co.jp (inet-tsb.toshiba.co.jp [202.33.96.40]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id QAA29442 for ; Thu, 21 Jan 1999 16:42:09 +0900 (JST) Received: from tis2.tis.toshiba.co.jp by inet-tsb.toshiba.co.jp (8.8.8/3.3W9-04/12/95) id QAA20962; Thu, 21 Jan 1999 16:42:08 +0900 (JST) Received: from mx.toshiba.co.jp by tis2.tis.toshiba.co.jp (8.8.4+2.7Wbeta4/3.3W9-95082317) id QAA14664; Thu, 21 Jan 1999 16:42:08 +0900 (JST) Received: by toshiba.co.jp (8.7.1+2.6Wbeta4/3.3W9-TOSHIBA-GLOBAL SERVER) id QAA05999; Thu, 21 Jan 1999 16:42:07 +0900 (JST) Message-Id: <199901210742.QAA05999@toshiba.co.jp> To: irex@karc.crl.go.jp cc: sekine@cs.nyu.edu In-reply-to: Your message of "Wed, 20 Jan 1999 13:36:38 EST." <199901201836.NAA14178@noreen.cs.nyu.edu> Date: Thu, 21 Jan 1999 16:42:03 +0900 From: "Tetsuya SAKAI" Reply-To: irex@karc.crl.go.jp X-Sequence: irex 131 Subject: [irex 131] Re: Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3498 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f To: irex@karc.crl.go.jp cc: sekine@cs.nyu.edu In-reply-to: Your message of "Wed, 20 Jan 1999 13:36:38 EST." <199901201836.NAA14178@noreen.cs.nyu.edu> Date: Thu, 21 Jan 1999 16:42:03 +0900 From: "Tetsuya SAKAI" Reply-To: irex@karc.crl.go.jp X-Sequence: irex 131 Subject: [irex 131] Re: Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3498 東芝の酒井と申します。 今回のIPA応募についてはどちらかというと消極派です。 現在NTCIRとIREXが並行して開催されていますが、 両者の足並みが揃っていない/住み分けが明確になっていない、 と感じ始めています。 我々は現在NTCIRとIREXの両方に参加していますが、 実際やってみると両者が時期的にオーバーラップしているのは 結構しんどいし、両者のポリシーは似て非なるものであるとも感じています。 この辺りの議論なしに応募するのはちょっと心配です。 まずはIREX/NTCIRの合同ワークショップでこの辺りの 意識合わせをしたほうがよいのではないでしょうか。 >> IPAの公募(2月5日締切)がありましたが、それに関連して >> 皆様からIREXの将来についての意見を伺いたく思います。 >> これまでにも、何人もの方からIREXを続けていく事の意義や希望を >> 伺っていますが、皆様はどう思われますか? >> また、今回のIPAに応募すべきかどうか。応募するのならどのような >> 形態ですべきかという事について意見を伺いたく思います。 >> 現在の所、IPAへ応募するかどうかに関しては以下のような賛成意見と >> 消極意見があります。また、やる場合の運営方法の私の私案も載せます。 >> 賛成意見: >> * IREXを続けていく事は重要であるし、その為の資金獲得の機会が >> あれば、積極的に行なうべきだ。IPAのプロジェクト規模はIREXに >> 適しているし、目的もデータの構築や、それに関するパブリックなツールの >> 作成とすれば、IPAの内容にも合致する。IPAが公的資金である事も >> IREXの精神にとって良い。 >> * IPAは倍率が高く、出したからって当るものではない。時期を考えるのは >> 後まわしにしてでも機会があれば、とりあえず出すべきだ(消極意見への反論) >> 消極意見: >> * IREX1が終了していない段階で先走るのは良くない。この結果を待ち >> 課題や今後の展開を熟考した上で先に進むべきだ。 >> * 参加者がどのくらいになるか分らないのに、規模を大きくしてやる事は >> 大丈夫なのか? >> 運営私案: >> これまでの経過も考え、NYU,通総研、計量計画研究所の3者が提案の中心に >> なり、大学、公的研究機関なども提案者として参加していただきたく思います。 >> 企業にも提案者に加わってもらった方がいいかどうかは各企業での手続きの >> 繁雑さや、コンテストの公平感などの要因から、私は何とも言えません。 >> 課題は、情報検索、情報抽出だけに限らず、要約、照応、その他のNLの >> 技術なども含めて7、8課題としたいと思います。すべての課題を今のように >> 私が担当するのは不可能ですから、それぞれの課題毎に担当者(グループ)を >> 決めて、それぞれやっていくという形にし、データ作成の予算をプロジェクト費 >> から分配します。 >> どのような些細な点でも構いませんので、是非御意見を下さい。 >> (ML宛でも、私個人宛でも構いません。) >> どうぞよろしくお願いいたします。 >> また、SONY/CSL,ATRの飯田さん(現在、言語処理学会会長)にもIREXの顧問に >> なっていただく事をお願いした所、快諾を得ました。 >> これで、歴代の言語処理学会の会長に顧問になっていただいた事になります。 >> 関根 ◆◇ 酒井 哲也 tetsuya.sakai@toshiba.co.jp ◇◆ ◇◆ (株)東芝 研究開発センター 情報・通信システム研究所 ◆◇ ◆◇ ヒューマン・インタフェース技術センター TEL:044-549-2240 ◇◆ ◇◆ http://club.pep.ne.jp/~sakai3 FAX:044-520-1308 ◆◇  1,, Summary-line: 21-Jan to: irex@karc.crl.go.jp #[irex 132] Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id GAA22330 for ; Thu, 21 Jan 1999 06:47:17 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id GAA18932 for ; Thu, 21 Jan 1999 06:48:55 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id UAA14441; Thu, 21 Jan 1999 20:43:36 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id UAA15159; Thu, 21 Jan 1999 20:43:35 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id UAA23599; Thu, 21 Jan 1999 20:38:03 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id UAA23593 for ; Thu, 21 Jan 1999 20:38:02 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id UAA26138 for ; Thu, 21 Jan 1999 20:37:30 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id UAA15149 for ; Thu, 21 Jan 1999 20:43:31 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id UAA03305 for ; Thu, 21 Jan 1999 20:43:29 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id GAA14576; Thu, 21 Jan 1999 06:43:28 -0500 (EST) Date: Thu, 21 Jan 1999 06:43:28 -0500 (EST) From: Satoshi Sekine Message-Id: <199901211143.GAA14576@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 132 Subject: [irex 132] Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2698 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Thu, 21 Jan 1999 06:43:28 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 132 Subject: [irex 132] Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2698 IREXメイリングリストの皆様: 将来のIREXに関して個人的にもメイルをいただいていますが、 重要な情報をひとつ落しておりました。IPAに関する情報は http://www.ipa.go.jp/index-j.html にあります。相当する募集は「創独創的先進的情報技術に係わる 研究開発テーマ」というもので年間5000万までで3年間のプロジェクトを 申請できます。 ------- Forwarded Message    独創的先進的情報技術に係わる研究開発テーマ公募のお知らせ 情報処理振興事業協会(IPA)では、我が国のソフトウェア技術全般の水準向上 に寄与することを目的として独創的先進的情報技術に係わる研究開発を実施し ております。平成11年度新規研究開発テーマを大学、研究機関、民間企業等か ら、下記のとおり広く公募いたします。 1.本研究開発の対象となるテーマの性格  基礎的な理論や技術に基づく、ソフトウェア産業や将来のソフトウェア技術  の発展にとって有用な独創的、先進的、基盤的ソフトウェア技術であること、  成果物に含まれるソフトウェアは、第三者が自由に利用できる形式で公開可  能であることなどです。 2.研究開発実施方式 次の(1)もしくは(2)のいずれかとします。  (1)請負契約方式   請負契約締結に基づき申請者側で研究開発を実施する方式です。研究期間   は原則として3年以内、研究予算は1テーマ年間5千万円以内とします。  (2)研究員招聘方式   IPA内に研究環境を整え、主たる研究員をIPAへの出向研究員として登録す   る形で実施する方式です。研究期間は3年程度、研究予算は1テーマ年間   3千万円以内(招聘研究員の人件費は別途)とします。 3.申請書等受付期間 1月6日(水)から2月5日(金)17時まで。 4.公募要領、申請書様式等入手方法  (1)事業説明会を1月12日 東京、1月13日 大阪で開催します。参加者には   会場にて配布します。詳細は下記ホームページを参照のこと。  (2)下記ホームページから直接入手することも可能です。  (3)企業・団体名、所属・役職、氏名(ふりがな)、郵便番号、住所、電話   番号、FAX番号、E-Mailアドレスを明記し、下記問い合せ先まで E-Mail   もしくは FAX でご請求ください。後日郵送します。 5.公募のホームページ http://www.ipa.go.jp/STC/DOKUSOU/99koubo.html 6.問い合わせ先 情報処理振興事業協会(IPA)技術センター 企画室  TEL: 03-5978-7507  FAX: 03-5978-7517  E-Mail: kikaku@ipa.go.jp  <IPAは法律に基づく通商産業省所管の特別認可法人です> -- IPA技術センター 福本 亨 Toru Fukumoto, fukumoto@ipa.go.jp 住所・連絡先等 http://www.ipa.go.jp/IPA/GAIYOU/HowToGet-j.html ------- End of Forwarded Message  1, filed,, Summary-line: 22-Jan take@cs.titech.ac.jp #[irex 133] Re: Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id SAA06474 for ; Thu, 21 Jan 1999 18:47:16 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id SAA01234 for ; Thu, 21 Jan 1999 18:48:54 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id IAA17800; Fri, 22 Jan 1999 08:43:47 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id IAA24821; Fri, 22 Jan 1999 08:43:46 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id IAA26411; Fri, 22 Jan 1999 08:38:14 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id IAA26406 for ; Fri, 22 Jan 1999 08:38:13 +0900 (JST) From: take@cs.titech.ac.jp Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id IAA26298 for ; Fri, 22 Jan 1999 08:37:41 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id IAA24812 for ; Fri, 22 Jan 1999 08:43:42 +0900 (JST) Received: from snow.cs.titech.ac.jp (snow.cs.titech.ac.jp [131.112.20.10]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id IAA08797 for ; Fri, 22 Jan 1999 08:43:41 +0900 (JST) Received: by snow.cs.titech.ac.jp (8.8.5/3.5W-titmx-3.0gs); Fri, 22 Jan 1999 08:43:33 +0900 (JST) Message-Id: <199901212343.IAA29511@snow.cs.titech.ac.jp> To: irex@karc.crl.go.jp In-reply-to: Your message of "Wed, 20 Jan 1999 13:36:38 EST." <199901201836.NAA14178@noreen.cs.nyu.edu> Date: Fri, 22 Jan 1999 08:43:33 +0900 Reply-To: take@cs.titech.ac.jp X-Sequence: irex 133 Subject: [irex 133] Re: Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 284 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f From: take@cs.titech.ac.jp To: irex@karc.crl.go.jp In-reply-to: Your message of "Wed, 20 Jan 1999 13:36:38 EST." <199901201836.NAA14178@noreen.cs.nyu.edu> Date: Fri, 22 Jan 1999 08:43:33 +0900 Reply-To: take@cs.titech.ac.jp X-Sequence: irex 133 Subject: [irex 133] Re: Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 284 > IPAの公募(2月5日締切)がありましたが、それに関連して > 皆様からIREXの将来についての意見を伺いたく思います。 これは確か請負制だと記憶しておりますが,納品するまでにかかる経費を誰か が立て替えないといけないのではないでしょうか? -take  1, forwarded,, Summary-line: 22-Jan hasida@etl.go.jp #[irex 134] Re: Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id TAA07235 for ; Thu, 21 Jan 1999 19:17:31 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id TAA04300 for ; Thu, 21 Jan 1999 19:19:09 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id JAA18010; Fri, 22 Jan 1999 09:13:27 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id JAA25438; Fri, 22 Jan 1999 09:13:26 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id JAA26585; Fri, 22 Jan 1999 09:07:54 +0900 (JST) Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id JAA26580 for ; Fri, 22 Jan 1999 09:07:53 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id JAA26304 for ; Fri, 22 Jan 1999 09:07:21 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id JAA25433 for ; Fri, 22 Jan 1999 09:13:22 +0900 (JST) Received: from mail1-im.etl.go.jp (mail1-wide.etl.go.jp [192.31.197.9]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id JAA09106 for ; Fri, 22 Jan 1999 09:13:21 +0900 (JST) Received: from etlcom.etl.go.jp (etlcom.etl.go.jp [192.31.200.10]) by mail1-im.etl.go.jp (8.9.1a/3.7W-98082521) with ESMTP id JAA17915 for ; Fri, 22 Jan 1999 09:13:20 +0900 (JST) Received: from localhost (localhost [127.0.0.1]) by etlcom.etl.go.jp (8.9.2/3.5Wpl4-ETL_SLAVE) with SMTP id JAA22636 for irex@karc.crl.go.jp; Fri, 22 Jan 1999 09:13:19 +0900 (JST) Message-Id: <199901220013.JAA22636@etlcom.etl.go.jp> X-Authentication-Warning: etlcom.etl.go.jp: localhost [127.0.0.1] didn't use HELO protocol From: HASIDA Koiti To: irex@karc.crl.go.jp In-reply-to: Your message of "Fri, 22 Jan 1999 08:43:33 JST" References: <199901212343.IAA29511@snow.cs.titech.ac.jp> Date: Fri, 22 Jan 1999 09:13:18 +0900 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 134 Subject: [irex 134] Re: Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 441 *** EOOH *** X-Authentication-Warning: etlcom.etl.go.jp: localhost [127.0.0.1] didn't use HELO protocol From: HASIDA Koiti To: irex@karc.crl.go.jp In-reply-to: Your message of "Fri, 22 Jan 1999 08:43:33 JST" References: <199901212343.IAA29511@snow.cs.titech.ac.jp> Date: Fri, 22 Jan 1999 09:13:18 +0900 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 134 Subject: [irex 134] Re: Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 441 徳永さん: >これは確か請負制だと記憶しておりますが,納品するまでにかかる経費を誰か >が立て替えないといけないのではないでしょうか? そうです。また、契約関係書類や報告書の作成などかなり大変で、何ケ月かそ れにほとんどかかり切りになれる人が必要です。というわけで、協同研究にし ても、いずれかの会社のだれかが主体的にコミットする必要があります。最大 の問題はそれが誰かということだと思います。 橋田  1, answered, filed,, Summary-line: 22-Jan yogawa@charlie.src.ricoh. #[irex 135] Re: Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id EAA16709 for ; Fri, 22 Jan 1999 04:18:18 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id EAA09497 for ; Fri, 22 Jan 1999 04:19:55 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id SAA23183; Fri, 22 Jan 1999 18:13:29 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id SAA14357; Fri, 22 Jan 1999 18:13:28 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id SAA04450; Fri, 22 Jan 1999 18:07:56 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id SAA04444 for ; Fri, 22 Jan 1999 18:07:55 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id SAA26601 for ; Fri, 22 Jan 1999 18:07:23 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id SAA14352 for ; Fri, 22 Jan 1999 18:13:24 +0900 (JST) Received: from ricohigw.ricoh.co.jp (ricohigw.ricoh.co.jp [202.32.12.1]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id SAA19317 for ; Fri, 22 Jan 1999 18:13:23 +0900 (JST) Received: from charlie.src.ricoh.co.jp (charlie.src.ricoh.co.jp [133.139.213.4]) by ricohigw.ricoh.co.jp (8.8.8+2.7Wbeta7/3.6Wbeta7) with ESMTP id SAA17522; Fri, 22 Jan 1999 18:13:13 +0900 (JST) Received: from charlie (localhost [127.0.0.1]) by charlie.src.ricoh.co.jp (8.9.1+3.0W/3.7W) with SMTP id SAA17274; Fri, 22 Jan 1999 18:13:11 +0900 (JST) Message-Id: <199901220913.SAA17274@charlie.src.ricoh.co.jp> To: irex@karc.crl.go.jp, sekine@cs.nyu.edu In-Reply-To: Your message of "Wed, 20 Jan 1999 13:36:38 -0500 (EST)" References: <199901201836.NAA14178@noreen.cs.nyu.edu> X-Mailer: Mew version 1.06 on Emacs 19.28.2, Mule 2.2 Mime-Version: 1.0 Date: Fri, 22 Jan 1999 18:13:11 +0900 From: OGAWA Yasushi Reply-To: irex@karc.crl.go.jp X-Sequence: irex 135 Subject: [irex 135] Re: Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 3231 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f To: irex@karc.crl.go.jp, sekine@cs.nyu.edu In-Reply-To: Your message of "Wed, 20 Jan 1999 13:36:38 -0500 (EST)" References: <199901201836.NAA14178@noreen.cs.nyu.edu> X-Mailer: Mew version 1.06 on Emacs 19.28.2, Mule 2.2 Mime-Version: 1.0 Date: Fri, 22 Jan 1999 18:13:11 +0900 From: OGAWA Yasushi Reply-To: irex@karc.crl.go.jp X-Sequence: irex 135 Subject: [irex 135] Re: Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 3231 小川@リコーです。 IREX は是非続けて頂きたいと思います。その上で、 参加者ではなく、実行委員として dry run の正解判定のお手伝いなどを させて頂いた経験を含めて、以下のように考えます。 ・現状、予算が少なく、実行委員が正解判定を手伝わなければならなかったが、 はっきりいってしんどい。やはり、十分な予算を確保して委員が正解判定を やらなくても済むような体制にして欲しい。 ・IR タスクでは新聞記事を対象として使用している。規模の点でも不十分と 思うが、それ以上に単一ソースを対象としている点で、検索システムの評価 が十分に行なえない。是非、対象(の種類)を拡大したい。 結局、先立つものが必要なので、幹事を引き受けて下さる機関があるの であれば、とにかく IPA に応募してみればよいのではないでしょうか? (NTCIR との調整などは、後からでもできるのではないでしょうか?) > これまでにも、何人もの方からIREXを続けていく事の意義や希望を > 伺っていますが、皆様はどう思われますか? > > また、今回のIPAに応募すべきかどうか。応募するのならどのような > 形態ですべきかという事について意見を伺いたく思います。 > 現在の所、IPAへ応募するかどうかに関しては以下のような賛成意見と > 消極意見があります。また、やる場合の運営方法の私の私案も載せます。 > > > 賛成意見: > * IREXを続けていく事は重要であるし、その為の資金獲得の機会が > あれば、積極的に行なうべきだ。IPAのプロジェクト規模はIREXに > 適しているし、目的もデータの構築や、それに関するパブリックなツールの > 作成とすれば、IPAの内容にも合致する。IPAが公的資金である事も > IREXの精神にとって良い。 > > * IPAは倍率が高く、出したからって当るものではない。時期を考えるのは > 後まわしにしてでも機会があれば、とりあえず出すべきだ(消極意見への反論) > > > 消極意見: > * IREX1が終了していない段階で先走るのは良くない。この結果を待ち > 課題や今後の展開を熟考した上で先に進むべきだ。 > > * 参加者がどのくらいになるか分らないのに、規模を大きくしてやる事は > 大丈夫なのか? > > > 運営私案: > これまでの経過も考え、NYU,通総研、計量計画研究所の3者が提案の中心に > なり、大学、公的研究機関なども提案者として参加していただきたく思います。 > 企業にも提案者に加わってもらった方がいいかどうかは各企業での手続きの > 繁雑さや、コンテストの公平感などの要因から、私は何とも言えません。 > 課題は、情報検索、情報抽出だけに限らず、要約、照応、その他のNLの > 技術なども含めて7、8課題としたいと思います。すべての課題を今のように > 私が担当するのは不可能ですから、それぞれの課題毎に担当者(グループ)を > 決めて、それぞれやっていくという形にし、データ作成の予算をプロジェクト費 > から分配します。 > > どのような些細な点でも構いませんので、是非御意見を下さい。 > (ML宛でも、私個人宛でも構いません。) > > どうぞよろしくお願いいたします。 > > > また、SONY/CSL,ATRの飯田さん(現在、言語処理学会会長)にもIREXの顧問に > なっていただく事をお願いした所、快諾を得ました。 > これで、歴代の言語処理学会の会長に顧問になっていただいた事になります。 > > > 関根  1, forwarded,, Summary-line: 22-Jan to: irex@karc.crl.go.jp #[irex 136] Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id KAA21975 for ; Fri, 22 Jan 1999 10:05:15 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id KAA12102 for ; Fri, 22 Jan 1999 10:06:53 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id AAA25392; Sat, 23 Jan 1999 00:00:54 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id AAA21031; Sat, 23 Jan 1999 00:00:53 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id XAA06768; Fri, 22 Jan 1999 23:55:21 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id XAA06763 for ; Fri, 22 Jan 1999 23:55:20 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id XAA26716 for ; Fri, 22 Jan 1999 23:54:48 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id AAA21021 for ; Sat, 23 Jan 1999 00:00:49 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id AAA22944 for ; Sat, 23 Jan 1999 00:00:43 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id KAA15172; Fri, 22 Jan 1999 10:00:41 -0500 (EST) Date: Fri, 22 Jan 1999 10:00:41 -0500 (EST) From: Satoshi Sekine Message-Id: <199901221500.KAA15172@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: OGAWA Yasushi's message of Fri, 22 Jan 1999 18:13:11 +0900 <199901220913.SAA17274@charlie.src.ricoh.co.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 136 Subject: [irex 136] Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 4815 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Fri, 22 Jan 1999 10:00:41 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: OGAWA Yasushi's message of Fri, 22 Jan 1999 18:13:11 +0900 <199901220913.SAA17274@charlie.src.ricoh.co.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 136 Subject: [irex 136] Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 4815 将来のIREXに関してです。 現在の所、MLと個人的にいただいたメイル合せて、 賛成 3名 慎重 2名 (理由: NACSISとの関係、何をやるか準備をしてから) 参考意見 3名 の意見をいただいています。どうもありがとうございます。 IPAに以下の2点を問い合せました。(実際の返事のメイルは最後に付けます) 1.費用は後払いか? 基本的に年度末払い (年間分立て替える必要あり) 2.開始時期はいつか? 2000年3月に成果物を出せるように また、ちょっと調べましたが、どうやら第3次補正予算が、この分野に 大量に流れたようで、IPAだけではなく、TAO、科学技術庁他でも 同様の締切日での募集があります。つまり、締切が迫った状態での 募集でもある事もあり、提案したら通りやすいだろうという事も 考えられます。 (他の募集については、私のホームページ http://cs.nyu.edu/cs/projects/proteus/sekineのリンク集のNLPで、 Japanese Funding Agenciesを見てください。整理されていませんが) 実際、コンテストの公平感を保つため、提案者グループへの企業の参加は 遠慮したもらった方がいいかとも思っていたのですが、徳永さん、 橋田さん他の経験談によると、どうも窓口となる企業の方を求め、 積極的に参加していただいた方がいいと考えるようになりました。 その場合、提案者グリープにその企業以外の多くの企業名をいただく という事で公平感を維持できるのではと考えます。候補となりそうな方に 個々にメイルを差し上げようと思いますが、このメイルを読んで、 中心的な役割を担ってもいいと考える企業の方がいらっしゃいましたら、 私の方に至急メイルをいただければと思います。文脈上お分りかとも 思いますが、報告書の取り纏めで中心的に活動していただく事、 3-5000万程度のお金を立て替える事が可能である事などの条件があります。 NACSISとの関係ですが、IREX-MLにこの話を流す前に神門さん影浦さんに 意見を伺いました。影浦さんから御返事をいただきましたが、 NACSISのプロジェクトは学振のお金で運営されており、その制約が厳しく 他との共同というのを表には出せないとのお話をいただきました。 課題については、7、8課題と書きましたが、無理をせずに、情報検索、 情報抽出、要約、ドキュメントクラスタリングなど似ている分野でかつ 実際の応用に近く企業などが参加しやすい課題に絞った方がいいという 意見もあります。現実的に考えると、確かにそうであるかとも思います。 また、3年間のプロジェクトと考えると、99年には課題の設定、サンプル データ、ツールの作成。2000年に第2回、2001年に第3回目のコンテストを 行なうというストーリーにしたらいいかと思います。 私の意見をまとめますと、今回の公募は通りやすそうであるという事も 考えると応募した方が良いと思われますが、やはり、中心となってくれる 企業の存在が不可欠であると考えます。 関根 --------------- From: Toru Fukumoto Date: Fri, 22 Jan 1999 11:06:19 +0900 To: Satoshi Sekine Cc: isahara@crl.go.jp, kikaku@ipa-mail.mgt.ipa.go.jp Subject: Re: Question about IPA KOUBO In-Reply-To: <199901220133.UAA14864@noreen.cs.nyu.edu> MIME-Version: 1.0 X-Mailer: AL-Mail32 Version 1.01 Content-Type: text/plain; charset=iso-2022-jp Content-Length: 1581 関根様。IPAの福本です。 >1.請負制という事ですが、費用は納入後に支払われるのでしょうか? そのとおりです。 > その場合、中間成果物という形逐次時納入し、それに対する対価として > 費用を分割で支払っていただけるという事は可能でしょうか? > たとえば、年間3000万のプロジェクトだとした場合、年に3回中間成果物を > 納入し、その度に1000万づつ支払っていただくというような事は可能でしょうか? 前例がないので確約はできませんが、優良な研究計画であることが認められた 場合には双方で協議することは可能と思います。 ただ独創的事業では産官学一体となった研究体制を推奨しておりますので、 なるべく企業の取り込みをはかり、年度末まではその企業が資金を立て替える ということができれば一番良いと思います。 >2.今回の募集でのプロジェクトの実際の開始時期はいつになるのでしょうか? 第一四半期中に契約をまとめる予定であり、あとは研究者側で随時開始して もらいます。 > 1999年9月とか、2000年1月からプロジェクトを開始するという事は可能でしょうか? 正当な理由がある場合は可能と思います。 ただしその場合でもこちらで研究計画を承認するのはMAX 2002年3月までです。 また仮に2000年1月に開始の場合でも2000年3月にはある程度の納品物 は必要です。 すべては研究開発の性格や有効性次第であり、現状ではこれ以上の コメントは困難です。 -- IPA技術センター 福本 亨 Toru Fukumoto, fukumoto@ipa.go.jp 独創的情報技術研究開発テーマ公募中。詳細は下記HPにて。 http://www.ipa.go.jp/STC/DOKUSOU/99koubo.html  1, filed,, Summary-line: 24-Jan nakagawa@naklab.dnj.ynu.a #[irex 137] Re: Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id HAA05457 for ; Sun, 24 Jan 1999 07:24:15 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id HAA08533 for ; Sun, 24 Jan 1999 07:25:55 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id VAA03255; Sun, 24 Jan 1999 21:20:21 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id VAA11897; Sun, 24 Jan 1999 21:20:19 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id VAA12807; Sun, 24 Jan 1999 21:14:48 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id VAA12802 for ; Sun, 24 Jan 1999 21:14:47 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id VAA27158 for ; Sun, 24 Jan 1999 21:14:13 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id VAA11892 for ; Sun, 24 Jan 1999 21:20:15 +0900 (JST) Received: from ruri.naklab.dnj.ynu.ac.jp (ruri.naklab.dnj.ynu.ac.jp [133.34.17.34]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id VAA04909 for ; Sun, 24 Jan 1999 21:20:13 +0900 (JST) Received: from ruri (nakagawa@localhost) by ruri.naklab.dnj.ynu.ac.jp (8.9.1+3.1W/3.7W-Naklab-2.0-19981001) with ESMTP id VAA12764; Sun, 24 Jan 1999 21:20:09 +0900 (JST) Message-Id: <199901241220.VAA12764@ruri.naklab.dnj.ynu.ac.jp> To: irex@karc.crl.go.jp, sekine@cs.nyu.edu In-Reply-To: Your message of "Fri, 22 Jan 1999 10:00:41 -0500 (EST)" References: <199901221500.KAA15172@noreen.cs.nyu.edu> X-Mailer: Mew version 1.70 on Emacs 19.28.1 / Mule 2.3 Mime-Version: 1.0 Content-Transfer-Encoding: 7bit Date: Sun, 24 Jan 1999 21:20:08 +0900 From: Hiroshi Nakagawa Reply-To: irex@karc.crl.go.jp X-Sequence: irex 137 Subject: [irex 137] Re: Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 4614 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f To: irex@karc.crl.go.jp, sekine@cs.nyu.edu In-Reply-To: Your message of "Fri, 22 Jan 1999 10:00:41 -0500 (EST)" References: <199901221500.KAA15172@noreen.cs.nyu.edu> X-Mailer: Mew version 1.70 on Emacs 19.28.1 / Mule 2.3 Mime-Version: 1.0 Content-Transfer-Encoding: 7bit Date: Sun, 24 Jan 1999 21:20:08 +0900 From: Hiroshi Nakagawa Reply-To: irex@karc.crl.go.jp X-Sequence: irex 137 Subject: [irex 137] Re: Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 4614 On Fri, 22 Jan 1999 10:00:41 -0500 (EST), Satoshi Sekine said: sekine> 実際、コンテストの公平感を保つため、提案者グループへの企業の参加は sekine> 遠慮したもらった方がいいかとも思っていたのですが、徳永さん、 sekine> 橋田さん他の経験談によると、どうも窓口となる企業の方を求め、 sekine> 積極的に参加していただいた方がいいと考えるようになりました。 私の経験からもこれは必須です。発注仕様書作成もIPAの人と頻繁にやりとり して作文せねばならず、とても大学の人間の手にはおえません。また、納品書 なども大部なものが要求されるため、作業量は莫大です。結局、もらったお金 の大部分は(80ー90%)、こういった作業をしてくれる窓口企業の方の人 件費になってしまいます。借りに、1億なら実質手取りは1000万円でしょ う。さらに、20%の天引きもあり、なんちゅうこっちゃ、ということになり かねません。しかし、一方でお金による締め付けは研究を推進する圧力にもな りうるわけで。 IPA以外にも、下記のようなものがきていましたね。 中川 ーーーーーーーーーーーーーーーーーーーーーーー 平成11年 1月14日   計算科学技術活用型特定研究開発推進事業(短期集中型) 募 集 説 明 会 の ご 案 内   科学技術振興事業団 研究基盤情報部   拝啓 時下益々ご清栄のこととお慶び申し上げます。  科学技術振興事業団(JST)の事業に関しまして、日頃から格別のご高配を賜り厚 くお礼申し上げます。  最近では研究開発において高性能の計算機を積極的に利用する「計算科学技術」は 、従来の理論研究、あるいは実験研究では解決が困難であった研究課題に、新たな解 決の手段を提供する「第三の科学」と呼ばれ、物質・材料設計、生命科学、地球科学 等の各分野で成果を挙げつつあります。  このような中で、JSTでは平成10年度から公募型の研究開発推進事業を発足させま したが、この度、同事業の一環として短期集中型の事業を行うことになりました。  この事業は、研究者が既に有している技術シーズ活用により短期的に問題解決を目 指す研究開発、あるいは要素技術を解決する研究開発を行うことを目的としておりま す(ネットワークの利用は今回条件としておりません)。  この公募型の研究開発制度に、大学、企業、国公立試験研究機関等の研究者の方々 から是非ご応募いただきたく、募集のご案内を送付させていただきました。  また、この制度に関する、東京地区及び大阪地区での説明会を、以下の要領にて開 催することとなりましたので、ご案内申し上げます。  ご多忙とは存じますが、皆様には、ご来場賜りますよう宜しくお願い申し上げます 。                            敬具 記   1.東京地区(http://www-scc.jst.go.jp/cst/cst-s/tokyo.html の地図をご参照下さい)      日 時: 平成11年1月25日(月) 午前10時〜12時      会 場: 〒102-0081 東京都千代田区四番町5番地3           科学技術振興事業団 東京本部 B1ホール            TEL:03-5214-8422 2.大阪地区(http://www-scc.jst.go.jp/cst/cst-s/osaka.html の地図をご参照下さい)      日 時: 平成11年1月26日(火) 午後2時〜4時      会 場: 〒550-0044 大阪市西区靱本町1丁目8番4号           (財)大阪科学技術センター 401号室            TEL:06-6443-5324 3.参 加 料: 無料 4.申込方法: 当日直接会場にお越し下さい。 5.お問い合せ:〒102-0081 東京都千代田区四番町5番地3         科学技術振興事業団 研究基盤情報部 研究基盤情報課  計算科学技術担当          TEL:03-5214-8422    FAX:03-5214-8470          E-mail:cst2-staff@tokyo.jst.go.jp 6.詳しい情報: URL: http://www-scc.jst.go.jp/cst/cst-s/ ---------------------------------------------- 大貝 晴俊 科学技術振興事業団 科学技術情報事業本部 情報システム開発部 ネットワーク技術部門 102-0081 東京都千代田区四番町5番地3 ogai@tokyo.jst.go.jp Tel 03-5214-8429 Fax 03-5214-8450 ogai@ta2.so-net.ne.jp(自宅) ----------------------------------------------  1, filed,, Summary-line: 25-Jan waka@kokken.go.jp #[irex 138] Re: Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id XAA20707 for ; Sun, 24 Jan 1999 23:20:24 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id XAA18727 for ; Sun, 24 Jan 1999 23:22:06 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id NAA08192; Mon, 25 Jan 1999 13:16:07 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id NAA26049; Mon, 25 Jan 1999 13:16:06 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id NAA17935; Mon, 25 Jan 1999 13:10:35 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id NAA17930 for ; Mon, 25 Jan 1999 13:10:32 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id NAA27455 for ; Mon, 25 Jan 1999 13:09:59 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id NAA26040 for ; Mon, 25 Jan 1999 13:16:01 +0900 (JST) Received: from mailsvr.kokken.go.jp (mailsvr.kokken.go.jp [202.245.100.101]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with SMTP id NAA11990 for ; Mon, 25 Jan 1999 13:16:00 +0900 (JST) Received: from saisei.kokken.go.jp (saisei.kokken.go.jp [202.245.100.100]) by mailsvr.kokken.go.jp (8.6.12+2.5Wb4/3.3W9 mailsvr[95/08/02]) with ESMTP id NAA26286 for ; Mon, 25 Jan 1999 13:17:30 +0900 Received: by saisei.kokken.go.jp (8.6.12+2.5Wb4/3.3W9-glove) id NAA26973; Mon, 25 Jan 1999 13:17:28 +0900 Message-Id: <199901250417.NAA26973@saisei.kokken.go.jp> To: irex@karc.crl.go.jp In-reply-to: Your message of "Sun, 24 Jan 1999 21:20:08 JST. <199901241220.VAA12764@ruri.naklab.dnj.ynu.ac.jp> " Mime-Version: 1.0 Date: Mon, 25 Jan 1999 13:17:28 +0900 From: Wakako Kashino Reply-To: irex@karc.crl.go.jp X-Sequence: irex 138 Subject: [irex 138] Re: Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="iso-2022-jp" Content-Length: 2005 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f To: irex@karc.crl.go.jp In-reply-to: Your message of "Sun, 24 Jan 1999 21:20:08 JST. <199901241220.VAA12764@ruri.naklab.dnj.ynu.ac.jp> " Mime-Version: 1.0 Date: Mon, 25 Jan 1999 13:17:28 +0900 From: Wakako Kashino Reply-To: irex@karc.crl.go.jp X-Sequence: irex 138 Subject: [irex 138] Re: Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="iso-2022-jp" Content-Length: 2005 国立国語研究所の柏野(もと IPA 研究員)と申します。 井佐原さんなどもくわしいと思いますが、 今回、IPAが募集している「独創的〜」について若干誤解も生じている ようでしたので、コメントいたします。 橋田さん> そうです。また、契約関係書類や報告書の作成などかなり大変で、 橋田さん> 何ケ月かそれにほとんどかかり切りになれる人が必要です。 中川先生> 私の経験からもこれは必須です。発注仕様書作成もIPAの人と頻繁に 中川先生> やりとりして作文せねばならず、とても大学の人間の手にはおえません。 中川先生> また、納品書なども大部なものが要求されるため、作業量は莫大です。 中川先生> 結局、もらったお金の大部分は(80ー90%)、こういった作業を 中川先生> してくれる窓口企業の方の人件費になってしまいます。 中川先生> 借りに、1億なら実質手取りは1000万円でしょう。 中川先生> さらに、20%の天引きもあり、なんちゅうこっちゃ、 中川先生> ということになりかねません。 橋田さん、中川先生がおっしゃっておられるのは、 同じIPAでも、今回の募集のものとは違う、「創造的〜」という 方のお話しだと思います。 「創造的〜」の方は、IPAの技術応用事業部が窓口になって募集するもので、 予算が「億」の単位と非常に多いためか、契約書、発注書などに 莫大な作業が要求されてしまうことになっているものです。 今回、募集されている「独創的〜」というのは、IPAの技術センターが 窓口になっているもので、もともと、「先進的〜」という名前で IPAL などの プロジェクトを長年行ってきた流れのものです。 こちらは、私の知る限り、「創造的〜」のように契約書、発注書の作成が 大変、ということは起きていませので、そういった心配はいらないと 思われます。 なお、「独創的〜」の予算は、1テーマ年間3〜5千万円以内 (招聘研究員形式を選択した場合は、その人件費は別途)です。 ** 柏野和佳子(桑畑) waka@kokken.go.jp ** ** 国立国語研究所 言語体系研究部 第2研究室 **  1, answered,, Summary-line: 25-Jan kimoto@dq.isl.ntt.co.jp #[irex 139] irex document number Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id BAA23030 for ; Mon, 25 Jan 1999 01:38:48 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id BAA19901 for ; Mon, 25 Jan 1999 01:40:29 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id PAA09637; Mon, 25 Jan 1999 15:34:59 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id PAA00674; Mon, 25 Jan 1999 15:34:58 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id PAA20229; Mon, 25 Jan 1999 15:29:26 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id PAA20224 for ; Mon, 25 Jan 1999 15:29:25 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id PAA27641 for ; Mon, 25 Jan 1999 15:28:51 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id PAA00669 for ; Mon, 25 Jan 1999 15:34:53 +0900 (JST) Received: from tama3.tas.ntt.co.jp (tama3.tas.ntt.co.jp [192.68.248.40]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id PAA14263 for ; Mon, 25 Jan 1999 15:34:52 +0900 (JST) Received: from nttmail.ecl.ntt.co.jp (nttmail.tas.ntt.co.jp [192.68.248.11]) by tama3.tas.ntt.co.jp (8.8.8/3.6W/01/21/99) with ESMTP id PAA09448 for ; Mon, 25 Jan 1999 15:34:21 +0900 (JST) Received: from nttmm.dq.isl.ntt.co.jp by nttmail.ecl.ntt.co.jp (8.9.2/3.7W/01/21/99) with ESMTP id PAA04268 for ; Mon, 25 Jan 1999 15:34:15 +0900 (JST) Received: by nttmm.dq.isl.ntt.co.jp (8.7.6/isl-2.0/dq) id PAA14731; Mon, 25 Jan 1999 15:31:02 +0900 (JST) Date: Mon, 25 Jan 1999 15:31:02 +0900 (JST) From: kimoto@dq.isl.ntt.co.jp (Haruo Kimoto) Message-Id: <199901250631.PAA14731@nttmm.dq.isl.ntt.co.jp> To: irex@karc.crl.go.jp Reply-To: irex@karc.crl.go.jp X-Sequence: irex 139 Subject: [irex 139] irex document number Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 873 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Mon, 25 Jan 1999 15:31:02 +0900 (JST) From: kimoto@dq.isl.ntt.co.jp (Haruo Kimoto) To: irex@karc.crl.go.jp Reply-To: irex@karc.crl.go.jp X-Sequence: irex 139 Subject: [irex 139] irex document number Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 873 IREX 実行委員会様 NTT 木本 と申します。 私、日本語情報検索システムのテストコレクション BMIR-J1, J2 の構築に携わった者です。 BMIR-J1 のまとめとして、資料作成をしています。 この資料の中で、IREXを引用させていただこうと しています。 関根様が、1998年9月18日に、情報処理学会のNL研で 発表されました、「IREX:情報検索、情報抽出コンテスト」 を引用させていただこうと考えています。 上記資料では、IREX での、検索対象文書量は、 「毎日新聞の94,95年版CD-ROMに含まれる新聞記事」 と書かれています。 では、具体的に、何記事になるのか教えて頂ければ 幸です。 論文資料への引用をしようとしていますので、 「約」といった表現は、ふさわしくないので、 できるだけ正確な数値を教えて頂ければ幸です。 宜しくお願いします。  1, filed,, Summary-line: 25-Jan to: irex@karc.crl.go.jp #[irex 140] Workshop, Future IREX, Number of doc. etc. Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id LAA02601 for ; Mon, 25 Jan 1999 11:13:12 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id LAA24874 for ; Mon, 25 Jan 1999 11:14:53 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id BAA13643; Tue, 26 Jan 1999 01:09:35 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id BAA14466; Tue, 26 Jan 1999 01:09:34 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id BAA24751; Tue, 26 Jan 1999 01:04:02 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id BAA24746 for ; Tue, 26 Jan 1999 01:04:02 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id BAA27912 for ; Tue, 26 Jan 1999 01:03:27 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id BAA14461 for ; Tue, 26 Jan 1999 01:09:30 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id BAA22135 for ; Tue, 26 Jan 1999 01:09:28 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id LAA16628; Mon, 25 Jan 1999 11:09:25 -0500 (EST) Date: Mon, 25 Jan 1999 11:09:25 -0500 (EST) From: Satoshi Sekine Message-Id: <199901251609.LAA16628@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 140 Subject: [irex 140] Workshop, Future IREX, Number of doc. etc. Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3256 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Mon, 25 Jan 1999 11:09:25 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 140 Subject: [irex 140] Workshop, Future IREX, Number of doc. etc. Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3256 Dear IREX-ML member: 1. Workshop proposal (schedule) The workshop is planned to be held together with NACSIS. The current plan is the following. If it is inconvinient for you, please let me know. We are planning to use "Mielparque Tokyo" (http://www.mielparque.or.jp/tky/tky01.html). August 30, 31: NACSIS workshop September 1: NACSIS & IREX combined Invited talk(s), Brief reports of both projects, Panel Discussion etc. (still under planning) September 2: IREX workshop (IR) September 3: IREX workshop (NE) Each day of IREX workshop consists of overview, discussion and 15-20 minute reports of all participants. 2. Future IREX Unfortunately, we have not found a company which can act as the major player in the proposal. 3. Answer to the question from Mr.Kimoto The number of target documents in IR is 211,853. 4. A new IREX committee member Dr. Teigo Nakamura from Kyusyu Institute of Technology He has been a member of an IE project lead by Prof.Nomura for years. 5. Question from NE training data creator Thank you for people answered to the questions. ------------ IREXメイリングリストの皆様: 1.ワークショップの日程の提案です。 以下のように、NACSISと合同でワークショップを開催したいと思います。 開催場所はメルパルク東京(http://www.mielparque.or.jp/tky/tky01.html) を予定しています。日程その他で問題がある方はお知らせください。 8月30日: NACSISワークショップ 8月31日: NACSISワークショップ 9月1日: NACSIS & IREX合同ワークショップ (招待講演、両プロジェクトの報告、パネルディスカッション等) 9月2日: IREXワークショップ (IR) 9月3日: IREXワークショップ (NE) IREXワークショップは両日共、全体の報告とディスカッション、それに 各参加者から15-20分程度の報告となる予定です。 2. Future IREX 残念ながら、現在の所、幹事として積極的に参加したいという企業は 見付かっていません。(2週間で数千万の決裁をお願いするのは無理 だと思いますし、実際、一企業が中心となる性格の物ではないので、 なかなか難しいとは思っています。が、) まだ、時間はありますので、 希望する企業の方がいらっしゃいましたら、メイルをお願いします。 3. 木本さんからの質問にお答えします。 (資料中でのIREXへの言及ありがとうございます) IRの検索対象記事数は以下の通りです。 94年8月23日、24日の記事番号にはバグがあり削除したものです。 (検索結果に含まれていても、評価対象になっていません。) 毎日新聞94年 + 101058 毎日新聞95年 + 111497 95年8月23日の記事 - 366 95年8月24日の記事 - 336 合計 211853 4. 新しく九工大の中村貞吾先生にIREX委員になっていただきました。 中村先生は野村先生と共に、情報抽出の研究に携わっておられ IREXの将来を考え参加をお願いした所、委員になっていただく事に 快諾をいただきました。 5. 固有名の質問 固有名の質問に多くの方からお答えをいただきました。 どうもありがとうございました。  1,, Summary-line: 26-Jan yasukawa@trl.mei.co.jp #[irex 141] RE: Question Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id XAA19454 for ; Mon, 25 Jan 1999 23:49:11 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id XAA13410 for ; Mon, 25 Jan 1999 23:50:53 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id NAA18402; Tue, 26 Jan 1999 13:44:44 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id NAA29234; Tue, 26 Jan 1999 13:44:43 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id NAA00645; Tue, 26 Jan 1999 13:39:11 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id NAA00638 for ; Tue, 26 Jan 1999 13:39:05 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id NAA28178 for ; Tue, 26 Jan 1999 13:38:31 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id NAA29229 for ; Tue, 26 Jan 1999 13:44:33 +0900 (JST) Received: from bulls.mei.co.jp (bulls.mei.co.jp [202.224.189.102]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id NAA29890 for ; Tue, 26 Jan 1999 13:44:28 +0900 (JST) Received: by bulls.mei.co.jp (8.9.1/3.7W) with ESMTP id NAA22832 for ; Tue, 26 Jan 1999 13:43:57 +0900 (JST) Received: by dodgers.mei.co.jp (8.9.1/3.7W) with ESMTP id NAA27410 for ; Tue, 26 Jan 1999 13:43:56 +0900 (JST) Received: from tck01-ms.trl.mei.co.jp (BADBAD.trl.mei.co.jp [133.185.148.169]) by harold.trl.mei.co.jp (post.office MTA v2.0 0813 ID# 111-30962U510) with ESMTP id AAA258 for ; Tue, 26 Jan 1999 13:44:34 +0900 Received: from gordon (nte22103 [133.185.148.237]) by tck01-ms.trl.mei.co.jp (8.7.5+2.6Wbeta6/sendmail.cf:TOBy-hosts:971204) with SMTP id NAA00516; Tue, 26 Jan 1999 13:41:50 +0900 (JST) Message-ID: <014401be48e6$1bde8b40$ed94b985@gordon.trl.mei.co.jp> From: "Hideki YASUKAWA" To: Cc: "NOGUCHI Naohiko" Date: Tue, 26 Jan 1999 13:41:15 +0900 MIME-Version: 1.0 Content-Transfer-Encoding: 7bit X-Priority: 3 X-MSMail-Priority: Normal X-Mailer: Microsoft Outlook Express 4.72.3110.5 X-MimeOLE: Produced By Microsoft MimeOLE V4.72.3110.3 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 141 Subject: [irex 141] RE: Question Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="iso-2022-jp" Content-Length: 2716 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f From: "Hideki YASUKAWA" To: Cc: "NOGUCHI Naohiko" Date: Tue, 26 Jan 1999 13:41:15 +0900 MIME-Version: 1.0 Content-Transfer-Encoding: 7bit X-Priority: 3 X-MSMail-Priority: Normal X-Mailer: Microsoft Outlook Express 4.72.3110.5 X-MimeOLE: Produced By Microsoft MimeOLE V4.72.3110.3 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 141 Subject: [irex 141] RE: Question Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="iso-2022-jp" Content-Length: 2716 関根さん、 まず、IPA公募の件ですが、野口さんからも回答があったように、 現状では、社内を説得することが極めてむずかしいと思います。 特に、IREXの延長線上ということになるのであれば、 松下にとってのメリットを追求されてしまうと思います。 可能な協力はさせていただきたいと思っていますが、 現状では、松下が公募の主体者になるのは極めて困難と思います。 今後も、ご相談させていただきたいと思いますが、 現状は、このような状況ですので、その点、考慮して いただければと思います。 ここから後は、おまけです。 >単語:「コスタボダ」 > > 一七四二年に創立されたコスタは、スウェーデン最古の工場。三百人を超 >える従業員が「コスタボダ」製品を作っている。この工房からはこれまでに >多くの工芸家が育ち、ざん新な作品を発表している。 ガラス製品を中心とした、一連の製品のブランド名です。 我が家にも、2点ほど、コスタボダの製品(花瓶など)が あります。 >単語:「ワーヤード」 > >(最初にある「彼」とはナラダ・マイケル・ウォルデンという人) > 彼の仕事はプロデューサーである。ケニーG、ホイットニー、シーナ・イ >ーストンなど80年代以降、手掛けた作品のほとんどがプラチナ・アルバム >となっている。 > 元々は、ドラマー。フュージョン時代の『マハビシュヌ・オーケストラ』 >を経て、ジェフ・ベックと「ワーヤード」も作った。体力派である。 おそらくは、「ワイヤード(Wired)」の間違いではないかと思います。 Wiredは、その昔ヒットした、ジェフ・ベックのレコードのアルバム名です。 >単語:「カモカ」 > > 「ヤツは何のために働くかというと夕食と晩しゃくのためだそうである。 >私も全くその通りだと思う」。田辺聖子さんの言葉だ。ヤツとはカモカのお >っちゃん。よわい五十に近づいて、私にもこの心境が、しみじみわかるよう >になった。 田辺聖子の知り合いのおじさんで、「カモカのおっちゃん」というのが、 特定の個人(そのおじさん)を指す表現です。 「カモカ」だけでは、意味をなさないと思います。 ちなみに、なぜ、「カモカのおっちゃん」なのかは失念しました。 そのおじさんの口癖なのかもしれません。 >単語:「恭順派」の「恭順」 > > 創業者の大橋佐平は五十歳で、新潟の長岡から上京、博文館を起こした。 >「祖父、乙羽が佐平の長女と結婚、養子に。日記を出した明治二十八年には >支配人でした」。佐平は海外事情にも明るく、戊辰戦争では恭順派。窮状を >みかねた支藩からの救援米を、ひもじさを我慢し、長岡再興のため学校をた >てる資本にしたという、山本有三の戯曲「米百俵」。 本来の意味は、「うやうやしく従う」といったものですよね。 この場合は、明治政府に「恭順」したということでしょう。 こういう回答を期待されていたかどうかは分かりませんが、固有名として 扱う必要はないでしょう。  1,, Summary-line: 27-Jan isahara@crl.go.jp #[irex 142] NE data Kyoyu Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id VAA13243 for ; Tue, 26 Jan 1999 21:24:06 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id VAA05578 for ; Tue, 26 Jan 1999 21:25:50 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id LAA27772; Wed, 27 Jan 1999 11:20:34 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id LAA27541; Wed, 27 Jan 1999 11:20:33 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id LAA10349; Wed, 27 Jan 1999 11:15:01 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id LAA10344 for ; Wed, 27 Jan 1999 11:14:58 +0900 (JST) Received: from ipsgw.crl.go.jp (ipsgw [133.243.25.239]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id LAA28767 for ; Wed, 27 Jan 1999 11:14:22 +0900 (JST) Received: from ripeness.crl.go.jp (ripeness [133.243.71.201]) by ipsgw.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with SMTP id LAA16526 for ; Wed, 27 Jan 1999 11:06:19 +0900 (JST) Received: from localhost by ripeness.crl.go.jp (4.1/6.4J.6-karc/s) id AA00218; Wed, 27 Jan 99 11:19:00 JST Message-Id: <9901270219.AA00218@ripeness.crl.go.jp> To: irex@karc.crl.go.jp Date: Wed, 27 Jan 1999 11:19:00 +0900 From: Isahara Hitoshi Reply-To: irex@karc.crl.go.jp X-Sequence: irex 142 Subject: [irex 142] NE data Kyoyu Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 861 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f To: irex@karc.crl.go.jp Date: Wed, 27 Jan 1999 11:19:00 +0900 From: Isahara Hitoshi Reply-To: irex@karc.crl.go.jp X-Sequence: irex 142 Subject: [irex 142] NE data Kyoyu Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 861 通信総研の井佐原です。 そろそろ、学習用の大規模正解データが必要になってくる時期かと思います。 通信総研作成のデータは2月中には公開の予定です。 11月末にNEについての正解データを共有できないかという提案をしました。 その時にNTTコミュニケーション科学研究所の佐々木さんから、コンソーシア ム方式は採れないかという提案がありました。 佐々木さんへ>> せっかく提案して頂きながら、そのままにしてしまい、申し訳ありませんでした。 その後、コンソーシアム方式ならば、自グループで作成したデータが出せるとい うグループは出てこないようですが、いかがでしょうか? 一般公開をする通信総研と、コンソーシアムならばというNTTしか、データを 公開しないとなるとわざわざコンソーシアム方式を採るまでもないかと考えてお ります。 何かご意見がおありの方はお聞かせ下さい。 井佐原@通信総研  1, filed,, Summary-line: 28-Jan kimoto@dq.isl.ntt.co.jp #[irex 143] irex IR Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id AAA10363 for ; Thu, 28 Jan 1999 00:44:58 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id AAA02257 for ; Thu, 28 Jan 1999 00:46:43 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id OAA11747; Thu, 28 Jan 1999 14:39:51 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id OAA08391; Thu, 28 Jan 1999 14:39:50 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id OAA23543; Thu, 28 Jan 1999 14:34:20 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id OAA23538 for ; Thu, 28 Jan 1999 14:34:18 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id OAA29441 for ; Thu, 28 Jan 1999 14:33:42 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id OAA08377 for ; Thu, 28 Jan 1999 14:39:46 +0900 (JST) Received: from tama3.tas.ntt.co.jp (tama3.tas.ntt.co.jp [192.68.248.40]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id OAA05483 for ; Thu, 28 Jan 1999 14:39:43 +0900 (JST) Received: from nttmail.ecl.ntt.co.jp (nttmail.tas.ntt.co.jp [192.68.248.11]) by tama3.tas.ntt.co.jp (8.8.8/3.6W/01/21/99) with ESMTP id OAA08061 for ; Thu, 28 Jan 1999 14:39:43 +0900 (JST) Received: from nttmm.dq.isl.ntt.co.jp by nttmail.ecl.ntt.co.jp (8.9.2/3.7W/01/21/99) with ESMTP id OAA03514 for ; Thu, 28 Jan 1999 14:39:41 +0900 (JST) Received: by nttmm.dq.isl.ntt.co.jp (8.7.6/isl-2.0/dq) id OAA24957; Thu, 28 Jan 1999 14:36:27 +0900 (JST) Date: Thu, 28 Jan 1999 14:36:27 +0900 (JST) From: kimoto@dq.isl.ntt.co.jp (Haruo Kimoto) Message-Id: <199901280536.OAA24957@nttmm.dq.isl.ntt.co.jp> To: irex@karc.crl.go.jp Reply-To: irex@karc.crl.go.jp X-Sequence: irex 143 Subject: [irex 143] irex IR Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 499 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Thu, 28 Jan 1999 14:36:27 +0900 (JST) From: kimoto@dq.isl.ntt.co.jp (Haruo Kimoto) To: irex@karc.crl.go.jp Reply-To: irex@karc.crl.go.jp X-Sequence: irex 143 Subject: [irex 143] irex IR Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 499 IREX 実行委員会様 NTT 木本 と申します。 先日(1/25)に、IREX 情報検索での検索対象文書数を メールにてお聞きしましたが、御回答が有りません。 当方の BMIR-J1 の論文資料で引用させていただきた いと考えています。 皆様、お忙しいと存じます。本メールが、そちらに 届いているか、どうかだけでも確認をしたく存じます。 届いていましたら、お手数ですが、ご確認の返事を いただければ幸いです。 以上、宜しくお願いします。  1, filed,, Summary-line: 28-Jan yogawa@charlie.src.ricoh. #[irex 144] Re: irex IR Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id AAA10415 for ; Thu, 28 Jan 1999 00:48:42 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id AAA02276 for ; Thu, 28 Jan 1999 00:50:26 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id OAA11832; Thu, 28 Jan 1999 14:44:33 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id OAA08613; Thu, 28 Jan 1999 14:44:31 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id OAA23600; Thu, 28 Jan 1999 14:39:01 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id OAA23595 for ; Thu, 28 Jan 1999 14:39:00 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id OAA29444 for ; Thu, 28 Jan 1999 14:38:24 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id OAA08608 for ; Thu, 28 Jan 1999 14:44:27 +0900 (JST) Received: from ricohigw.ricoh.co.jp (ricohigw.ricoh.co.jp [202.32.12.1]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id OAA05547 for ; Thu, 28 Jan 1999 14:44:26 +0900 (JST) Received: from charlie.src.ricoh.co.jp (charlie.src.ricoh.co.jp [133.139.213.4]) by ricohigw.ricoh.co.jp (8.8.8+2.7Wbeta7/3.6Wbeta7) with ESMTP id OAA25036; Thu, 28 Jan 1999 14:44:25 +0900 (JST) Received: from charlie (localhost [127.0.0.1]) by charlie.src.ricoh.co.jp (8.9.1+3.0W/3.7W) with SMTP id OAA12188; Thu, 28 Jan 1999 14:44:22 +0900 (JST) Message-Id: <199901280544.OAA12188@charlie.src.ricoh.co.jp> To: kimoto@dq.isl.ntt.co.jp Cc: irex@karc.crl.go.jp, yogawa@charlie.src.ricoh.co.jp In-Reply-To: Your message of "Thu, 28 Jan 1999 14:36:27 +0900 (JST)" References: <199901280536.OAA24957@nttmm.dq.isl.ntt.co.jp> X-Mailer: Mew version 1.06 on Emacs 19.28.2, Mule 2.2 Mime-Version: 1.0 Date: Thu, 28 Jan 1999 14:44:22 +0900 From: OGAWA Yasushi Reply-To: irex@karc.crl.go.jp X-Sequence: irex 144 Subject: [irex 144] Re: irex IR Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 973 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f To: kimoto@dq.isl.ntt.co.jp Cc: irex@karc.crl.go.jp, yogawa@charlie.src.ricoh.co.jp In-Reply-To: Your message of "Thu, 28 Jan 1999 14:36:27 +0900 (JST)" References: <199901280536.OAA24957@nttmm.dq.isl.ntt.co.jp> X-Mailer: Mew version 1.06 on Emacs 19.28.2, Mule 2.2 Mime-Version: 1.0 Date: Thu, 28 Jan 1999 14:44:22 +0900 From: OGAWA Yasushi Reply-To: irex@karc.crl.go.jp X-Sequence: irex 144 Subject: [irex 144] Re: irex IR Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 973 > IREX 実行委員会様 > > NTT 木本 と申します。 > > 先日(1/25)に、IREX 情報検索での検索対象文書数を > メールにてお聞きしましたが、御回答が有りません。 > > 届いていましたら、お手数ですが、ご確認の返事を > いただければ幸いです。 小川@リコーです。関根さんから irex メーリングリストへ回答が流れて いましたが、肝心の木本さんが抜けていたようです。以下を参照して下さい。 3. 木本さんからの質問にお答えします。 (資料中でのIREXへの言及ありがとうございます) IRの検索対象記事数は以下の通りです。 94年8月23日、24日の記事番号にはバグがあり削除したものです。 (検索結果に含まれていても、評価対象になっていません。) 毎日新聞94年 + 101058 毎日新聞95年 + 111497 95年8月23日の記事 - 366 95年8月24日の記事 - 336 合計 211853  1, filed,, Summary-line: 29-Jan isozaki@theory.brl.ntt.co #[irex 145] Organization vs. location Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id CAA08174 for ; Fri, 29 Jan 1999 02:36:12 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id CAA25585 for ; Fri, 29 Jan 1999 02:37:58 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id QAA24995; Fri, 29 Jan 1999 16:31:18 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id QAA15788; Fri, 29 Jan 1999 16:31:17 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id QAA07019; Fri, 29 Jan 1999 16:25:46 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id QAA07013 for ; Fri, 29 Jan 1999 16:25:44 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id QAA00255 for ; Fri, 29 Jan 1999 16:25:07 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id QAA15775 for ; Fri, 29 Jan 1999 16:31:11 +0900 (JST) Received: from tama3.tas.ntt.co.jp (tama3.tas.ntt.co.jp [192.68.248.40]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id QAA24023 for ; Fri, 29 Jan 1999 16:31:09 +0900 (JST) Received: from nttmail1.ecl.ntt.co.jp (nttmail1.tas.ntt.co.jp [192.68.248.14]) by tama3.tas.ntt.co.jp (8.8.8/3.6W/01/21/99) with ESMTP id QAA12514 for ; Fri, 29 Jan 1999 16:31:09 +0900 (JST) Received: from gulag.brl.ntt.co.jp by nttmail1.ecl.ntt.co.jp (8.9.2/3.7W/01/21/99) with ESMTP id QAA03018 for ; Fri, 29 Jan 1999 16:31:03 +0900 (JST) Received: by gulag.brl.ntt.co.jp(8.8.8/brl.mx15g) with TCP; Fri, 29 Jan 1999 16:29:43 +0900 (JST) Received: by theory.brl.ntt.co.jp (8.8.5/brl-s.1) with TCP; Fri, 29 Jan 1999 16:32:04 +0900 (JST) Message-Id: <199901290732.QAA25463@theory.brl.ntt.co.jp> To: irex@karc.crl.go.jp CC: isozaki@theory.brl.ntt.co.jp In-Reply-To: Your message of "Tue, 22 Dec 1998 13:12:35 -0500 (EST)" References: <199812221812.NAA28744@noreen.cs.nyu.edu> X-Mailer: Mew version 1.70 on Emacs 19.28.3 / Mule 2.2 Mime-Version: 1.0 Content-Transfer-Encoding: 7bit Date: Fri, 29 Jan 1999 16:32:04 +0900 From: Hideki ISOZAKI Reply-To: irex@karc.crl.go.jp X-Sequence: irex 145 Subject: [irex 145] Organization vs. location Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 567 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f To: irex@karc.crl.go.jp CC: isozaki@theory.brl.ntt.co.jp In-Reply-To: Your message of "Tue, 22 Dec 1998 13:12:35 -0500 (EST)" References: <199812221812.NAA28744@noreen.cs.nyu.edu> X-Mailer: Mew version 1.70 on Emacs 19.28.3 / Mule 2.2 Mime-Version: 1.0 Content-Transfer-Encoding: 7bit Date: Fri, 29 Jan 1999 16:32:04 +0900 From: Hideki ISOZAKI Reply-To: irex@karc.crl.go.jp X-Sequence: irex 145 Subject: [irex 145] Organization vs. location Sender: owner-irex@po.crl.go.jp Content-Type: Text/Plain; charset=iso-2022-jp Content-Length: 567 議論のむしかえしになるかもしれませんが、location と organization の扱い であいかわらず困っています。 940911166 の「国立天文台野辺山電波天文台」が location で、 「野辺山電波天文台」が organization なのは、皆さん異論ないのでしょうか? 3.1.L には「福岡支店」という例がありますが、 940911047 の「ウィーン支局」は organization でいいんですね? 私には、この微妙な差がいまだによくわかりません。 磯崎秀樹 NTTコミュニケーション科学基礎研究所  1, answered,, Summary-line: 29-Jan eriguchi@lit.rd.nttdata.c #[irex 146] Organization vs. location Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id GAA11577 for ; Fri, 29 Jan 1999 06:38:58 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id GAA27580 for ; Fri, 29 Jan 1999 06:40:42 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id UAA27592; Fri, 29 Jan 1999 20:35:31 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id UAA22866; Fri, 29 Jan 1999 20:35:30 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id UAA09654; Fri, 29 Jan 1999 20:30:00 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id UAA09649 for ; Fri, 29 Jan 1999 20:29:59 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id UAA00398 for ; Fri, 29 Jan 1999 20:29:22 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id UAA22861 for ; Fri, 29 Jan 1999 20:35:26 +0900 (JST) Received: from ms.nttdata.co.jp (ms0.nttdata.co.jp [163.135.193.231]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id UAA27580 for ; Fri, 29 Jan 1999 20:35:25 +0900 (JST) Received: from mx0.nttdata.co.jp (mx0.nttdata.co.jp [163.135.10.11]) by ms.nttdata.co.jp (8.8.8/3.6W-NTTDATA-TOP-09/17/98) with ESMTP id UAA02657 for ; Fri, 29 Jan 1999 20:35:24 +0900 (JST) Received: from pluto.rd.nttdata.co.jp ([163.135.16.10]) by mx0.nttdata.co.jp (8.8.5/3.5Wpl4-mx0/98091611) with ESMTP id UAA21648 for ; Fri, 29 Jan 1999 20:35:24 +0900 (JST) Received: from mail.lit.rd.nttdata.co.jp (litchi.lit.rd.nttdata.co.jp [163.135.200.130]) by pluto.rd.nttdata.co.jp (8.9.0/3.6W) with ESMTP id UAA21872 for ; Fri, 29 Jan 1999 20:35:23 +0900 (JST) Received: from pittsburgh.lit.rd.nttdata.co.jp (pittsburgh.lit.rd.nttdata.co.jp [163.135.200.135]) by mail.lit.rd.nttdata.co.jp (8.8.8+Sun/3.6W-lit-server-05/22/98) with SMTP id UAA01895 for ; Fri, 29 Jan 1999 20:35:22 +0900 (JST) Received: by pittsburgh.lit.rd.nttdata.co.jp (4.1/3.5W-lit-client-10/22/96) id AA17969; Fri, 29 Jan 99 20:34:21 JST Date: Fri, 29 Jan 99 20:34:21 JST From: Yoshio Eriguchi Message-Id: <9901291134.AA17969@pittsburgh.lit.rd.nttdata.co.jp> To: irex@karc.crl.go.jp In-Reply-To: Hideki ISOZAKI's message of Fri, 29 Jan 1999 16:32:04 +0900 <199901290732.QAA25463@theory.brl.ntt.co.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 146 Subject: [irex 146] Organization vs. location Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2481 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Fri, 29 Jan 99 20:34:21 JST From: Yoshio Eriguchi To: irex@karc.crl.go.jp In-Reply-To: Hideki ISOZAKI's message of Fri, 29 Jan 1999 16:32:04 +0900 <199901290732.QAA25463@theory.brl.ntt.co.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 146 Subject: [irex 146] Organization vs. location Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2481 江里口@NTTデータです。 もし、回答にあやまりがあったらご指摘ください。 > 関根さん >議論のむしかえしになるかもしれませんが、location と organization の扱い >であいかわらず困っています。 > >940911166 の「国立天文台野辺山電波天文台」が location で、 >「野辺山電波天文台」が organization なのは、皆さん異論ないのでしょうか? 「国立天文台野辺山電波天文台も、もうすっかり秋の気配」 という文は、場所として意味が強く、組織としての意味はない と判断しています。次のような名称を置き換えた二つの文を 比較すると、その違いが分かるかと思います。 「東京も、もうすっかり秋の気配」 「NTTも、もうすっかり秋の気配」 後者は、ちょっと説明が難しいです。 「恒例になった野辺山電波天文台の特別公開が行われます。」 の場合は、公開されるのは、場所ではなく施設であり、施設を 運営している組織の意味が強いと考えました。 積極的に組織名というよりも、地名ではないので組織名という 感覚もあります。 「施設名」は、組織的意味合いと場所的な意味合いの両方を 含んでいるので、判断が難しいと思いますが、今回の正解タグを つける(私の)一つの基準としては、地名としての意味がない場 合は、組織としてタグをつけていることにしています。 もしかすると、場所としても組織の両方の役割がない施設名 も存在するかもしれませんが、今のところ施設名にはどちらかに タグをふっています。 最終的には、判断に困った場合は、その名称についてはOPTIONALに するケースもありますが、現時点では、このケースはそのままに したいと思います。 >3.1.L には「福岡支店」という例がありますが、 >940911047 の「ウィーン支局」は organization でいいんですね? いえ、12月の議論で、この部分は変更になりました。 「ウィーン支局」は「ウィーン支局」 となります。 議事録のところに次のような項目があります。 :: <発言> :: ・普通名詞による固有表現を認定するか否か? :: ・固有名詞、普通名詞の定義には触れたくない。 :: :: <結論> :: ・個々の記述で判断する。文脈からの解析は行わない。 :: ・「ローマ支局」や「福岡支店」はそれ単独では固有表現とはしない。 毎日新聞ローマ支局の場合は、organizationになりますが、 (ローマ支局)のばあいは、(ローマ支局) となります。他との整合性のためこのように落ちつきました。 -- Eriguchi  1,, Summary-line: 29-Jan to: irex@karc.crl.go.jp #[irex 147] Organization vs. location Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id IAA12844 for ; Fri, 29 Jan 1999 08:04:11 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id IAA28211 for ; Fri, 29 Jan 1999 08:05:57 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id WAA28272; Fri, 29 Jan 1999 22:00:23 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id WAA24433; Fri, 29 Jan 1999 22:00:22 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id VAA10055; Fri, 29 Jan 1999 21:54:52 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id VAA10050 for ; Fri, 29 Jan 1999 21:54:51 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id VAA00447 for ; Fri, 29 Jan 1999 21:54:14 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id WAA24428 for ; Fri, 29 Jan 1999 22:00:18 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id WAA28489 for ; Fri, 29 Jan 1999 22:00:16 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id IAA18880; Fri, 29 Jan 1999 08:00:16 -0500 (EST) Date: Fri, 29 Jan 1999 08:00:16 -0500 (EST) From: Satoshi Sekine Message-Id: <199901291300.IAA18880@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: Yoshio Eriguchi's message of Fri, 29 Jan 99 20:34:21 JST <9901291134.AA17969@pittsburgh.lit.rd.nttdata.co.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 147 Subject: [irex 147] Organization vs. location Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 991 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Fri, 29 Jan 1999 08:00:16 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: Yoshio Eriguchi's message of Fri, 29 Jan 99 20:34:21 JST <9901291134.AA17969@pittsburgh.lit.rd.nttdata.co.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 147 Subject: [irex 147] Organization vs. location Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 991 磯崎さんからの指摘に関し、私も江里口さんの説明でいいと思います。 前者の問題は、正解作成時に江里口さんの言われる通りの議論を 我々の間でもいたしました。 正解作成後のミーティングで変更がかかっているので、それに 基づいた正解を作成すべきでした。時間のある限り努力しますが、 担当者もボランティアベースで、他の仕事も抱えており、どうしても 時間がかかるだろうという事はお許しください。 データは何回見直しをしようとも、すべて人間が作成するものです。 間違えも含まれる事があると思いますので、そのようなものを発見 しましたら、是非レポートしてください。 本試験においては、このような間違いを訂正する為に、正解発表後 2週間程度の、正解訂正申請期間を設けます。その間に出された 疑問や問題点を正解作成者で検討し、妥当と思われるものについては 訂正した物を評価する際の正解とします。 (MUCでは、この間に非常に多くのメイルが行きかいます。。) 正解作成者も一生懸命やっておりますが、どうか御了承下さい。 関根  1,, Summary-line: 31-Jan kando@rd.nacsis.ac.jp #[irex 148] Re: Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id EAA27876 for ; Sun, 31 Jan 1999 04:05:29 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id EAA25576 for ; Sun, 31 Jan 1999 04:07:18 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id SAA09692; Sun, 31 Jan 1999 18:00:44 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id SAA17725; Sun, 31 Jan 1999 18:00:43 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id RAA16853; Sun, 31 Jan 1999 17:55:13 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id RAA16848 for ; Sun, 31 Jan 1999 17:55:12 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id RAA00986 for ; Sun, 31 Jan 1999 17:54:33 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id SAA17717 for ; Sun, 31 Jan 1999 18:00:38 +0900 (JST) Received: from atlas.rd.nacsis.ac.jp (atlas.rd.nacsis.ac.jp [136.187.41.217]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id SAA11061 for ; Sun, 31 Jan 1999 18:00:38 +0900 (JST) Received: from lune.rd.nacsis.ac.jp (lune.rd.nacsis.ac.jp [136.187.41.48]) by atlas.rd.nacsis.ac.jp (8.8.7+2.7Wbeta7/3.6Wbeta7/97112517) with SMTP id SAA17956; Sun, 31 Jan 1999 18:03:05 +0900 (JST) Received: by lune.rd.nacsis.ac.jp (SMI-8.6/SMI-SVR4) id SAA12713; Sun, 31 Jan 1999 18:03:45 +0900 Date: Sun, 31 Jan 1999 18:03:45 +0900 From: kando@rd.nacsis.ac.jp (Noriko Kando) Message-Id: <199901310903.SAA12713@lune.rd.nacsis.ac.jp> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu X-Sun-Charset: ja_JP.iso2022-7 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 148 Subject: [irex 148] Re: Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1155 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Sun, 31 Jan 1999 18:03:45 +0900 From: kando@rd.nacsis.ac.jp (Noriko Kando) To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu X-Sun-Charset: ja_JP.iso2022-7 Reply-To: irex@karc.crl.go.jp X-Sequence: irex 148 Subject: [irex 148] Re: Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1155 学術情報センターの神門です。 間の抜けたフォローで申し訳ないのですが、 >> NACSISとの関係ですが、IREX-MLにこの話を流す前に神門さん影浦さんに >> 意見を伺いました。影浦さんから御返事をいただきましたが、 >> NACSISのプロジェクトは学振のお金で運営されており、その制約が厳しく >> 他との共同というのを表には出せないとのお話をいただきました。 私の回答は、影浦さんから影浦さんの回答と一緒に関根さんにお送りし たと思います。 一点、ちょっと誤解があるかもしれないので、補足させていただきます。 学会発表データを使用した「テストコレクション1(NTCIR-1)」は、学振か らサポートされているプロジェクトの一部として、構築しています。 研究資金と成果物の関係は明確にしなければなりませんので、この構築に 関わる作業は、他との共同ではできません。 ですが、「テストコレクション構築」全般が制約を受けている訳ではあり ませんので、たとえば、異なる文書を使用するなど、まったく別のものと して明確に切り分けられる形で、新たなテストコレクションをつくるので あれば、他の資金でおこなうことはもちろん可能です。 よろしくお願いいたします。 神門 典子.  1, filed,, Summary-line: 1-Feb to: irex@karc.crl.go.jp #[irex 149] Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA27180 for ; Mon, 1 Feb 1999 09:49:51 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA09206 for ; Mon, 1 Feb 1999 09:51:39 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id XAA22842; Mon, 1 Feb 1999 23:46:30 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id XAA24849; Mon, 1 Feb 1999 23:46:29 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id XAA28847; Mon, 1 Feb 1999 23:40:59 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id XAA28842 for ; Mon, 1 Feb 1999 23:40:58 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id XAA01565 for ; Mon, 1 Feb 1999 23:40:19 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id XAA24840 for ; Mon, 1 Feb 1999 23:46:25 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id XAA00379 for ; Mon, 1 Feb 1999 23:46:06 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id JAA01601; Mon, 1 Feb 1999 09:45:58 -0500 (EST) Date: Mon, 1 Feb 1999 09:45:58 -0500 (EST) From: Satoshi Sekine Message-Id: <199902011445.JAA01601@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: Noriko Kando's message of Sun, 31 Jan 1999 18:03:45 +0900 <199901310903.SAA12713@lune.rd.nacsis.ac.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 149 Subject: [irex 149] Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1258 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Mon, 1 Feb 1999 09:45:58 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: Noriko Kando's message of Sun, 31 Jan 1999 18:03:45 +0900 <199901310903.SAA12713@lune.rd.nacsis.ac.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 149 Subject: [irex 149] Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1258 IREXメイリングリストの皆様: 将来のIREXについてです。 10数名の方から、MLまたは個人的にメイルをいただきました。 時期尚早、体制を考えてという慎重意見はあったものの、 すべての方からIREXを続ける事には意味があるという内容を いただきました。ありがとうございました。 今の所、課題である中心になっていただける企業を見つけられ ませんので、今回のIPAの申請は見送る事にしようと思います。 今後、内容や運営の仕方を皆様と考えながら進めていきたいと 思います。特に、参考情報として、今回の10年補正予算とは別に 6月頃に11年予算に基づく公募もあるし、内容的には直接通産省に かけあって、特別枠を使うという事も考えられるのではという話も いただきました。このような点も視野に入れながら考えていきたいと 思います。 参考になる情報や意見、アイデアがありましたら、何なりと IREX-MLまたは関根、井佐原の方にメイルをください。 どうぞよろしくお願いいたします。 また、神門さんからは非常に励みになるメイルをいただきました。 どうもありがとうございます。是非、今後もNACSISと協力しながら 進めていきたいと思います。 (NACSISの方々には、9月のワークショップの開催に関して非常に お世話になっております。) 関根  1, filed,, Summary-line: 2-Feb kimoto@dq.isl.ntt.co.jp #[irex 150] IREX - SIGFI Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id VAA11136 for ; Mon, 1 Feb 1999 21:38:46 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id VAA24546 for ; Mon, 1 Feb 1999 21:40:36 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id LAA27239; Tue, 2 Feb 1999 11:33:56 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id LAA07699; Tue, 2 Feb 1999 11:33:55 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id LAA02389; Tue, 2 Feb 1999 11:28:25 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id LAA02384 for ; Tue, 2 Feb 1999 11:28:24 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id LAA01749 for ; Tue, 2 Feb 1999 11:27:44 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id LAA07685 for ; Tue, 2 Feb 1999 11:33:50 +0900 (JST) Received: from tama3.tas.ntt.co.jp (tama3.tas.ntt.co.jp [192.68.248.40]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id LAA07358 for ; Tue, 2 Feb 1999 11:33:49 +0900 (JST) Received: from nttmail.ecl.ntt.co.jp (nttmail.tas.ntt.co.jp [192.68.248.11]) by tama3.tas.ntt.co.jp (8.8.8/3.6W/01/21/99) with ESMTP id LAA24508 for ; Tue, 2 Feb 1999 11:33:48 +0900 (JST) Received: from nttmm.dq.isl.ntt.co.jp by nttmail.ecl.ntt.co.jp (8.9.2/3.7W/01/21/99) with ESMTP id LAA12677 for ; Tue, 2 Feb 1999 11:33:47 +0900 (JST) Received: by nttmm.dq.isl.ntt.co.jp (8.7.6/isl-2.0/dq) id LAA03586; Tue, 2 Feb 1999 11:30:32 +0900 (JST) Date: Tue, 2 Feb 1999 11:30:32 +0900 (JST) From: kimoto@dq.isl.ntt.co.jp (Haruo Kimoto) Message-Id: <199902020230.LAA03586@nttmm.dq.isl.ntt.co.jp> To: irex@karc.crl.go.jp In-reply-to: Satoshi Sekine's message of Mon, 1 Feb 1999 09:45:58 -0500 (EST) <199902011445.JAA01601@noreen.cs.nyu.edu> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 150 Subject: [irex 150] IREX - SIGFI Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1260 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Tue, 2 Feb 1999 11:30:32 +0900 (JST) From: kimoto@dq.isl.ntt.co.jp (Haruo Kimoto) To: irex@karc.crl.go.jp In-reply-to: Satoshi Sekine's message of Mon, 1 Feb 1999 09:45:58 -0500 (EST) <199902011445.JAA01601@noreen.cs.nyu.edu> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 150 Subject: [irex 150] IREX - SIGFI Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1260 関根様 IREX 実行委員会様 NTT 木本です。 最近、この ML に入れていただきました。 宜しくお願いします。 木本は、情報処理学会 情報学基礎研究会(SIGFI)の主査です。 SIGFI は情報流通、情報検索、図書館情報学などに関心の有る 人々が集まった研究会です。 もしも、可能でしたら、IREX と SIGFI が協力できればと 木本個人は考えています。 協力といってもたいしたことはできませんが、目に見える 具体的な形では、以下のようなことが考えられます。 ------------------------------------------------ SIGFI は IREX を後援する。 後援とは、 ・SIGFI は、それが主催する情報学シンポジウムに、 IREX関係者の招待講演の機会を与える。 ・IREXは、その cfp, workshop proceedings などに SIGFIが後援であることを明記する。 ----------------------------------------------- 以上は、現段階では、木本個人の考えですが、 3/1 に SIGFI の委員会が予定されていて、木本から 委員会に提案しようと考えています。 IREX-SIGFI の協力関係を作ること、それと、 木本側の、その次のアクションとして、SIGFI内部 へ提案することについて、お考えをお知らせ下さい。 宜しくお願いします。  1, filed,, Summary-line: 5-Feb to: irex@karc.crl.go.jp #[irex 151] Future IREX Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA09340 for ; Fri, 5 Feb 1999 09:24:57 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id JAA10359 for ; Fri, 5 Feb 1999 09:26:51 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id XAA17552; Fri, 5 Feb 1999 23:21:25 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id XAA13691; Fri, 5 Feb 1999 23:21:23 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id XAA17041; Fri, 5 Feb 1999 23:15:55 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id XAA17036 for ; Fri, 5 Feb 1999 23:15:54 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id XAA04245 for ; Fri, 5 Feb 1999 23:15:11 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id XAA13686 for ; Fri, 5 Feb 1999 23:21:19 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id XAA19232 for ; Fri, 5 Feb 1999 23:21:18 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id JAA04544; Fri, 5 Feb 1999 09:20:54 -0500 (EST) Date: Fri, 5 Feb 1999 09:20:54 -0500 (EST) From: Satoshi Sekine Message-Id: <199902051420.JAA04544@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 151 Subject: [irex 151] Future IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3124 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Fri, 5 Feb 1999 09:20:54 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 151 Subject: [irex 151] Future IREX Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3124 IREXメイリングリストの皆様: IREXの将来にも関連して以下のような非常に面白い話を 個人的にいただきました。著者の許可を得て引用し、 それに対する私の考えを書きます。 > 今月 リクルート社の www.isize.com というサイトが > オープンしました.ここは 検索サイトであるともいえるの > でしょうが, キーワードに適合する新聞記事を取ってくるといった > 旧式?検索とくらべると 格段に進歩したニーズを満たすための > 検索の姿を示していますね.こういうサイトが充実してくると > 検索エンジンをつかう機会は確実に減ってくるのだろうと > 思います. そう考えるとIREXというのは だれのために > 何を目指して行くのだろう? とふと感じました. --------- ここから私の返事 --------- ISIZEホームページを見ました。(紹介される前に一部は すでに、見ていました) YAHOOと機能的に似ていますが、 もっとユーザーフレンドリーにした物という印象を持ちました。 このような形式での「検索ページ」というのは、構築して行く側も ユーザーの側も色々な面で非常に有益だと思います。 (私もYAHOOは良く使っています。) ただ、このような方向と IREXの存在は以下の3点を理由に共存していくものだと思います。 1.だからといって、全文検索が不必要になるとは思えない。 確かに、新聞の各記事や、その他のすべてのドキュメントを 予め分類しておき、読者はその既存の分類だけに基づいて 情報を得るという世界を想定できなくはないですが、読者の意図や 視点は幅広く、すべての要求を満す分類は不可能だと思えます。 したがって、読者の動的な情報要求に応じる手段は必要であり、 全文検索はその有力な手段のひとつであると思います。 また、現在のYAHOOにも、いわゆる「検索機能」が付いており、 これを利用しての検索は非常に有益で、不可欠の物だと思います。 2.基礎データは必要である。 IREXはコンテストだけが目的ではありません。実際は「基礎データ」 を作成するというのが一番大事だと思っています。(TIPSTERの 最後のミーティングでも、TIPSTER,MUC,TRECの成果は基礎データの 作成にあった、という意見が数多く出ました。) 今回の検索、抽出共に ここで作成されたデータが将来の研究開発に幅広く利用できるような 基礎データになるように心掛けて設計してきたつもりです。そして、 我々研究者はYAHOOやISIZEの先に来る物を創造していくという使命も 担っていると思われます。そのためにも役に立つデータになる事を 願っております。 3.IREXは全文検索だけを課題としている訳ではない。 今回のIREXは検索と固有表現抽出を課題としていますが、なにも これらのターゲットだけに絞っている訳ではありません。将来への 議論にもある通り、次回は色々な課題を設定したいと思っております。 その中には、要約、ドキュメントクラスタリング等も候補に上って いますが、それだけに限らず、広く使える技術課題を皆様の方からも 提案していただきたいと思っております。また、TREC-8でWeb検索が 課題になっています。IREXでも技術的、法律的な問題を気にとめつつ、 このような方向への発展も可能だと思っております。  1, filed,, Summary-line: 9-Feb to: irex@karc.crl.go.jp #[irex 152] NE definition Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id QAA22377 for ; Tue, 9 Feb 1999 16:12:42 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id QAA28977 for ; Tue, 9 Feb 1999 16:14:39 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id GAA20411; Wed, 10 Feb 1999 06:09:08 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id GAA21792; Wed, 10 Feb 1999 06:09:07 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id GAA20071; Wed, 10 Feb 1999 06:03:39 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id GAA20066 for ; Wed, 10 Feb 1999 06:03:38 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id GAA05992 for ; Wed, 10 Feb 1999 06:02:53 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id GAA21787 for ; Wed, 10 Feb 1999 06:09:03 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id GAA11087 for ; Wed, 10 Feb 1999 06:09:01 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id QAA06531; Tue, 9 Feb 1999 16:09:00 -0500 (EST) Date: Tue, 9 Feb 1999 16:09:00 -0500 (EST) From: Satoshi Sekine Message-Id: <199902092109.QAA06531@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 152 Subject: [irex 152] NE definition Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 7589 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Tue, 9 Feb 1999 16:09:00 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 152 Subject: [irex 152] NE definition Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 7589 IREXメイリングリストの皆様: A new NE data (CRL Named Entity data) will be released soon. This message includes a list of problems found in the tagging process. Please let me know if you find some problems. 通総研のNEデータ(CRL固有表現データ)を間もなく公開します。 これは、京大コーパスとまったく同じ一万文に、IREXのNE定義に 基づいたタグを振ったものです。私(関根)が中心になり、他2(1?)名の 方に手伝ってもらって作成しました。現在のNE定義(df981222.txt)に 基づいてやっていますが、現在の定義ではカバーしきれていない 問題が多々見付かり、そのような場合には私の独断で決めてしまって います。重要な点(と、他の方と異なっていた問題点)を列挙します。 これらの中に問題があると思われる物がありましたら、 早目に提起してください。 これらの追加を加えた新しい定義をなるべく早く公開したいと思います。 (現在の定義を覆すという事はない筈です。すべて、現在の定義には 書かれていなかった点の詳細化の筈です。したがって、すでに開発を 始めていらっしゃる方も1からやり直すという必要はない筈です。) また、「時間表現」に「日付表現」と「時間表現」があります。 「時間表現」がふたつあり紛らわしいので、後者を「時刻表現」と すればいいのではないかという提案がありました。 非常にいい案だと思いますので、採用したいと思います。 異論、意見などありましたらお知らせください。 よろしくお願いします。 関根 ----------------------- *「周年」のような相対表現については、説明の名詞句は入れない。 会社創立三十周年, 失踪前日国際児童年十周年 優勝戦 * 「戦後五十年」という表現が沢山出ているが、これは 「戦後五十年間」という意味と「戦後五十年目」という意味の どちらかの場合があり、その区別は非常に難しい。したがって この「戦後五十年」に限り、すべての場合をOPTIONALにする。 * 「時代」のようなニックネーム的時間表現では、その表現だけで 客観的に開始時期、終了時期が判断できるもののみに限る。 個人的は表現は入れない。 大正時代 旧石器時代関根名人時代 ソ連時代、 新しい時代、冷戦時代、マルチメディア時代、僕の中学時代、 野茂選手の新日鉄境時代、彼の全盛期、 さみしい時代、バブル時代 * 表記上には単位がなくとも金額の事であるのは明白なものもタグ付け 五千万 * 「半」 以下のような物は明確な割合表現ではないとし、タグ付けしない。 大半、半ば、前半、後半、半透明、半月、下半身、半壊、半焼 半強制的 以下のような物は明確な割合表現とし、タグ付けする。 5時間, 四半世紀、 過数、北球 * スポーツの運営組織(リーグ名)はOPTIONAL 大リーグJリーグ プロ野球 * 駅名の前に会社名、路線名が就いている時には合せてタグする JR新宿駅 身延線富士宮駅 * 単独に述べられている「大賞」「最優秀賞」はOPTIONAL (総務部との関連) 賞名は、単独でも固有の物である事が分るようなもののみをタグ付けする。 * 時間表現の相対表現の場合、概略表現(など、くらい),助詞等が中に 入ってしまう事もある。 二十年くらいも前数年前数年後 先月初めころ、 * 時間の長さを利用した相対表現と「ぶり」「以内」の合成は 時間表現とはしない。 20年ぶり、三年以内、数日中、今年中 * 「現在」、「最近」という漠然とした表現にはタグを付けない。 * 今日(こんにち)は今日(きょう)との判別が困難なため、すべてタグ 付けをする。ただし、「今日」でも、比喩的な表現や繰り返しなどの ような表現にはタグを付けない。 ※今日あって明日はどうなるかせつな的な日を送っていた。 * ニックネームが形容表現か? 今年は「選択の年」。の「選択の年」は、その年に 振られたニックネームというよりも、今年の説明であり、 「彼女は綺麗な女」の女同様、説明の表現と取れる。 * サッカーの試合などにおけるTIMEの時間表現もタグ付けする。 後半。その、ボールは ゴール内にあった。 * 切ると単位が消えてしまうような範囲表現は一緒にひとつの 表現とする。 四万から七万バーツ * 「本因坊」はすべて人名(襲名する名前)とする。 本因坊位、本因坊戦、 名誉本因坊 * 時間表現における概略表現がは表現に含めない 前、すぎ、 ころ * 講演名、講座名はOPTIONALにする。 テレビ、ラジオ番組名はARTIFACT。 ※ 物と事のグラデュエーション (<物>、本の題名、ビデオの題名、映画の題名、テレビの題名 講演の題名、集会の題名、抗争の題名、戦争の題名、<事>) * 論文の題名はARTIFACTとする。 * 「大統領」「首相」のように、普通にはそれだけでは役職を指す ような名称にはOPTIONAL 3を適応しない。「天皇」「ローマ法皇」 のように普通にそれが人を指す場合に限る。 * 「首都」というのは、照応とみなす。 * 「イスラム」は地名とはしない。 * 劇、映画上の人名などにも人名としてタグを付ける。 * 地名は、建物までの単位とし、階の名前や、その中の特殊な場所 「正面玄関」「南口」「南ウィング」のような細部までは地名とは しない。 * 普通名詞的表現にはタグ付けしない。「民主リベラル新党」 * 主義、制度はタグ付けしない。「社会主義」「中選挙区制」 * 地名に続く「沖」「沿岸」のような表現は地名に含まない。 宮城県はるか沖 * 「過激派」「保守系会派」「急進派」「セルビア人勢力」のような 表現は固有の対象を指していないのでタグ付けしない。 * 「朝刊」「夕刊」の「朝」「夕」は一般的な表現であり時間表現とは しない。 * 「諸国」のような表現は漠然としており、含めない。 東欧諸国 * 「南部」「地方」といった表現は地名に含まれないため、以下の ようになる。 ロシア南部チェチェン共和国 * 「{国名}国籍」の場合には{国名}だけを地名にする。(国は入れない。) 日本国籍 カナダ国籍 国籍 国籍 * 新聞名(毎日新聞、ニューヨークタイムズ)は、「報じる」 「インタビューした」というような動作の主体となっている場合 にはORGANIZATIONとし、「に載っている」というような場合には ARTIFACTとする。 * 「人一倍」の「一倍」はPERCENTとはしない。 * 「新春恒例」、「毎年新年」という場合の「新春」「新年」は 特定の新春、新年を指す訳ではないので、DATEではない。 * 時間表現(夏)にも、クラスとしての「夏(夏は暑い)」と特定の時期を 指した「夏(1999年夏)」があり、前者は時間表現とはしない。 後者は時間表現である。  1, filed,, Summary-line: 10-Feb to: irex@karc.crl.go.jp #[irex 153] NE definition Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id OAA01305 for ; Wed, 10 Feb 1999 14:39:09 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id OAA17303 for ; Wed, 10 Feb 1999 14:41:08 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id EAA01921; Thu, 11 Feb 1999 04:35:40 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id EAA25394; Thu, 11 Feb 1999 04:35:39 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id EAA01507; Thu, 11 Feb 1999 04:30:11 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id EAA01502 for ; Thu, 11 Feb 1999 04:30:10 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id EAA06596 for ; Thu, 11 Feb 1999 04:29:24 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id EAA25389 for ; Thu, 11 Feb 1999 04:35:35 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id EAA28719 for ; Thu, 11 Feb 1999 04:35:33 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id OAA07360; Wed, 10 Feb 1999 14:35:32 -0500 (EST) Date: Wed, 10 Feb 1999 14:35:32 -0500 (EST) From: Satoshi Sekine Message-Id: <199902101935.OAA07360@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: Satoshi Sekine's message of Tue, 9 Feb 1999 16:09:00 -0500 (EST) <199902092109.QAA06531@noreen.cs.nyu.edu> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 153 Subject: [irex 153] NE definition Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2085 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Wed, 10 Feb 1999 14:35:32 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: Satoshi Sekine's message of Tue, 9 Feb 1999 16:09:00 -0500 (EST) <199902092109.QAA06531@noreen.cs.nyu.edu> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 153 Subject: [irex 153] NE definition Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2085 IREXメイリングリストの皆様: I received a few comments about the NE discussion. Thank you. There are two explanations which could cause a problem. I will explain a bit. Satoshi Sekine ----------------- 昨日出したNE定義に関する議論ですが、ひとつ矛盾を招きかねない 議論を見つけました。以下のように説明しなおします。 > * 表記上には単位がなくとも金額の事であるのは明白なものもタグ付け > 五千万 > > * 切ると単位が消えてしまうような範囲表現は一緒にひとつの > 表現とする。 > 四万から七万バーツ この2つが、これだけだと矛盾しています。 下の例は、3.2.Fと3.3.C(のふたつ目)に関連して、切れると意味が 変ってしまう場合には切らないという連続表現の規則の3.1.Cから 切りたくありませんが、上記の上の例によると、 四万から七万バーツ という回答も正解にしなければなりません。 上記の2つの例は、データの中の関連のない場所で個別に出たもので、 このような関連性は考えていませんでした。 私の結論は、下の方の定義に優先度を与えるという物です。 下の例のような時間、数値表現の連続表現において、単位のない部分 がある場合で、その連続表現内の他の場所に単位がある部分が ある場合には、その単位のある部分まで含んでひとつの表現とみなす。 (すべての部分に単位がある場合には、原稿通りすべて分割して 個別の表現とします。) 連続表現ではなく、孤立して表現されていて単位がない場合に、 その意味が分るものは、その意味の固有表現とする というように、優先度が付いたような形で定義したいと思います。 どうでしょうか? この提案は、個別に質問者に回答した物とは異なっています。 連続表現で、単位のないものも孤立した表現とみなすというようにすると、 つまり、四万から七万バーツのみを正解と すると、現在の定義(3.3.C(のふたつ目))を書き換る必要がでてきます。 現在の定義を変えないという大前提があるので、上記の提案で行きたいと 思います。 関根  1,, Summary-line: 10-Feb to: irex@karc.crl.go.jp #[irex 154] pre-anouncement of a new IREX package Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id PAA02283 for ; Wed, 10 Feb 1999 15:54:23 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id PAA18433 for ; Wed, 10 Feb 1999 15:56:24 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.6W) with ESMTP id FAA02094; Thu, 11 Feb 1999 05:51:06 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id FAA25928; Thu, 11 Feb 1999 05:51:05 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id FAA01630; Thu, 11 Feb 1999 05:45:37 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id FAA01625 for ; Thu, 11 Feb 1999 05:45:36 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id FAA06618 for ; Thu, 11 Feb 1999 05:44:50 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id FAA25920 for ; Thu, 11 Feb 1999 05:51:01 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id FAA29121 for ; Thu, 11 Feb 1999 05:50:59 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id PAA07514; Wed, 10 Feb 1999 15:50:51 -0500 (EST) Date: Wed, 10 Feb 1999 15:50:51 -0500 (EST) From: Satoshi Sekine Message-Id: <199902102050.PAA07514@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 154 Subject: [irex 154] pre-anouncement of a new IREX package Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3485 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Wed, 10 Feb 1999 15:50:51 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 154 Subject: [irex 154] pre-anouncement of a new IREX package Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3485 Dear IREX-ML member: Soon, we will distribute a new IREX package. It will have new data and programs. 1. NE_CRLDATA : NE data for 10,000 sentences 2. NE definition : modified based on the development of CRLDATA 3. irex-browse : IR result browser. A snap shot is shown at the end of this message. (developed by Mr.Tsuchiya) 4. SIR1199 : Simple IR system (developed as a baseline system) Satoshi Sekine ------------------- IREXメイリングリストの皆様: 間も無く、新しいIREXパッケージを公開します。 (バレンタインデー公開として、2月14日を予定) 以下の物が新しく含まれる予定です。 1. CRL固有表現データ 京大コーパスと同じ1万文に対する固有表現データです。 2. 新しいNEの定義 上記のデータ作成時に、現定義では不足と思われた説明を 足したもの。現在メイリングリスト等で議論中です。 3. irex-browse IR結果のブラウザ。サンプル画面はこのメイルの最後に 付けました。京大の土屋君制作。irex-judgeを使用した 方にはすぐに分ると思います。各システムの順位に従って 記事の情報(各判定者の判定結果、順位、スコア、記事の 日時、題名)が上の画面に表示。n/pで上下の記事を閲覧。 下の画面に記事内容を表示します。 4. SIR1199 perlで簡単に作ったIRシステム。検索語の拡張もせず、 単純なTF*IDFですが、ベースラインとして作りました。 (改良、助言その他歓迎です。検索語拡張版のSIR1198も 作成、改良中) 関根 * A snap shot of irex-browse It is an emacs program and it has two windows; one shows the list of articles according to the rank of a system. The other shows the contents of the article specified in the upper window. ================================================================================== 71 - - - - 71 0.196659130561229 94/05/08 [サンデーけいざい$ 72 A B A A 72 0.195288114158618 95/08/08 米国は今…大再編時$ 73 A A A A [73] 0.194984852097495 94/08/31 ロッキードとマーチ$ 74 C C C C 74 0.194906899887327 94/06/06 新卒採用計画特集 $ 75 C C C C 75 0.194892696491884 94/08/30 「日本代表は業務」$ 76 B C C C 76 0.193580432510477 95/04/12 [社説]経済 甘か$ 77 C C C C 77 0.192998871049873 95/06/15 企画特集 毎日健康$ 78 C C C C 78 0.192834260806768 94/01/25 [解説]環境行政の$ ----------------------------------------------------------------------------------- J_:--%%-Emacs: *IR-JUDGE-LIST* (IR-BROWSE SID=1199 TOPIC-ID=1001)--L73 7% ----------------------------------------------------------------------------------- DOCNO : 940831074 表題 : ロッキードとマーチンが合併 再編進む米の国防・航空産業界  【ニューヨーク30日渡辺良行】米大手航空機メーカーのロッキードと、米防衛産 業大手のマーチン・マリエッタは三十日未明、普通株式交換の形をとって合併するこ とに ................. ----------------------------------------------------------------------------------- E_:--%%-Emacs: *IR-JUDGE-ARTICLE* (IR-JUDGE ARTICLE Narrow)--L7--Top------- ----------------------------------------------------------------------------------- ==================================================================================  1, filed,, Summary-line: 13-Feb to: irex@karc.crl.go.jp #[irex 155] New IREX Package Release (Valentine Present) Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id RAA28562 for ; Sat, 13 Feb 1999 17:03:31 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id RAA05960 for ; Sat, 13 Feb 1999 17:05:32 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id HAA23216; Sun, 14 Feb 1999 07:00:09 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id HAA25384; Sun, 14 Feb 1999 07:00:07 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id GAA18514; Sun, 14 Feb 1999 06:54:41 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id GAA18509 for ; Sun, 14 Feb 1999 06:54:39 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id GAA07968 for ; Sun, 14 Feb 1999 06:53:51 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id HAA25379 for ; Sun, 14 Feb 1999 07:00:03 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id GAA01260 for ; Sun, 14 Feb 1999 06:59:57 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id QAA09512; Sat, 13 Feb 1999 16:59:56 -0500 (EST) Date: Sat, 13 Feb 1999 16:59:56 -0500 (EST) From: Satoshi Sekine Message-Id: <199902132159.QAA09512@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 155 Subject: [irex 155] New IREX Package Release (Valentine Present) Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1652 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Sat, 13 Feb 1999 16:59:56 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 155 Subject: [irex 155] New IREX Package Release (Valentine Present) Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1652 Dear IREX-ML member: The new IREX package is ready. You can get it by ftp or through the IREX homepage. It includes following programs and data (and more). 1. NE_CRLDATA : NE data for 10,000 sentences 2. NE definition : modified based on the development of CRLDATA 3. irex-browse : IR result browser. (developed by Mr.Tsuchiya) 4. SIR1199 : Simple IR system (developed as a baseline system) Enjoy! > ftp cs.nyu.edu ftp> cd pub/local/sekine ftp> binary ftp> get IREX990214.tar.gz Satoshi Sekine ------------------- IREXメイリングリストの皆様: 新しいIREXパッケージを公開します。 ftpかIREXホームページを通して入手できます。 以下の新しいデータなどが入っています。 1. CRL固有表現データ 京大コーパスと同じ1万文に対する固有表現データです。 2. 新しいNEの定義 上記のデータ作成時に、現定義では不足と思われた説明を 足したもの。 3. irex-browse IR結果のブラウザ。サンプル画面はこのメイルの最後に 付けました。京大の土屋君制作。irex-judgeを使用した 方にはすぐに分ると思います。各システムの順位に従って 記事の情報(各判定者の判定結果、順位、スコア、記事の 日時、題名)が上の画面に表示。n/pで上下の記事を閲覧。 4. SIR1199 perlで簡単に作ったIRシステム。検索語の拡張もせず、 単純なTF*IDFですが、ベースラインとして作りました。 (改良、助言その他歓迎です。検索語拡張版のSIR1198も 作成、改良中) > ftp cs.nyu.edu ftp> cd pub/local/sekine ftp> binary ftp> get IREX990214.tar.gz 関根  1, filed, answered,, Summary-line: 15-Feb nova@is.s.u-tokyo.ac.jp #[irex 156] Re: New IREX Package Release (Valentine Present) Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id RAA02593 for ; Sun, 14 Feb 1999 17:31:52 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id RAA17497 for ; Sun, 14 Feb 1999 17:33:56 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id HAA27113; Mon, 15 Feb 1999 07:28:20 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id HAA06548; Mon, 15 Feb 1999 07:28:19 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id HAA21769; Mon, 15 Feb 1999 07:22:53 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id HAA21764 for ; Mon, 15 Feb 1999 07:22:51 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id HAA08349 for ; Mon, 15 Feb 1999 07:22:02 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id HAA06543 for ; Mon, 15 Feb 1999 07:28:14 +0900 (JST) Received: from tjms1f.is.s.u-tokyo.ac.jp (tjms1f.is.s.u-tokyo.ac.jp [133.11.8.3]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id HAA07610 for ; Mon, 15 Feb 1999 07:28:14 +0900 (JST) Received: from ise15.is.s.u-tokyo.ac.jp (ise15 [133.11.30.25]) by tjms1f.is.s.u-tokyo.ac.jp (8.8.8/3.6W) with ESMTP id HAA20471; Mon, 15 Feb 1999 07:23:27 +0900 (JST) Received: (from nova@localhost) by ise15.is.s.u-tokyo.ac.jp (8.8.4/8.8.4) id HAA25587; Mon, 15 Feb 1999 07:26:28 +0900 (JST) Date: Mon, 15 Feb 1999 07:26:28 +0900 (JST) Message-Id: <199902142226.HAA25587@ise15.is.s.u-tokyo.ac.jp> To: irex@karc.crl.go.jp In-Reply-To: <199902132159.QAA09512@noreen.cs.nyu.edu> References: <199902132159.QAA09512@noreen.cs.nyu.edu> From: nova@is.s.u-tokyo.ac.jp (NOBATA, Chikashi) Reply-To: nova@is.s.u-tokyo.ac.jp X-Sequence: irex 156 Subject: [irex 156] Re: New IREX Package Release (Valentine Present) Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 779 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Mon, 15 Feb 1999 07:26:28 +0900 (JST) To: irex@karc.crl.go.jp In-Reply-To: <199902132159.QAA09512@noreen.cs.nyu.edu> References: <199902132159.QAA09512@noreen.cs.nyu.edu> From: nova@is.s.u-tokyo.ac.jp (NOBATA, Chikashi) Reply-To: nova@is.s.u-tokyo.ac.jp X-Sequence: irex 156 Subject: [irex 156] Re: New IREX Package Release (Valentine Present) Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 779 東京大学の野畑です。 今回のパッケージに含まれているCRL固有表現データについてですが、 teaによって復元する際に 950105082 の記事に対するタグづけがおかしくなるようです。 恐らくタグづけ時に一段落抜け落ちたのが原因と思われます。 以下の段落をorg.sgmlから取り除いたところ、正しくタグづけされました。 --- 「わが家の元日の朝は、寄席の始まる前の八時に、三十人以上の弟子と家族が集まる。 男は紋付きとはかま、女の子は振りそでかドレス。そして、順番にお酒一升の入った 大杯からひと口飲んで『今年もよろしくお願いします』。私が、めいめいの名前を書 いたはしとお年玉をあげる。その後、みんなは寄席へ。年賀の人が次々と来て――。 私は、外に出られません」 --- -- 野畑 周(nova@is.s.u-tokyo.ac.jp)  1,, Summary-line: 15-Feb akida@ibs.or.jp #[irex 157] Re:NE definition Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id BAA04703 for ; Mon, 15 Feb 1999 01:06:38 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id BAA22713 for ; Mon, 15 Feb 1999 01:08:42 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id PAA02094; Mon, 15 Feb 1999 15:02:58 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id PAA21511; Mon, 15 Feb 1999 15:02:57 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id OAA26752; Mon, 15 Feb 1999 14:57:28 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id OAA26747 for ; Mon, 15 Feb 1999 14:57:26 +0900 (JST) From: akida@ibs.or.jp Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id OAA08595 for ; Mon, 15 Feb 1999 14:56:37 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id PAA21505 for ; Mon, 15 Feb 1999 15:02:49 +0900 (JST) Received: from IBSGATE.ibs.or.jp (firewall-user@ibsgate.ibs.or.jp [203.180.86.3]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id PAA14401 for ; Mon, 15 Feb 1999 15:02:47 +0900 (JST) Received: by IBSGATE.ibs.or.jp; id PAA02496; Mon, 15 Feb 1999 15:02:05 +0900 (JST) Received: from unknown(100.1.200.101) by IBSGATE.ibs.or.jp via smap (V3.1) id xma002492; Mon, 15 Feb 99 15:01:44 +0900 Received: from ccMail by dell.ibs.or.jp (ccMail Link to SMTP R8.00.02) id AA919119471; Mon, 15 Feb 99 14:57:52 +0900 Message-Id: <9902159191.AA919119471@dell.ibs.or.jp> X-Mailer: ccMail Link to SMTP R8.00.02 Date: Mon, 15 Feb 99 15:03:44 +0900 To: MIME-Version: 1.0 Content-Transfer-Encoding: 7bit Reply-To: irex@karc.crl.go.jp X-Sequence: irex 157 Subject: [irex 157] Re:NE definition Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset=ISO-2022-JP Content-Length: 4919 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f From: akida@ibs.or.jp X-Mailer: ccMail Link to SMTP R8.00.02 Date: Mon, 15 Feb 99 15:03:44 +0900 To: MIME-Version: 1.0 Content-Transfer-Encoding: 7bit Reply-To: irex@karc.crl.go.jp X-Sequence: irex 157 Subject: [irex 157] Re:NE definition Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset=ISO-2022-JP Content-Length: 4919 IBSの木田(一万文のタグ付与作業をした他1名)と申します。 > 通総研のNEデータ(CRL固有表現データ)を間もなく公開します。 > これは、京大コーパスとまったく同じ一万文に、IREXのNE定義に > 基づいたタグを振ったものです。私(関根)が中心になり、他2(1?)名の > 方に手伝ってもらって作成しました。現在のNE定義(df981222.txt)に > 基づいてやっていますが、現在の定義ではカバーしきれていない > 問題が多々見付かり、そのような場合には私の独断で決めてしまって > います。重要な点(と、他の方と異なっていた問題点)を列挙します。 > これらの中に問題があると思われる物がありましたら、 > 早目に提起してください。 実際に作業をしてデータを見ていた立場から、疑問に感じた点を 二点挙げさせてください。 (疑問点1)「大統領」「首相」「首都」と「天皇」「ローマ法王」 > * 「大統領」「首相」のように、普通にはそれだけでは役職を指す > ような名称にはOPTIONAL 3を適応しない。「天皇」「ローマ法皇」 > のように普通にそれが人を指す場合に限る。 > > * 「首都」というのは、照応とみなす。 この部分が気になります。 私の感覚では、「天皇」「ローマ法王」にOPTIONAL3を振ってよいのなら、 「大統領」「首相」にもOPTIONAL3を振ると考えたくなります。 同時に、特定の場所を表すことになる「首都」もOPTIONAL3としたく なります。 すべてにOPTIONAL3を適用する or すべてにOPTIONAL3を適用しない だと理解できるのですが。 第一に、「天皇」「ローマ法皇」は普通にそれが人を指すけれど、 「大統領」「首相」は指さないという違いが、どうもよくわかりません。 「天皇」も「首相」も   ・役職名がそのまま特定の人を表す   ・文脈的にもその表現が役職ではなく人を表す という点では同類のように思います。  (1)玉音放送に臨んだ【天皇】は、〜 (2)【天皇】の崩御によって、明治時代は幕を閉じた。 (3)いわば終戦のために組閣された内閣の【首相】であった彼は、〜 (4)女性問題で【首相】が退陣とは情けない。 上の文では、    (1)天皇=裕仁天皇(昭和天皇)    (2)天皇=睦仁天皇(明治天皇)   (3)首相=鈴木貫太郎首相   (4)首相=宇野宗佑首相 となります。 第二に、「天皇」「ローマ法王」はある時間軸においては一名である という点では、「首相」「大統領」よりも確実に、 「そのまま特定の人を表」します。 けれど、新聞記事の場合、必ずしも時間軸は一つではありません。 実際に昔の天皇が出現している文が二文ありました。 (5)新春恒例の「小倉百人一首かるた競技第四十一期名人位、 第三十九期クイン位決定戦」が七日、百人一首の一番札を 詠んだ【天智天皇】ゆかりの近江神宮で開かれた。 (6)【後陽成天皇】の生母である新上東門院は、少女の時から    阿国をひいきにしていたともいう。 これらの文に続いて「天皇」が出てきた場合は、   天皇=天智天皇   天皇=後陽成天皇 になります。 (疑問点2)「A、B両○○」の扱い データでは、 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−− @ 28 36 長野、山梨両県警 @ 185 192 通産、郵政両省 @ 100 106 六、九の両日 @ 10 14 上下両院 @ 551 559 八月六、九の両日 @ 153 165 来月二十五、二十六の両日 @ 344 350 六、九の両日 @ 319 323 自社両党 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−− となっています。 でも定義では、「3.1.C 連続固有表現」の例の箇所に、 「両国」 とあります。 そして、「両」に関しては、これ以外に明記されている部分は ないようです。 「A、B両○○」でしょうか? 「B両○○」でしょうか? 私としては、前者を支持したいです。 金銭表現に関する定義の部分なのですが、 「3.3.1.A 単位のない表現」に、「ただし、範囲表現など で、他に単位がある場合には3.3.Dにより単位のない部分だけを 金額表現とするという事はしない」とあります。 この場合、タグ付けされたものの構造は、   ((A−B)円) になります。   ((A)−(B円)) にはなりません。 「両」の方も構造から考えて、公開データにあるように、   上下両院は、((A−B)両院) にした方が、全体として整合性がとれるように感じます。         (財)計量計画研究所 言語情報研究室                     木 田 敦 子                   akida@ibs.or.jp  1,, Summary-line: 15-Feb to: irex@karc.crl.go.jp #[irex 158] New IREX Package Release (Valentine Present) Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id KAA06480 for ; Mon, 15 Feb 1999 10:12:03 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id KAA25950 for ; Mon, 15 Feb 1999 10:14:02 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id AAA06992; Tue, 16 Feb 1999 00:02:09 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id AAA07063; Tue, 16 Feb 1999 00:02:07 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id XAA01508; Mon, 15 Feb 1999 23:56:41 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id XAA01503 for ; Mon, 15 Feb 1999 23:56:40 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id XAA08784 for ; Mon, 15 Feb 1999 23:55:51 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id AAA07058 for ; Tue, 16 Feb 1999 00:02:04 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id AAA22174 for ; Tue, 16 Feb 1999 00:01:59 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id KAA10594; Mon, 15 Feb 1999 10:01:56 -0500 (EST) Date: Mon, 15 Feb 1999 10:01:56 -0500 (EST) From: Satoshi Sekine Message-Id: <199902151501.KAA10594@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: NOBATA, Chikashi's message of Mon, 15 Feb 1999 07:26:28 +0900 (JST) <199902142226.HAA25587@ise15.is.s.u-tokyo.ac.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 158 Subject: [irex 158] New IREX Package Release (Valentine Present) Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 833 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Mon, 15 Feb 1999 10:01:56 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: NOBATA, Chikashi's message of Mon, 15 Feb 1999 07:26:28 +0900 (JST) <199902142226.HAA25587@ise15.is.s.u-tokyo.ac.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 158 Subject: [irex 158] New IREX Package Release (Valentine Present) Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 833 Dear IREX-ML member: There were bugs in the IREX990214 package. A new version is ready as IREX990215. We thank Mr.Nobata to let us know the bugs. > ftp cs.nyu.edu ftp> cd pub/local/sekine ftp> binary ftp> get IREX990215.tar.gz Satoshi Sekine ---------------------------------------------------- IREXメイリングリストの皆様: 野畑さんの指摘によりCRL固有表現データのバグを修正しました。 (他にもデータには影響しない所でひとつ文章を落していましたし、 teaがタグの長い文字列(OPTIONAL)に対応できていませんでした。 後者は、tea.cのMAX_TAG_STRINGを500に変更する事で直ります。) 上記のバグをフィックスしたバージョン(IREX990215)を用意しました のでご利用ください。 > ftp cs.nyu.edu ftp> cd pub/local/sekine ftp> binary ftp> get IREX990215.tar.gz 関根  1,, Summary-line: 15-Feb to: irex@karc.crl.go.jp #[irex 159] NE definition Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id LAA06968 for ; Mon, 15 Feb 1999 11:42:31 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id LAA27043 for ; Mon, 15 Feb 1999 11:44:34 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id BAA07552; Tue, 16 Feb 1999 01:35:40 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id BAA08853; Tue, 16 Feb 1999 01:35:38 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id BAA01875; Tue, 16 Feb 1999 01:30:12 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id BAA01870 for ; Tue, 16 Feb 1999 01:30:11 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id BAA08819 for ; Tue, 16 Feb 1999 01:29:22 +0900 (JST) Received: from c-ring1.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id BAA08848 for ; Tue, 16 Feb 1999 01:35:34 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by c-ring1.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id BAA09635 for ; Tue, 16 Feb 1999 01:34:44 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id LAA10631; Mon, 15 Feb 1999 11:23:05 -0500 (EST) Date: Mon, 15 Feb 1999 11:23:05 -0500 (EST) From: Satoshi Sekine Message-Id: <199902151623.LAA10631@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: akida@ibs.or.jp's message of Mon, 15 Feb 99 15:03:44 +0900 <9902159191.AA919119471@dell.ibs.or.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 159 Subject: [irex 159] NE definition Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 8757 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Mon, 15 Feb 1999 11:23:05 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: akida@ibs.or.jp's message of Mon, 15 Feb 99 15:03:44 +0900 <9902159191.AA919119471@dell.ibs.or.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 159 Subject: [irex 159] NE definition Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 8757 木田さん: NE定義についての問題提起ありがとうございます。 # ちなみに、CRL固有表現データ作成時では時間の関係上、 # 作成者間で相談する事はなしに、木田さんのデータと私の # データを私が比較しながら最終的には独断で判断しました。 御指摘の点は非常に難しい物です。3月の言語処理学会年次大会で 江里口さんと共著で「固有表現定義の困難さ」という論文を発表 しますが、そこに同様の問題の指摘があります。 # この論文は、IREX参加者への謝辞もありますし、このメイリング # リスト内の方には予めお送りしても問題ないと思いますので、 # 次のメイルでお送りします。本来は提出前に皆さんと議論できたら # 良かったのですが、提出期限の関係上できませんでした。すみません。 さて、 > (疑問点1)「大統領」「首相」「首都」と「天皇」「ローマ法王」 > > * 「大統領」「首相」のように、普通にはそれだけでは役職を指す > > > ような名称にはOPTIONAL 3を適応しない。「天皇」「ローマ法皇」 > > > のように普通にそれが人を指す場合に限る。 > > > > * 「首都」というのは、照応とみなす。 > この部分が気になります。 > 私の感覚では、「天皇」「ローマ法王」にOPTIONAL3を振ってよいのなら、 > 「大統領」「首相」にもOPTIONAL3を振ると考えたくなります。 > 同時に、特定の場所を表すことになる「首都」もOPTIONAL3としたく > なります。 > すべてにOPTIONAL3を適用する or すべてにOPTIONAL3を適用しない > だと理解できるのですが。 はい、論文でも一番大きく取り上げている「表記と意味」の関係です。 「表記」というのは、文脈がなくてもその表記だけで固有だと分る場合のみ 固有表現とするという事で、この場合は木田さんの指摘では「すべて適用し ない」に該当します。「意味」というのは、表記上は固有ではないけれど (例えば普通名詞)、その意味は固有であるという判断基準です。これは 木田さんの指摘では「すべてを適用する」という事になります。 「意味」を基準にしてしまった場合には、正解作成は非常に難しくなる と考えられますし、照応もすべて取らなければならなくなります。 例えば、「大統領」だけではなく「彼」という表現も固有である事が あるでしょうし、「彼の買った車」の「車」も固有の物となります。 したがって、組織、人名、地名、固有物名の場合には、あまり意味で 判断したくないという事になります。(論文にあるように、時間表現では 逆になりますが。) という基準からすると、大統領、首相、首都といった表現はすべて 固有表現ではないとします。ただ、問題なのは「天皇」の場合です。 > 「天皇」も「首相」も >   ・役職名がそのまま特定の人を表す > という点では同類のように思います。 天皇の場合には、新聞記事の最初から「天皇」という言葉がそのまま 使われ、「裕仁天皇」「昭和天皇」というような表現はされません。 (私は現在の天皇の「裕仁」に対応する名称すら知りません。) それに対し、首相、大統領の場合には、いかに日本の首相であれ 新聞記事の最初から「首相」と始まる事はほとんどありません。 (少なくとも「首相の一日」のような特殊な場面を除いては不自然に 感じます。)したがって、このような理由から「天皇」は人名であるという 性格が強いと判断できると思います。また、「天皇」という表現でも、 それが特定の人を表わすのではなく、あきらかに役職名である 場合には、OPTIONALは付けされません。 DRY_RUNのデータに以下のようなのがあります。 ローマ法王クロアチア入り  ローマ法王ヨハネ・パウロ2世10日.... 前者の「ローマ法王」は人を指していますが、 後者の「ローマ法王」は役職名であるので、「ローマ法王」ではタグ付け しないで、「ローマ」だけをLOCATIONとしてタグ付けしています。 したがって、(ちょっと横道かもしれませんが)、 >  (1)玉音放送に臨んだ【天皇】は、〜 > (2)【天皇】の崩御によって、明治時代は幕を閉じた。 > (3)いわば終戦のために組閣された内閣の【首相】であった彼は、〜 > (4)女性問題で【首相】が退陣とは情けない。 (3)(4)ではどちらにしろ、役職としての「首相」であると思えるので 私はタグ付けしません。(2)は怪しい所ですね。(前の文章を見ないと なのも言えません。) > 第二に、「天皇」「ローマ法王」はある時間軸においては一名である > という点では、「首相」「大統領」よりも確実に、 > 「そのまま特定の人を表」します。 > けれど、新聞記事の場合、必ずしも時間軸は一つではありません。 > 実際に昔の天皇が出現している文が二文ありました。 > (5)新春恒例の「小倉百人一首かるた競技第四十一期名人位、 > 第三十九期クイン位決定戦」が七日、百人一首の一番札を > 詠んだ【天智天皇】ゆかりの近江神宮で開かれた。 > (6)【後陽成天皇】の生母である新上東門院は、少女の時から >    阿国をひいきにしていたともいう。 > これらの文に続いて「天皇」が出てきた場合は、 >   天皇=天智天皇 >   天皇=後陽成天皇 > になります。 確かにこの例では、「照応はタグ付けしない」という規則と衝突します。 ただ、「天皇」はOPTIONALであるという事なので、各システムが どのような結果を出そうとも、評価には関係されません。 したがって、このような場合にもOPTIONALとしておきたいと思います。 他の方とも個人的に同様の議論をしており、では、 「ローマ法王」がいいのなら「アメリカ大統領」もタグ付けべきだ という指摘を受けています。非常に悩ましい所ですが、 「ローマ法王」は慣用的な表現である (Decompositionできない。つまり ローマという地域を支配している法王ではない)のに対してアメリカ大統領 は「アメリカの大統領」であり、「大統領」は(文字通りの)明かな役職名 であるという事から、このふたつは異なると判断できると思います。 という事で、現状通り 「天皇」「ローマ法王」は人が指されている場合にはOPTIONAL 「首相」「大統領」「首都」はタグ付けなし としたいと思います。 > (疑問点2)「A、B両○○」の扱い > 「A、B両○○」でしょうか? > 「B両○○」でしょうか? > 私としては、前者を支持したいです。 はい、私もCRLデータ中の木田さんが例示してくれた例においては 前者を支持しますし、定義文にある以下の規約からそのような定義で あると思っています。 「部分的な並列表現で分割すると違った意味を生んでしまう場合には 分割しない」 > 「両国」 > とあります。 > そして、「両」に関しては、これ以外に明記されている部分は > ないようです。 定義にこの例しかないのは残念ですが、この例に関しては別の問題が あります。 つまり、 1. 日本は日本国でありその最後の「国」の部分が、韓国の「国」と いう部分と共通化され「両国」となっているのか? それとも、 2. 「木田、関根両人とも」というような表現のように「両○」の○の部分は それぞれに共通なクラスを利用して言い直しているだけなのか? という問題です。「日韓両国」の場合には、後者を支持する理由として 「イタリア、フランス両国」というのが挙げられます。この場合には 一般的に「イタリア国」「フランス国」とは言いませんし、分割しても 意味は変りませんので分割してもいいという判断になると思います。 (つまり、イタリアフランス両国です) 「日韓両国」の場合には「韓国」の「国」と「両国」の「国」が 重複しているので悩ましいですが、「イタリア、フランス両国」との 整合性から、「日韓両国」は ((日本)-(韓国)・両国) であり、 > この場合、タグ付けされたものの構造は、 >   ((A−B)円) > になります。 >   ((A)−(B円)) > にはなりません。 の両方とも異なると考えられると思います。 > 「両」の方も構造から考えて、公開データにあるように、 >   上下両院は、((A−B)両院) > にした方が、全体として整合性がとれるように感じます。 つまり、「上下両院」の場合には「上院」「下院」であるので、 両院 としても 下両院 としても意味が変ってしまいます。したがって 上下両院 とします。 省略とも言えない事もないですが、すぐに「院」という表現があり、 これは前に書いたクラスの表現というより、「上院」「下院」の「院」を 共通化して記述したという事だと思います。 という事で、こちらも現状のままで納得していただけますでしょうか? (CRLデータにあるような「両」の例を定義に加え、説明を付け足します。) 関根  1, filed,, Summary-line: 15-Feb to: irex@karc.crl.go.jp #[irex 160] NLP-99 paper Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id SAA09974 for ; Mon, 15 Feb 1999 18:38:24 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id SAA02119 for ; Mon, 15 Feb 1999 18:40:23 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id IAA08654; Tue, 16 Feb 1999 08:34:38 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id IAA12371; Tue, 16 Feb 1999 08:34:36 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id IAA03064; Tue, 16 Feb 1999 08:29:09 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id IAA03059 for ; Tue, 16 Feb 1999 08:29:08 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id IAA08883 for ; Tue, 16 Feb 1999 08:28:18 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id IAA12366 for ; Tue, 16 Feb 1999 08:34:31 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id IAA25632 for ; Tue, 16 Feb 1999 08:28:04 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id LAA10635; Mon, 15 Feb 1999 11:28:33 -0500 (EST) Date: Mon, 15 Feb 1999 11:28:33 -0500 (EST) From: Satoshi Sekine Message-Id: <199902151628.LAA10635@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 160 Subject: [irex 160] NLP-99 paper Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 17948 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Mon, 15 Feb 1999 11:28:33 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 160 Subject: [irex 160] NLP-99 paper Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 17948 IREX-ML member: This is our paper submit to Annual meeting of Natural Language Processing (Japan) which will be held on March. (This is accepted as a poster presentation. Please encourage the speeker (Mr.Eriguch) at the meeting!!) Commnets are welcome. Satoshi Sekine --------- \documentstyle[twocolumn]{jarticle} \pagestyle{empty} \setlength{\textwidth}{170mm} \setlength{\textheight}{240mm} \setlength{\oddsidemargin}{-5mm} \setlength{\evensidemargin}{-5mm} \setlength{\columnsep}{8mm} \setlength{\topmargin}{-10mm} \title{固有表現の定義の困難さ \\ -- IREXにおけるNE定義の事例から --} \author{ 関根聡 \\ New York University \\ {\tt sekie@cs.nyu.edu} \\ \and 江里口善生 \\ (株)NTTデータ 情報科学研究所 \\ {\tt eriguchi@lit.rd.nttdata.co.jp} \\ } \date{\hspace{1cm}} \begin{document} \maketitle \thispagestyle{empty} \section{イントロダクション} 組織名、人名、地名、商品名のような固有名や、時間表現、数値 表現は新聞記事などの文章を理解するためにキーになる要素である。 それらを自動的に認識し、分別することは自然言語処理の第一段階と して非常に有効であると考えられる。 その技術を目的としたコンテストも企画されている(IREX) \cite{irex:homepage}。 しかしながら、固有表現を定義すること自体、 非常に難しい問題を含んでいる。 (この論文では、固有名、時間表現、数値表現をまとめて 固有表現と呼ぶ。) この問題には、意味やプラグマティックスの問題も含まれ、 人によっても異なる判断が得られる場合もある。 本論文では、IREXにおける固有表現の定義を簡単に紹介し、 そこで特に問題になった点について詳しく述べ、 固有表現について考察を試みる。誌面の都合上、 定義などは簡略化してあるが正式な定義やメイリングリストにおけ る議論などはIREXのホームページ\cite{irex:homepage}にあるので 参照されたい。 \section{MUC, MET, IREXの歴史と固有表現} 固有表現(Named Entity)抽出という課題は、 米国の情報抽出のコンテストであるMessage Understanding Conference (MUC)の1996年に行なわれた第6回目のコンテストで 導入された \cite{muc6:proceedings} \cite{grishman:coling96}。 背景には、イベント情報などの情報抽出という課題において、 抽出するための知識(辞書、文型パターン等)を 対象タスク(企業合併、人事異動など)に よって作成しなおさなければいけないという問題点があった。 この問題に対処する為、固有表現抽出という課題が対象タスクに 依らないサブコンポーネントとしての位置付けで作られた。 MUCは主に英語を対象にしているが、 それから派生したMultilingual Entity Task (MET)は、 日本語をはじめ、いくつかの言語を対象とした固有表現抽出の コンテストで、MUC6,7と並行して MET-1,2が開かれた\cite{muc:homepage}。 この流れを汲んで、 日本でも独自のコンテストを開く気運が広まり、 1999年4,5月に行なわれる Information Retrieval and Extraction Exercise (IREX)の1課題として、 固有表現抽出の課題が設定された。 MUC, MET, IREXにおいて、固有表現の定義は参加者の議論や、 コンテストの意図で変ってきているが、新しいコンテストにおける 定義は過去の定義を踏台にしており、 この3つのコンテストはひとつの流れとして捉えられる。 この論文ではIREXにおける固有表現定義に基いて議論をするが、 より興味のある読者にはMUC, METを参照されることを薦める。 \section{固有表現の種類} IREXでは、固有表現の種類として以下の8種類を用意した。 MUC,METでは7種類であるが、商品名等の固有物名(ARTIFACT)を追加した。 また、役職名も導入しようという意見もあったが、今回は見合わせた。 他にも、イベント、固有の事の名前などの 新たな種類の固有表現も考えられる。 \begin{flushleft} \underline{固有名詞的表現} \end{flushleft} \begin{itemize} \item 組織名(ORG) \\ 複数の人間で構成され、共通の目的を持った組織等の名称である。 株式会社等の会社、固有の政府組織、学校、軍、スポーツチーム、 国際組織、労働組合、工場、ホテル、空港、病院、教会やなんらかの 目的を持ったグループ等もその対象が組織としての意味で使われている文 脈においては組織名とする。 \item 人名(PERSON) \\ 固有の人を指す名前。 \item 地名(LOC) \\ 固有の場所を指す名称。 大陸、国名、地域名、都市名、地方名、県名、町名、村名、道路名、 住所、駅名、線路名、モニュメント、海洋名、湾、運河、川名、池名、湖名、 島、公園、山、砂漠の名前などを含む。 \item 固有物名(ARTIFACT) \\ 人間の活動によって作られた具体物、抽象物を含む固有の物の名称。 \end{itemize} \begin{flushleft} \underline{時間表現} \end{flushleft} \begin{itemize} \item 日付表現(DATE)、時刻表現(TIME) \\ 時間表現では、絶対的な表現(1999年2月1日など)や,基点が明確であり絶 対的な時間が分るような相対的な表現(昨日など)を抽出する。 日付表現は、その単位が24時間以上である物を指し、時刻表現は、 その単位が24時間以下であるものを指す。 \end{itemize} \begin{flushleft} \underline{数値表現} \end{flushleft} \begin{itemize} \item 金額表現(MONEY) \\ 金額を表わす表現。 \item 割合表現(PERCENT) \\ 割合を表わす表現。 \end{itemize} また、IREXでは、定義上どの種類の固有表現となるか判断が 難しい物や固有表現の認定が難しい物などをOPTIONALとして、 コンテストの際には評価対象から除いた。 データ中ではこれらの固有表現にはSGMLのタグが付与されており、 データは例えば以下のようになっている。 (それぞれ、上記の説明で括弧内にあるタグを該当文字列の 先頭と最後に振っている。) \begin{verbatim} 今年関 空効果で大阪への観光客 は前年3割 増しと予想されている。 \end{verbatim} \section{固有表現の定義と問題点} 前述のように固有表現というものを定義し、その種類を定めた。 これらの定義に基づけば、問題なく文章中の固有表現を 同定できそうであるが、実際にデータをみてみると 一筋縄ではいかない色々な問題が発見された。 以下に、その内の重要なものについて紹介し、 固有表現というものについて考察してみる。 本論文では、固有表現定義における問題点を具体的に挙げ、 そこには本質的な難しさが存在するということを主張する。 実際のIREXでの定義は極力触れないので、 興味のある方にはIREXホームページを参照していただきたい。 \subsection{表記か意味か} 「固有の物の表現」というと、固有名詞が連想される。 しかし、固有名詞だけが固有の物の表現ではない。 例えば、「ニューヨーク大学」は固有名詞であり、 「大学」は普通名詞である。単語だけで考えた場合は、これに疑問の余地は ないが、実際の文章では照応等で「大学」という表現を利用して、 「ニューヨーク大学」を指しているという場合がある。 (例文「ニューヨーク大学の紹介。大学はマンハッタンの中心部にあり、…」) したがって、意味的には、または文脈に基づけば、この「大学」も 「固有の物の表現」であると言える。 つまり、表記だけで固有表現を定義するとすると、「大学」は 固有表現にはならないが、意味に基づくと「大学」も固有表現にも なることがあると言える。 固有表現を定義する際に、「表記に基づくか」と「意味に基づくか」 という基準は連続的であり、 それらの中間的な表現も存在する。 例えば、普通名詞と思われる「国会」がそうである。 「国会」は、日本という限定を置けば、ひとつしか存在しない。 したがって、普通名詞といえども、文脈を使用しないでも、 ほぼ固有の物の表現と言える。 より困難な例は、「県議会」「都議会」である。 日本には県は43あるが、都はひとつしかない。 「県議会」は、文脈がないと固有のものかどうかは判断できないが、 「都議会」は、文脈なしで(世界知識と表記だけで)固有のものと 判断できる。 ここまでくると、文脈はもとより世界知識といった物が 必要となってきており、客観的な基準を作成しようとする際に 非常に重要な問題を投げかける。 つまり、世界知識は個人によって異なるため、 客観的な定義は不可能だという結論になる。 \subsection{表記か意味か:その2} 固有名の認定の場面だけではなく、 固有名の種類を決定する場合にも、表記によるか意味によるか という問題が生じる。 \begin{verbatim} アメリカの圧力, 永田町の決断 \end{verbatim} これらの表現は、表記上は地名であるが、その意味はアメリカ政府や 日本政府といった組織である。 特に、新聞記事では国名などの地名がこのような形で使用されることは多い。 文章を理解するためのキーになる要素として固有名をとらえる場合は、 意味を基準に判定する方がよいと思われる。 しかし、意味には、読者個人的な概念背景や文脈も影響するため、 全ての人が同じ判定を下せるような定義を作るのは難しい。 \subsection{表記か意味か:その3} IREXの定義では、時間表現は、絶対的な時間軸における時が分るような 時間表現としている。 固有名詞の場合と違い、普通名詞のみで書かれている場合もあるため、 表記だけで判断するというのは困難であり、もともと 意味に基づいて定義をする必要がでてくる。 例えば、「夏」や「年」という文字があっても、 それがある特定の夏や年を指している場合には、 それを時間表現としなければいけないが、そうでない場合も存在する。 「夏」には少なくとも、 「ある特定の夏 (例:1999年夏)」という意味と、 「クラスとしての夏(例:夏は暑いものだ)」という意味がある。 後者の「夏」は特定の時間を指すものではないため、 時間表現ではない。 したがって、このような表現では 表記ではなく、意味のレベルで分ける必要があった。 \subsection{固有名から普通名詞への変化} 新しい商品が開発された時に付けられる名前は 固有名であるというのは、ある程度曖昧性なく判断できる。 しかし、その商品が広く売れて、その商品名が一般名詞的に使われ ることがよくある。「ウオークマン」は典型的な例である (その他、セスナ、エレクトーン、ラジコン、セロテープ、セメダイン等 ある)。 本来はソニーが作った特定の商品の名前であるが、一般的には、 製造メーカーにこだわらず、 スピーカーの付かない小型のカセット再成機やラジオなどが この名前で呼ばれる。 英語でも「bath (風呂)」のように、現在は完全な普通名詞として 使用されている物も、語源まで辿ると 実は固有名詞である場合もある。 このように、固有名詞と普通名詞には、時間軸に沿った 連続性が考えられる。 しかし、固有表現を定義する際には、 このような語源まで考えるのは意味があるとは思えない。 また、現実的に語源の知識は調べない限り、知り得ないという場合が 多いので、 ユニークに定義するのは困難である。 \subsection{商品名とクラス名} 辞書によると、固有名詞とは「同じクラスにある別々の物を 指すためのラベル」とある。 しかし、特に商品の名前などに顕著であるが、クラス自体も固有的な 性格を持つ物であったり、クラスが階層的になっている場合には どの部分を持って固有表現とすればいいか判断が非常に困難な場合がある。 例えば、「トヨタ車」「カローラ」「カローラセダン」 「カローラセダンSE-Saloon」または、「各車についている車体番号」 のどこまでを商品名としてよいかを明確に定義するのは困難な問題である。 \subsection{部分表現の扱い} 英語の場合と異なり、日本語では単語の間にスペースがないので、 表現の範囲も曖昧になっている。 例えば、「来日」という表現において、「日」というのは「日本」の ことであるので、固有表現としたいという立場と、 「来日」はひとつの単語と見倣せるので、その内部の表現は 固有表現としたくないという立場がある。 後者は、辞書にある表現なら単語とする、というような 人工的な規則を作るとある程度は納得のできる定義になるが、 例えば、「来日」が辞書にあったとすると、 その同類の表現で「在エジプト」の場合の「エジプト」は どうずべきかといった問題がでてくる。 逆に部分表現でも固有の物を指す表現はすべて 固有表現とすれば問題がないかというと反例も出てくる。 「オーデコロン」の「コロン」は地名に由来するが、 この「コロン」を固有表現として抽出するのに意味があるか 疑問である。 同様に、「日本語」「英語」や「フランス料理」の部分を地名として 説明するのは、語源まで遡ることに類似しており難しい。 \subsection{照応、省略形} 今回のコンテストでは、照応表現は抽出しないものとした。 (これは、MUCにおいて照応が別の課題として設定されていることに 少なからず関係している。) 代名詞等を固有表現とすると、最初に提起した「表記と意味」の議論に おいて、意味に基づく固有表現定義の極端な例となる。 また、日本語の照応にはゼロ代名詞など 難しい問題が存在することも問題を複雑にしている。 新聞記事において、会社名などの組織名が正式な名前で 出ているのは、せいぜい最初の1回目だけということが多い。 また、「北朝鮮」は「朝鮮民主主義人民共和国」が正式名であるが 新聞記事においてこの正式名はあまり使用されない。 また、文脈が進んでいくにつれ「北」だけで北朝鮮を指す場合もある。 これらは、単なる省略形として判断すべきなのか照応なのか 判断が難しいところ である。 \subsection{抽象物、物と事} 固有物名には、抽象的な物も含むとした。 しかし、抽象的な物は、人間が目で見ることができないという 理由により、客観的な定義はなかなか難しい。 抽象的な物を説明する為に、たとえば、著作権、知的所有権が 主張可能であるような物を固有物として定義するという方法がある。 それによれば、作品名、出版物、成果物はかなりカバーできる。 しかし、法律名、法案名、条約名、学説名や俗説名、 制度、税の名前のようなものは、どのように判断していいか難しい。 関連する議論としては、「物」と「事」の境が曖昧であるという 問題もある。 名詞には大雑把に「物」と「事」があるとされている。 「物」は静的に存在する物であり、 「事」は動的な叙述内容の表現である。 今回のIREXでは、「固有な事」というのは判断が難しいため、 課題として取り上げるのを諦めた。 しかし、商品名を始めとする固有な物を定義する際には 物と事の境が問題になってくる。 例えば、以下のリストでは、どれが「物」であり、 どれが「事」であるかという判断は 人によって異なると思われる。 \begin{verbatim} 本の題名、ビデオの題名、テレビ番組名、講演名、会議名、集会名、戦争名 \end{verbatim} \underline{サービス名} これも抽象的な物の名称であるが、商品名において 商品がサービスである場合に、そのサービスの名前が 明確でない場合も多い。 「雪見だいふく」という商品の場合には、 その物が具体物であり、手に取って見せることができるのも手伝って、 それを固有物名と言うのは難しくないように思える。 しかし、6:00東京発の「のぞみ1号指定席券:7号車:座席番号23A」を 買った場合に、 そのサービスの名前(または商品名)が何であるかを決めるのは容易でない。 \underline{ニックネーム} ここで議論するニックネーム(愛称、別称)に関する問題 は時間表現に限った物ではないが、特に時間表現において 顕著に見られるので、それを題材として説明する。 例えば、1999年2月1日というのは、 幅広い人が理解できる絶対的な表現と言える (もちろん、本質的には限定的、相対的である)。 また、江戸時代という時間に関するニックネームも 日本の一般的教育を受けた人間なら特定の時間表現として認識できる。 しかし、ニックネームは慣用的な表現であり、 その有効範囲は幅広いとは限らない。 例えば、「母の日」というニックネームの類似物として 「義母の日」という日が存在する。 この由来は著者には不明であるが、 これを一般的な時間表現であるとするには抵抗がある。 また、より限定された例では、 「燃えないゴミの日」といった物もある。 これらは、明らかに限定的であるが、時間表現には代りない。 どの程度、慣用的であるか、流布しているは 主観的に決定せざるを得ない。 \section{考察} 固有表現の定義はこれまでの例でも分るように 曖昧性を含み難しい問題である。 これらの問題は実際にデータを作成する過程を通して広く見付けられた。 個人によっても揺れるし、文脈等に強く依存する。 最終的には主観的に決めざるを得ない部分がある。 したがって、明らかにIREXの定義は単なるひとつの切口でしかない。 抽出された固有表現の使用目的を限定する ことによって定義の曖昧性をかなり減らせると考えられる。 例えば、日本の要人の動きを知りたいという目的であれば、 「天皇の訪米」における「天皇」は人名として扱うべきである (天皇は役職名とも考えられるので、IREXの定義ではOPTIONAL)。 ただし、定義を明確にしたいがために単に目的を絞っていいかというと、 技術の汎用性や応用分野の幅を維持するという観点との バランスが必要であると考えられる。 また、数多くの団体が参加するコンテストにおいて、あまりに限定された 課題や目的を設定することが妥当かどうかという問題がある。 つまり、固有表現抽出を独立したコンテストにするという立場においては なるべく汎用的な定義を作成することは意味があるものと考えている。 ただし、MUCのように、対象を限定した情報抽出の一部という位置付けとして、 特定の目的や分野での固有表現抽出という課題も考えられるし、IREXでは その種類の課題も作成している。 \section{謝辞} IREX参加者ならびに固有表現定義の議論に参加してくださった方に 感謝する。特に、沖電気の福本氏、富士通研究所の落谷氏、 松下電器の野口氏、NECの竹元氏、東京大学の野畑氏、 通総研の井佐原氏、内元氏には、貴重な意見をいただいた。 \begin{thebibliography}{99} \bibitem{irex:homepage} IREX homepage: http://cs.nyu.edu/cs/projects/\\proteus/irex/ \bibitem{muc6:proceedings} Message Understanding Evaluation and Conference {\it ARPA, Morgan Kaufmann Publishers} You can place your order through SAIC's MUC homepage (below) \bibitem{grishman:coling96} Ralph Grishman, Beth Sundheim: ``Message Understanding Conference - 6: A Brief History'' {\it COLING-96} \bibitem{muc:homepage} MUC homepage: http://www.muc.saic.com/ \end{thebibliography} \end{document}  1, filed,, Summary-line: 16-Feb eriguchi@lit.rd.nttdata.c #[irex 161] NE definition Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id BAA13657 for ; Tue, 16 Feb 1999 01:51:01 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id BAA08934 for ; Tue, 16 Feb 1999 01:53:07 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id PAA14053; Tue, 16 Feb 1999 15:47:50 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id PAA28300; Tue, 16 Feb 1999 15:47:49 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id PAA08607; Tue, 16 Feb 1999 15:42:22 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id PAA08602 for ; Tue, 16 Feb 1999 15:42:18 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id PAA09213 for ; Tue, 16 Feb 1999 15:41:28 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id PAA28291 for ; Tue, 16 Feb 1999 15:47:41 +0900 (JST) Received: from ms.nttdata.co.jp (ms0.nttdata.co.jp [163.135.193.231]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id PAA03208 for ; Tue, 16 Feb 1999 15:47:40 +0900 (JST) Received: from mx0.nttdata.co.jp (mx0.nttdata.co.jp [163.135.10.11]) by ms.nttdata.co.jp (8.8.8/3.6W-NTTDATA-TOP-09/17/98) with ESMTP id PAA21767 for ; Tue, 16 Feb 1999 15:47:39 +0900 (JST) Received: from pluto.rd.nttdata.co.jp ([163.135.16.10]) by mx0.nttdata.co.jp (8.8.5/3.5Wpl4-mx0/98091611) with ESMTP id PAA07861 for ; Tue, 16 Feb 1999 15:47:38 +0900 (JST) Received: from mail.lit.rd.nttdata.co.jp (litchi.lit.rd.nttdata.co.jp [163.135.200.130]) by pluto.rd.nttdata.co.jp (8.9.0/3.6W) with ESMTP id PAA10918 for ; Tue, 16 Feb 1999 15:47:37 +0900 (JST) Received: from pittsburgh.lit.rd.nttdata.co.jp (pittsburgh.lit.rd.nttdata.co.jp [163.135.200.135]) by mail.lit.rd.nttdata.co.jp (8.8.8+Sun/3.6W-lit-server-05/22/98) with SMTP id PAA29304 for ; Tue, 16 Feb 1999 15:47:37 +0900 (JST) Received: by pittsburgh.lit.rd.nttdata.co.jp (4.1/3.5W-lit-client-10/22/96) id AA05309; Tue, 16 Feb 99 15:46:02 JST Date: Tue, 16 Feb 99 15:46:02 JST From: Yoshio Eriguchi Message-Id: <9902160646.AA05309@pittsburgh.lit.rd.nttdata.co.jp> To: irex@karc.crl.go.jp In-Reply-To: Satoshi Sekine's message of Mon, 15 Feb 1999 11:23:05 -0500 (EST) <199902151623.LAA10631@noreen.cs.nyu.edu> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 161 Subject: [irex 161] NE definition Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 5346 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Tue, 16 Feb 99 15:46:02 JST From: Yoshio Eriguchi To: irex@karc.crl.go.jp In-Reply-To: Satoshi Sekine's message of Mon, 15 Feb 1999 11:23:05 -0500 (EST) <199902151623.LAA10631@noreen.cs.nyu.edu> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 161 Subject: [irex 161] NE definition Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 5346 NTTデータの江里口です。 木田さんの疑問点に関する関根さんの回答の補足です。 OPTIONALの使用法について意識合わせをしたくて補足いたしました。 もし、食い違いがあれば教えて下さい。 > > (疑問点1)「大統領」「首相」「首都」と「天皇」「ローマ法王」 > > > * 「大統領」「首相」のように、普通にはそれだけでは役職を指す > > > > ような名称にはOPTIONAL 3を適応しない。「天皇」「ローマ法皇」 > > > > のように普通にそれが人を指す場合に限る。 > > > > > > * 「首都」というのは、照応とみなす。 > > この部分が気になります。 > > 私の感覚では、「天皇」「ローマ法王」にOPTIONAL3を振ってよいのなら、 > > 「大統領」「首相」にもOPTIONAL3を振ると考えたくなります。 > > 同時に、特定の場所を表すことになる「首都」もOPTIONAL3としたく > > なります。 > > すべてにOPTIONAL3を適用する or すべてにOPTIONAL3を適用しない > > だと理解できるのですが。 OPTIONALの導入はもともと、どちらにするか判断つかないものを OPTIONALとし、評価に影響を与えないようにすることが目的です。 正解作成者の判断基準の個人差を吸収するために導入されたと思 います。 したがって、本来はコンテストの参加者はOPTIONALのことは全く 意識する必要はなく、それ以外の定義を把握していれば問題はな いはずだと思います。 しかし、正解作成者の場合は、他の人が作った正解データの整合 性をとるために、なんらかの基準が欲しくなるというのも事実 です。私も試験データを作る時に困っていました。 しかし、OPTIONALの導入が正解作成者が判断がつかない場合に 付与するという原点に戻れば、基本的にはOPTINALがない定義で タグをつけ、どうしても判断がつかない場合にOPTIONALをつける というスタンスであれば良いのではと現在は思っています。 おそらく、OPTIONALがなければ、「大統領」、「首相」という表記 が文脈的に固有の人を指してある場合は、定義書の「普通名詞を利 用した照応表現」に該当するため、PERSONのタグをつけないことは 迷いがないと思います。 #ここの、「迷いがない」という仮定が成り立たない場合は、 #この議論は成り立たなくなりますが。。 それに対し、「天皇」、「ローマ法王」などは、人によって、固有 名と判断するか役職名であると判断するかは意見が分かれるところ だと思います。定義をみても(OPTIONALの項目を除く)、どちらと も判断が付けられないと思います。 上記の理由により、関根さんが決断をくだしたように >「天皇」「ローマ法王」は人が指されている場合にはOPTIONAL >「首相」「大統領」「首都」はタグ付けなし でよいと思います。 #実は「首都」は、この問題とはまったく関係ない問題と認識して #います。個人的には状況によってはLOCATIONとすべきだと思って #います。ただ、定義で明確に首都はタグ付けしないとかかれてい #るので、混乱をさけるためIREX-1ではタグなしで統一したいと思 #います。 木田さんの疑問点2に関しましては、関根さんの説明とまったく 同じ認識をもっています。 >「部分的な並列表現で分割すると違った意味を生んでしまう場合には >分割しない」 木田さんの疑問点のおかげで、この定義文の意味するところがクロー ズアップされ、良かったと思います。 指摘されてから読み返すと、皆さんが意識されていたか疑問に思って しまいましたので。 ここから先は個人的な思いです。 定義作成のときに痛切に感じたのは、どこかで線引きをしようとし ても、その線では分けられない名称が存在するということでした。 その場合に、曖昧な名称をなくそうとして線の位置をどちらかにず らしてやると、いつの間にか、本来引きたかった線とは書けはなれ たところに線ができている気がします。 #固有物名に関しては、個人的には当初抽出したかったものとかけ #はなれた定義になっているのではと思っています。 #たぶん最初は、製品名を抽出したいだけで、条約名などを抽出し #ようとは思っていなかったと思います。 #一生懸命一意に決まる定義を作ろうとした結果なんですが。。。 OPTIONALは明確な線を引けないものを救済するためだけのものではなく、 一意に決めたことにより、本来抽出したかった名称以外のものを抽出 することをなくすためのものだと思っています。したがって、OPTIONAL に無矛盾を求めると、線引そのものがおかしくなると思っています。 関根さんの指摘にもありますが、「大統領」もOPTIONALにするのであ れば、「彼」はどうなるのと、新たに線引きの問題がでてきて、それ らの問題を解決しようとすると、極論ではありますが、全ての名詞に タグつけをすることになりかねません。 参加者向けの定義書には、OPTIONALについての定義は導入すること、 OPTIONALの記号の意味を説明する程度で、しっかりと定義を公開し ないほうがよかったのではないかと、現況ではおもっています。そ れは、参加者から天皇がOPTIONALなら大統領もOPTIONALにすべきで はないかというクレームがつくのではないかと危惧しているためで す。そのような状況がおきると、OPTIONALを導入した意味が全くなく なり、むしろOPTIONALを導入しない方が、正解データが利用しやすく (機械学習用のデータとして利用する場合など)て、よかったのでは ないかと思い悲しいです。 そういった意味で、 >「天皇」「ローマ法王」は人が指されている場合にはOPTIONAL >「首相」「大統領」「首都」はタグ付けなし にすべきだと思っています。 ^^^^^^ -- Eriguchi  1, filed, answered,, Summary-line: 16-Feb akida@ibs.or.jp #[irex 162] Re:NE definition Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id DAA14024 for ; Tue, 16 Feb 1999 03:28:04 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id DAA09542 for ; Tue, 16 Feb 1999 03:30:10 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id RAA15313; Tue, 16 Feb 1999 17:20:09 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id RAA02156; Tue, 16 Feb 1999 17:20:07 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id RAA09876; Tue, 16 Feb 1999 17:14:41 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id RAA09870 for ; Tue, 16 Feb 1999 17:14:40 +0900 (JST) From: akida@ibs.or.jp Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id RAA09300 for ; Tue, 16 Feb 1999 17:13:50 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id RAA02151 for ; Tue, 16 Feb 1999 17:20:03 +0900 (JST) Received: from IBSGATE.ibs.or.jp (firewall-user@ibsgate.ibs.or.jp [203.180.86.3]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id RAA05033 for ; Tue, 16 Feb 1999 17:20:01 +0900 (JST) Received: by IBSGATE.ibs.or.jp; id RAA28813; Tue, 16 Feb 1999 17:19:18 +0900 (JST) Received: from unknown(100.1.200.101) by IBSGATE.ibs.or.jp via smap (V3.1) id xma028792; Tue, 16 Feb 99 17:19:11 +0900 Received: from ccMail by dell.ibs.or.jp (ccMail Link to SMTP R8.00.02) id AA919214113; Tue, 16 Feb 99 17:15:16 +0900 Message-Id: <9902169192.AA919214113@dell.ibs.or.jp> X-Mailer: ccMail Link to SMTP R8.00.02 Date: Tue, 16 Feb 99 17:21:08 +0900 To: MIME-Version: 1.0 Content-Transfer-Encoding: 7bit Reply-To: irex@karc.crl.go.jp X-Sequence: irex 162 Subject: [irex 162] Re:NE definition Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset=ISO-2022-JP Content-Length: 5498 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f From: akida@ibs.or.jp X-Mailer: ccMail Link to SMTP R8.00.02 Date: Tue, 16 Feb 99 17:21:08 +0900 To: MIME-Version: 1.0 Content-Transfer-Encoding: 7bit Reply-To: irex@karc.crl.go.jp X-Sequence: irex 162 Subject: [irex 162] Re:NE definition Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset=ISO-2022-JP Content-Length: 5498 メールをありがとうございます。IBSの木田です。 先に結論ですが、疑問点については二つとも現状のままで納得です。 > > (疑問点1)「大統領」「首相」「首都」と「天皇」「ローマ法王」 > > すべてにOPTIONAL3を適用する or すべてにOPTIONAL3を適用しない > > だと理解できるのですが。 > > はい、論文でも一番大きく取り上げている「表記と意味」の関係です。 > 「表記」というのは、文脈がなくてもその表記だけで固有だと分る場合のみ > 固有表現とするという事で、この場合は木田さんの指摘では「すべて適用し > ない」に該当します。「意味」というのは、表記上は固有ではないけれど > (例えば普通名詞)、その意味は固有であるという判断基準です。これは > 木田さんの指摘では「すべてを適用する」という事になります。 > > 「意味」を基準にしてしまった場合には、正解作成は非常に難しくなる > と考えられますし、照応もすべて取らなければならなくなります。 > 例えば、「大統領」だけではなく「彼」という表現も固有である事が > あるでしょうし、「彼の買った車」の「車」も固有の物となります。 > したがって、組織、人名、地名、固有物名の場合には、あまり意味で > 判断したくないという事になります。(論文にあるように、時間表現では > 逆になりますが。) > > という基準からすると、大統領、首相、首都といった表現はすべて > 固有表現ではないとします。ただ、問題なのは「天皇」の場合です。 普通名詞と思われる「天皇」や「ローマ法王」がOPTIONALになって いるのは、「意味」で判断しているからだろうと思っていました。 #「天皇」や「ローマ法王」は普通名詞だと思いこんでいたのが #混乱の始まりだったのかもしれません。 ならば「大統領」「首相」「首都」にもタグ付けすべき、 これらにタグ付けしないなら「天皇」「ローマ法王」にもタグ付け すべきではない、と考えていました。 「天皇」「ローマ法王」は人が指されている場合にはOPTIONALについては、 この説明↓で納得できました。 > 天皇の場合には、新聞記事の最初から「天皇」という言葉がそのまま > 使われ、「裕仁天皇」「昭和天皇」というような表現はされません。 > 「ローマ法王」は慣用的な表現である (Decompositionできない。つまり > ローマという地域を支配している法王ではない)のに対してアメリカ大統領 > は「アメリカの大統領」であり、「大統領」は(文字通りの)明かな役職名 > であるという事から、このふたつは異なると判断できると思います。 天皇もローマ法王も、世界に一人しかいない(天皇がいるのは日本だけ なのですよね?)特殊な表現だから、人を指している場合は固有表現かどうか 判断しかねる。だから、OPTIONALにするという感じでしょうか。 少し脱線しますが、「天皇」「ローマ法王」は紛れもなく普通名詞だと 思った根拠は、J・スチュワート・ミル(1943)の 固有名詞は内包的ではない。それは、それによって呼ばれる個体を 指し示し(denote)はするが、これら個体に属するどのような属性を 述べ(indicate)もせず含意(imply)もしない。               『論理学の体系』(これは孫引きです) などにありました。「天皇」という語は明治天皇も大正天皇も 昭和天皇も指せるから、内包的だし個体を指していない、 と思ったわけです。 ローマ法王にしても同感で、死んでしまったローマ法王もいるでは ないか、と思っていました。 けれど、この話が成り立つのは、過去・未来・現在をすべて同時に 視野に入れた場合ということなります。 :> 第二に、「天皇」「ローマ法王」はある時間軸においては一名である :> という点では、「首相」「大統領」よりも確実に、 :> 「そのまま特定の人を表」します。 :> けれど、新聞記事の場合、必ずしも時間軸は一つではありません。 # # 「時間軸は一つ」は「時間軸上の点は一つ」のまちがいでした。 # と先日のメール([irex 157])に書きました。    −−−−+−−−−−−−−−−−+−−−−−−−+−−−−>       1867年        1999年 2073年 現代のことについて書かれた記事もあるし、1867年について書かれた 記事もある。だから、点は一つではない。そう思っていました。 新聞記事全体を見ると、時間軸上のいろいろな点の事柄が出てきます。 でも、ある一つの記事や文において、その記事が時間軸上のいろいろな点を 指していることはないですね。というわけで、「天皇」「ローマ法王」は 絶対に固有表現ではないという話は成り立たないな、と先の説明を読んで 思いました。 > > (疑問点2)「A、B両○○」の扱い        :        : > という事で、こちらも現状のままで納得していただけますでしょうか? > (CRLデータにあるような「両」の例を定義に加え、説明を付け足します。) とても丁寧な説明をありがとうございます。すごくよくわかりました。 「A、B両○○」において、     ・A,Bそれぞれに○○がついてないと意味が通らない場合は、   「部分的な並列表現で分割すると違った意味を生んでしまう場合には   分割しない」   に従い、A、B両○○ になる  ・○○がA,Bにとって、なくてもよい要素ならば、   「並列な固有表現が連続している場合にはそれらは分割する」   に従い、両○○ になる という理解で大丈夫でしょうか。ちょっと勘違いしているでしょうか。         (財)計量計画研究所 言語情報研究室                     木 田 敦 子                   akida@ibs.or.jp  1, filed,, Summary-line: 16-Feb to: irex@karc.crl.go.jp #[irex 163] NE definition Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id KAA15689 for ; Tue, 16 Feb 1999 10:19:04 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id KAA12492 for ; Tue, 16 Feb 1999 10:21:11 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id AAA18705; Wed, 17 Feb 1999 00:15:34 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id AAA12754; Wed, 17 Feb 1999 00:15:33 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id AAA12952; Wed, 17 Feb 1999 00:10:07 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id AAA12947 for ; Wed, 17 Feb 1999 00:10:06 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id AAA09464 for ; Wed, 17 Feb 1999 00:09:16 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id AAA12749 for ; Wed, 17 Feb 1999 00:15:29 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id AAA10656 for ; Wed, 17 Feb 1999 00:15:27 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id KAA11258; Tue, 16 Feb 1999 10:15:22 -0500 (EST) Date: Tue, 16 Feb 1999 10:15:22 -0500 (EST) From: Satoshi Sekine Message-Id: <199902161515.KAA11258@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: akida@ibs.or.jp's message of Tue, 16 Feb 99 17:21:08 +0900 <9902169192.AA919214113@dell.ibs.or.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 163 Subject: [irex 163] NE definition Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2088 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Tue, 16 Feb 1999 10:15:22 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu In-reply-to: akida@ibs.or.jp's message of Tue, 16 Feb 99 17:21:08 +0900 <9902169192.AA919214113@dell.ibs.or.jp> Reply-To: irex@karc.crl.go.jp X-Sequence: irex 163 Subject: [irex 163] NE definition Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 2088 江里口さん、木田さん、ありがとうございます。 長いメイルなので読まれていない方もありかもしれませんが、 NEに参加する方にひとつ重要な点は江里口さんも説明されている 以下の点です。御注意ください。 参加システムはOPTIONALを出力する必要はありません。 OPTIONALを出力していても、それはないものとして扱われます。 正解にOPTIONALとある部分は、その範囲内であればどのような 出力をしたとしても、評価にはまったく関係ありません。 (次回のバージョンにはこのような説明を定義に加えます) ここからは、ちょっと雑感です。 江里口さんが書かれた「個人的な思い」は私も同様の物を持っています。 言語処理学会の論文では、そのあたりの思いをにじませてあるのですが、 もし読まれましたら感想を(メイルででも本番の江里口さんのパネル時でも) お願いします。 機械学習で、CRLデータを使用される方がいらっしゃると思いますが、 とりあえず、OPTIONALは消してから開始されるといいと思います。 NE_CRLDATE/etc/deltag.prlをいじれば、簡単にできると思います。 また、木田さんの引用された「固有名詞の定義」は面白く読みました。 「天皇」「ローマ法王」が普通名詞かどうか難しいです。 私も直感的には普通名詞だと思いますし、固有名詞であるという説明は なかなか難しいと思います。ちなみに「固有名詞」とIREXでやっている 「固有表現」は多少違います。明かな普通名詞も固有表現に入っています。 (例の東工大水泳部国会など) もし、IREXを「固有名詞」の抽出にしたとしたら、基本的には 辞書をどのように整備すればいいかという点だけが問題になってくるので そのような話にはしたくなかったというのはあります。 またMUCが「固有表現」というのを定義していたというのもあります。 ミルの引用で、indicate,implyというのがどのような物を指すのか 分りません。「関根聡」では明らかですが、「ニューヨーク大学」 「チンすれば5分でできるミートボールスパゲッティー」というのは (偶然?)属性をindicate/implyしている気がします。 どのような説明になるのでしょうかね? 関根  1, filed,, Summary-line: 17-Feb fukushima@shibuya.tao.go. #[irex 164] RE: NE definition Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id EAA23762 for ; Wed, 17 Feb 1999 04:27:00 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id EAA29048 for ; Wed, 17 Feb 1999 04:29:08 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id SAA27495; Wed, 17 Feb 1999 18:23:11 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id SAA09625; Wed, 17 Feb 1999 18:23:09 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id SAA21617; Wed, 17 Feb 1999 18:17:43 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id SAA21612 for ; Wed, 17 Feb 1999 18:17:42 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id SAA09849 for ; Wed, 17 Feb 1999 18:16:51 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id SAA09620 for ; Wed, 17 Feb 1999 18:23:05 +0900 (JST) Received: from netsv1.shibuya.tao.go.jp (netsv1.shibuya.tao.go.jp [210.226.179.65]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id SAA23846 for ; Wed, 17 Feb 1999 18:23:03 +0900 (JST) Received: from npcra201.shibuya.tao.go.jp by netsv1.shibuya.tao.go.jp (8.8.5+2.7Wbeta5/3.3W9-NEC) id SAA17980; Wed, 17 Feb 1999 18:24:29 +0900 (JST) Message-ID: <001401be5a57$8e5bfb80$20c8a8c0@npcra201.shibuya.tao.go.jp> From: "Takahiro Fukushima" To: Cc: "Fukushima Takahiro" Date: Wed, 17 Feb 1999 18:26:11 +0900 MIME-Version: 1.0 Content-Transfer-Encoding: 7bit X-Priority: 3 X-MSMail-Priority: Normal X-Mailer: Microsoft Outlook Express 4.72.3110.5 X-MimeOLE: Produced By Microsoft MimeOLE V4.72.3110.3 Reply-To: "Takahiro Fukushima" X-Sequence: irex 164 Subject: [irex 164] RE: NE definition Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="iso-2022-jp" Content-Length: 3615 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f From: "Takahiro Fukushima" To: Cc: "Fukushima Takahiro" Date: Wed, 17 Feb 1999 18:26:11 +0900 MIME-Version: 1.0 Content-Transfer-Encoding: 7bit X-Priority: 3 X-MSMail-Priority: Normal X-Mailer: Microsoft Outlook Express 4.72.3110.5 X-MimeOLE: Produced By Microsoft MimeOLE V4.72.3110.3 Reply-To: "Takahiro Fukushima" X-Sequence: irex 164 Subject: [irex 164] RE: NE definition Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="iso-2022-jp" Content-Length: 3615 福島@通信・放送機構です。 固有名詞の定義についての議論、大変興味深く読ませて頂いています。 >ミルの引用で、indicate,implyというのがどのような物を指すのか >分りません。「関根聡」では明らかですが、「ニューヨーク大学」 >「チンすれば5分でできるミートボールスパゲッティー」というのは >(偶然?)属性をindicate/implyしている気がします。 >どのような説明になるのでしょうかね? John Stuart Mill の話が出てきましたので、コメントをさせて頂きます。 まず、19世紀の後半から20世紀中頃にかけて、言語哲学者が 固有名詞について考察をして発表しています。Millはその一人で、 Russell, Frege, Searle, Wittgenstein なども固有名詞について 考察をしています。 今回 Mill の考察が紹介されましたが、固有名詞とその意味の取扱いに ついては、大きく言って2つの立場があります。1つは、Mill に代表されるように 固有名詞(proper names) には、意味を認めないものです。固有名詞は その指す対象(designation)はあるのだけれども、その sense は全くなく、 meaningless label だといっています。Russellも似た立場を取っています。 (John Stuart Mill, 1886 'A System of Logic Ratiocinative and Inductive' Book1, chapter2, para5). 他方、Fregeは、全く逆に、固有名詞がdesignate 出来るのは、sense (connotation, meaning)があればこそであると主張しています。designate するものと固有名詞を結び付けるのは、他ならぬ、その sense であり、 その内容は、a set of propositions which connect the sign and its designation だといっています。(尚、この場合の sign とは names, nouns, descriptions のことです)(Gottlob Frege, 'On Sense and Nominatum' in Readings in Philosophical Analysis) Searle は、この両者の折衷案を提案しております。 (John R. Searle, 1958 'Proper Names' in Mind Vol 67 pp 166-173) その内容をここで詳しく述べられませんが(また別の機会にまとめて 発表はしたいと思っております)、このSearle案に対して、Wittgenstein が 「大いなる」疑問を投げかけています。(Ludwig Wittgenstein, 1958 'Philosophical Investigation' translated by G.E.M. Anscombe) 一連の議論は大変面白いものなのですが、注意しなくていけない点が あると思います。 1. 上記の言語哲学者の考察を理解するには、本来は、それぞれ哲学者の 理論体系を理解する必要がある。つまり、かれらは何も固有名詞だけに ついて考察をしたのではなく、もっと大きな議題を扱っているので、 その中での固有名詞の位置づけを見極めなくてはならないと思います。 2. また、彼らの固有名詞とするものは、IREXのNEで対象とするものとは かなり違います。かれらの例は、Scott であり Aristotle であり、限定 されたものです。基本的に1語名で、その指す対象がはっきりしています。 Searleがいっていますが、The Bank of England (英国銀行)のような名前は 彼にとっては、non-paradigmatic, degenerate であると。 つまり、The Bank of England は、本来の固有名詞ではないとするものです。 ですので、彼らの考察は、参考になりますが、IREXのNEを考えると 考察の対象がかなり違うので、やはり、参考程度とすべきであると 感じています。 雑感を述べさせて頂きました。 福島 孝博 Telecommunications Advancement Organization of Japan 通信・放送機構 渋谷上原リサーチセンター Tel 03-5790-7065 Fax 03-5790-7066 Email fukushima@shibuya.tao.go.jp Web http://www.shibuya.tao.go.jp 99年1月より「若尾」から「福島」となりました。 今後ともよろしくお願いします。  1, answered,, Summary-line: 18-Feb iFLXBsoSiAbJEI9XzBsGyhK?= #[irex 165] agreement form Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id AAA02528 for ; Thu, 18 Feb 1999 00:56:57 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id AAA09326 for ; Thu, 18 Feb 1999 00:59:03 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id OAA05979; Thu, 18 Feb 1999 14:53:24 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id OAA06928; Thu, 18 Feb 1999 14:53:23 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id OAA29384; Thu, 18 Feb 1999 14:47:57 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id OAA29378 for ; Thu, 18 Feb 1999 14:47:54 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id OAA10338 for ; Thu, 18 Feb 1999 14:47:02 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id OAA06923 for ; Thu, 18 Feb 1999 14:53:17 +0900 (JST) Received: from libra.carrot.kansai.oki.co.jp (okigate.oki.co.jp [202.226.91.194]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id OAA08045 for ; Thu, 18 Feb 1999 14:53:13 +0900 (JST) Received: by libra.carrot.kansai.oki.co.jp with Internet Mail Service (5.5.1960.3) id ; Thu, 18 Feb 1999 14:52:38 +0900 Message-ID: <21ABF46DF1F8D011B17900A0243216612B2FA9@libra.carrot.kansai.oki.co.jp> From: =?iso-2022-jp?B?GyRCSiFLXBsoSiAbJEI9XzBsGyhK?= To: "'irex@karc.crl.go.jp'" Date: Thu, 18 Feb 1999 14:52:37 +0900 MIME-Version: 1.0 X-Mailer: Internet Mail Service (5.5.1960.3) Reply-To: irex@karc.crl.go.jp X-Sequence: irex 165 Subject: [irex 165] agreement form Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="iso-2022-jp" Content-Length: 667 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f From: =?iso-2022-jp?B?GyRCSiFLXBsoSiAbJEI9XzBsGyhK?= To: "'irex@karc.crl.go.jp'" Date: Thu, 18 Feb 1999 14:52:37 +0900 MIME-Version: 1.0 X-Mailer: Internet Mail Service (5.5.1960.3) Reply-To: irex@karc.crl.go.jp X-Sequence: irex 165 Subject: [irex 165] agreement form Sender: owner-irex@po.crl.go.jp Content-Type: text/plain; charset="iso-2022-jp" Content-Length: 667 沖電気の福本です。 以前のIREXのミーティングでIREXでの評価結果を商品の宣伝に利用しない。も し、これに違反した場合にはペナルティーが科されるといった旨の同意書(?) の提出をもって最終的な参加表明とするといったことが話し合われたと思うので すが、その件についてはその後どうなったのでしょうか? そろそろ2月末で参加の最終的な意志表明の時期になってきましたので。 もし、私の思い違いかその後変更になったのであれば無視してください。 福本 淳一 (fukumoto@kansai.oki.co.jp) 沖電気工業(株) 研究開発本部 関西総合研究所 自然言語Pj tel. 06-6949-5101 fax. 06-6949-5108  1, filed,, Summary-line: 18-Feb to: irex@karc.crl.go.jp #[irex 166] agreement form Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id RAA08954 for ; Thu, 18 Feb 1999 17:54:04 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id RAA28883 for ; Thu, 18 Feb 1999 17:56:12 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id HAA12801; Fri, 19 Feb 1999 07:51:02 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id HAA26746; Fri, 19 Feb 1999 07:51:00 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id HAA05268; Fri, 19 Feb 1999 07:45:35 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id HAA05262 for ; Fri, 19 Feb 1999 07:45:34 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id HAA10672 for ; Fri, 19 Feb 1999 07:44:42 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id HAA26736 for ; Fri, 19 Feb 1999 07:50:56 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id HAA18662 for ; Fri, 19 Feb 1999 07:50:54 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id RAA12518; Thu, 18 Feb 1999 17:50:53 -0500 (EST) Date: Thu, 18 Feb 1999 17:50:53 -0500 (EST) From: Satoshi Sekine Message-Id: <199902182250.RAA12518@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 166 Subject: [irex 166] agreement form Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 675 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Thu, 18 Feb 1999 17:50:53 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 166 Subject: [irex 166] agreement form Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 675 IREX ML Members: A new registration form is ready from IREX homepage. Deadline for the registration is extended to March 15, 1999. Now, there is an English version! Satoshi Sekine ---------------- 新しい参加申込書を作成しました。 参加予定の団体は井佐原さんの方まで記入捺印後送付してください。 締切を1999年3月15日まで延長しました。 一部の方には再度の提出になって申し訳ありません。 宣伝誹謗に使わないという項目を挿入する事を条件とされている 団体がありますので、過去に申し込みをした団体も再度の提出を お願いいたします。 英語版も作成しました。 関根聡 # 福本さん、どうもありがとうございます。  1, filed,, Summary-line: 21-Feb to: irex@karc.crl.go.jp #[irex 167] neg in IR topic, NE restrict topic, NYU participation (NE) Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id MAA28354 for ; Sun, 21 Feb 1999 12:21:46 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id MAA24077 for ; Sun, 21 Feb 1999 12:23:50 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id CAA01463; Mon, 22 Feb 1999 02:18:44 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id CAA20371; Mon, 22 Feb 1999 02:18:42 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id CAA20861; Mon, 22 Feb 1999 02:13:17 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id CAA20856 for ; Mon, 22 Feb 1999 02:13:16 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id CAA14069 for ; Mon, 22 Feb 1999 02:12:22 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id CAA20353 for ; Mon, 22 Feb 1999 02:18:38 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id CAA17604 for ; Mon, 22 Feb 1999 02:18:36 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id MAA14895; Sun, 21 Feb 1999 12:18:32 -0500 (EST) Date: Sun, 21 Feb 1999 12:18:32 -0500 (EST) From: Satoshi Sekine Message-Id: <199902211718.MAA14895@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 167 Subject: [irex 167] neg in IR topic, NE restrict topic, NYU participation (NE) Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1927 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Sun, 21 Feb 1999 12:18:32 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 167 Subject: [irex 167] neg in IR topic, NE restrict topic, NYU participation (NE) Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1927 IREX-ML member: 1. We have to decide if tags should remain in the topic. It indicates the tagged part contain negative content to the topic. My proposal is it should remain with the condition that each system has to declear if it used the information. If you heva objections, please post it. 2. NE restricted topic will be announced Marth 15. Training data (about 40 articles) will be distributed at the same time. 3. NYU (my colleague, PhD student who participated MUC-NE task) would like to participate NE task. Please admit it. Satoshi Sekine ------------------------ IREXメイリングリストのメンバー皆様: 1.IRのトピックにおけるのタグの存在ですが、予備試験の結果を見て 本試験でも使用するかどうか決定するという事になっていました。 私の提案は、negのタグは本試験でも予備試験同様に存在させておくが、 そのタグの情報を使用したかどうかをアンケートの際に明らかにする というものです。各団体が2システムまで提出できますので、この情報を 利用した物としていない物という比較もでき有益ではないかと思って います。御意見をお待ちしています。 2.NEのトピック限定タスクのトピックを3月15日に発表します。(2週間前 としていましたが、それでは短すぎるので変更しました。)40記事程度の トレーニングデータも同時に公開します。 3.私の同僚(博士の学生)がIREX-NEに参加していと申しております。 彼は米国人で日本語をほとんど理解しません。MUC-NE(英語)に参加して 上位の成績を納めております。学習型のシステムなので、日本語の知識を ほとんどなくシステムを走らせられます。形態素解析を走らせるといった 点で私も手伝わなければなりませんが、他の参加者と不公平になるような 事はいたしませんので、どうか参加を認めてください。 反対意見を募集しますが、3月15日の参加締切までに反対意見がなかった 場合には承認されたものと判断します。  1, filed,, Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id UAA00053 for ; Sun, 21 Feb 1999 20:10:00 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id UAA29750 for ; Sun, 21 Feb 1999 20:12:12 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id KAA03401; Mon, 22 Feb 1999 10:06:47 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id KAA25304; Mon, 22 Feb 1999 10:06:45 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id KAA22346; Mon, 22 Feb 1999 10:01:20 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id KAA22341 for ; Mon, 22 Feb 1999 10:01:18 +0900 (JST) Received: from ipsgw.crl.go.jp (ipsgw [133.243.25.239]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id KAA14142 for ; Mon, 22 Feb 1999 10:00:24 +0900 (JST) Received: from ripeness.crl.go.jp (ripeness [133.243.71.201]) by ipsgw.crl.go.jp (8.8.5/3.5Wpl4-03/10/97) with SMTP id JAA00288 for ; Mon, 22 Feb 1999 09:52:10 +0900 (JST) Received: from localhost by ripeness.crl.go.jp (4.1/6.4J.6-karc/s) id AA15664; Mon, 22 Feb 99 10:04:48 JST Message-Id: <9902220104.AA15664@ripeness.crl.go.jp> To: irex@karc.crl.go.jp Date: Mon, 22 Feb 1999 10:04:48 +0900 From: Isahara Hitoshi Reply-To: irex@karc.crl.go.jp X-Sequence: irex 168 Subject: [irex 168] CRL Participation Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1087 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f To: irex@karc.crl.go.jp Date: Mon, 22 Feb 1999 10:04:48 +0900 From: Isahara Hitoshi Reply-To: irex@karc.crl.go.jp X-Sequence: irex 168 Subject: [irex 168] CRL Participation Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1087 通信総研の井佐原です。 > Date: Sun, 21 Feb 1999 12:18:32 -0500 (EST) > From: Satoshi Sekine > 3.私の同僚(博士の学生)がIREX-NEに参加していと申しております。 > 彼は米国人で日本語をほとんど理解しません。MUC-NE(英語)に参加して > 上位の成績を納めております。学習型のシステムなので、日本語の知識を > ほとんどなくシステムを走らせられます。形態素解析を走らせるといった > 点で私も手伝わなければなりませんが、他の参加者と不公平になるような > 事はいたしませんので、どうか参加を認めてください。 > 反対意見を募集しますが、3月15日の参加締切までに反対意見がなかった > 場合には承認されたものと判断します。 通信総研もNE、IRの双方に参加の予定です。 通信総研のメンバーは日本人ですし、他の参加者が知らない情報を井佐原が知っ ていて口にしてしまうという可能性もありますので、通信総研では直接の指導の 担当を別のものに完全に移管することにいたします。この条件で、通信総研につ いても参加を認めていただけますようお願い致します。 井佐原@通信総研  1, filed,, Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id NAA01686 for ; Thu, 25 Feb 1999 13:50:07 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id NAA11046 for ; Thu, 25 Feb 1999 13:52:24 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id DAA13211; Fri, 26 Feb 1999 03:46:55 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id DAA03344; Fri, 26 Feb 1999 03:46:53 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id DAA26500; Fri, 26 Feb 1999 03:41:30 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id DAA26495 for ; Fri, 26 Feb 1999 03:41:28 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id DAA16195 for ; Fri, 26 Feb 1999 03:40:31 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id DAA03339; Fri, 26 Feb 1999 03:46:49 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id DAA29624; Fri, 26 Feb 1999 03:46:47 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id NAA17000; Thu, 25 Feb 1999 13:46:31 -0500 (EST) Date: Thu, 25 Feb 1999 13:46:31 -0500 (EST) From: Satoshi Sekine Message-Id: <199902251846.NAA17000@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp, DLnet-forum@dl.ulis.ac.jp, nlt@cactus1.aist-nara.ac.jp, nl-ipsj-announce@cactus1.aist-nara.ac.jp, nlp-members@endive.crl.go.jp, nlc@atom.brl.ntt.co.jp, admin@ai-gakkai.or.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 169 Subject: [irex 169] Final Call for Participation -- IREX Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1731 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Thu, 25 Feb 1999 13:46:31 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp, DLnet-forum@dl.ulis.ac.jp, nlt@cactus1.aist-nara.ac.jp, nl-ipsj-announce@cactus1.aist-nara.ac.jp, nlp-members@endive.crl.go.jp, nlc@atom.brl.ntt.co.jp, admin@ai-gakkai.or.jp Cc: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 169 Subject: [irex 169] Final Call for Participation -- IREX Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 1731 情報検索、情報抽出に関するコンテスト(IREX)の参加者募集の メイルです。詳しい情報は以下のホームページにありますので、興味の ある方は御覧ください。 -------------------------      IREX Information Retrieval and Extraction Exercise (http://cs.nyu.edu/cs/projects/proteus/irex) <日程> 1999年3月15日 参加申し込み締切 1999年4月5日 IR検索課題配布 1999年4月12日 IR検索結果提出 (日本時間23時59分まで) 1999年4月13日 NEシステムの開発凍結 1999年5月13日 NE評価対象データ配布 1999年5月17日 NE抽出結果提出 (日本時間23時59分まで)   1999年9月1,2,3日 ワークショップ (メルパルク東京) 8月30、31日は同じ場所でNACSISのワークショップ、 9月1日はNACSIS,IREX合同のワークショップです。 <IREXパッケージ (バージョン 990214)> 公開パッケージには以下の物が含まれています。 (ftp://cs.nyu.edu/pub/local/sekine/IREX990214.tar.gz) * IR,NEの定義、ルール等 * IR予備試験の課題、判定結果 (6課題、それぞれ約1000判定) * NE予備試験のデータ (36記事) トレーニングデータ(46記事) * CRL NE data (10000文) * IR,NEのツール <毎日新聞CDROM> IRに参加する方、および上記のNEのデータを復元するには毎日新聞の CDROM(94,95年版)を購入していただかなければなりません。 詳しくはIREXホームページを御覧ください。  1, filed,, Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id MAA11568 for ; Tue, 2 Mar 1999 12:11:13 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id MAA01244 for ; Tue, 2 Mar 1999 12:13:34 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id CAA23901; Wed, 3 Mar 1999 02:08:23 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id CAA07498; Wed, 3 Mar 1999 02:08:21 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id CAA04556; Wed, 3 Mar 1999 02:02:59 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id CAA04551 for ; Wed, 3 Mar 1999 02:02:57 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id CAA18372 for ; Wed, 3 Mar 1999 02:01:57 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id CAA07493 for ; Wed, 3 Mar 1999 02:08:17 +0900 (JST) Received: from noreen.cs.nyu.edu (NOREEN.CS.NYU.EDU [128.122.140.11]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id CAA07943 for ; Wed, 3 Mar 1999 02:08:15 +0900 (JST) Received: (from sekine@localhost) by noreen.cs.nyu.edu (8.9.1/8.9.1) id MAA19587; Tue, 2 Mar 1999 12:08:03 -0500 (EST) Date: Tue, 2 Mar 1999 12:08:03 -0500 (EST) From: Satoshi Sekine Message-Id: <199903021708.MAA19587@noreen.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 170 Subject: [irex 170] Analysts wanted Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3787 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Tue, 2 Mar 1999 12:08:03 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 170 Subject: [irex 170] Analysts wanted Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3787 IREXメイリングリストの皆様: ************************************************* IREX結果分析をやってくださる方を募集いたします。 ************************************************* 特に、これからこの分野の研究をしていこうと考えている 来年度(99年度)に修士1年になられる学生等に最適かと思います。 (もちろん、それ以外の方も歓迎です) 内容: IREX結果分析(各1名ずつを予定) * NEにおけるシステムの特徴と精度の分析 各参加団体が提出したシステムアンケートの結果と それぞれの精度を統計手法などを用いて分析する。 * IEにおけるシステムの特徴と精度の分析 各参加団体が提出したシステムアンケートの結果と それぞれの精度を統計手法などを用いて分析する。 * IEにおける検索課題の特徴と難易度の分析 IEの検索課題の特徴とそれぞれの正解率を基に難易度などを 分析する。統計および多少の言語的知識も必要 * IEにおける判定者間の判定の関係 IEの判定者の判定の重なり具合などにより、判定の 問題について分析する。 資格: IREXの状況が大体分っている方、またはその方の指導によって研究を 進められる方。この分野に興味があり、この分野の発展に寄与したい という意志のある方。特に、統計、情報検索、情報抽出、言語処理に 詳しければなお良いが必須条件ではない。 発表: IREXのミーティングで10〜15分程度の時間で結果の発表を してもらいます。また、同様の内容は学会等でも自由に 発表してください。このような分析は、例えばTRECでのものが SIGIR98で発表されている等、学術的にも高い評価を受けています。 良い内容の分析(研究)ができたなら、国際発表の価値も充分にあると 思います。(著作権といった物はIREXに属しません) <参考文献> TRECの論文リスト等はhttp://trec.nist.gov/pubs.htmlにあります。 Lagergren, E., & Over, P. (1998, August). Comparing Interactive Information Retrieval Systems Across Sites: the TREC-6 Interactive Track Matrix Experiment. In proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Melbourne, Australia. Voorhees, E. (1998, August). Variations in Relevance Judgements in the Measurement of Retrieval Effectiveness. In proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Melbourne, Australia. 期間: 本試験の結果は6月末に出る予定です。それから8月中旬くらい のIREX Workshop予稿集の締切までに結果をまとめてもらいます。 6月以前にも予備試験の結果を基に分析方法などの検討を始めて もらえます。 指導: 学生の場合には、できるだけ、内容の分っている指導教官がいる 事が望ましいです。私自身も多少は相談に乗りますが、基本的には 自立して研究のできる方が望ましいです。 報酬: 基本的に新しいデータの分析ができるという事が報酬ですが、 東京以外の方(自宅や下宿からIREX Workshopに通えない方)には、 IREX Workshop参加のための交通費補助として2万円を上限に支給 します。また、参加してくださった全員の方にIREX Workshop中に 開催するホテルにある(高級?)中華料理を奢ります。 (http://www.mielparque.or.jp/tky/tky02.html参照 :-) 応募期間など: この募集は3月19日で締切ます。応募者多数の場合には、応募者や 指導教官と関根が相談して決めたいと思います。個人的には、これまで IREXとの関りが少ない方を優先したいと思っています。4月1日には 予備試験のデータなどを配布し研究が始められるような状態に したいと思います。  1, filed,, Received: from cs.nyu.edu (cs.nyu.edu [128.122.80.78]) by griffin.cs.nyu.edu (8.9.1/8.9.1) with ESMTP id SAA27148 for ; Wed, 3 Mar 1999 18:35:00 -0500 (EST) Received: from ns.crl.go.jp (ns.crl.go.jp [133.243.18.30]) by cs.nyu.edu (8.9.1/8.9.1) with ESMTP id SAA19861 for ; Wed, 3 Mar 1999 18:37:21 -0500 (EST) Received: from crlgw.crl.go.jp ([133.243.18.250]) by ns.crl.go.jp (8.9.0/3.7W) with ESMTP id IAA09761; Thu, 4 Mar 1999 08:32:20 +0900 (JST) Received: from po.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id IAA20543; Thu, 4 Mar 1999 08:32:18 +0900 (JST) Received: (from uchimoto@localhost) by po.crl.go.jp (8.8.8/3.5Wbeta) id IAA17234; Thu, 4 Mar 1999 08:26:55 +0900 (JST) X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Received: from karc.crl.go.jp (karc [133.243.25.98]) by po.crl.go.jp (8.8.8/3.5Wbeta) with ESMTP id IAA17228 for ; Thu, 4 Mar 1999 08:26:53 +0900 (JST) Received: from crlgw.crl.go.jp (crlgw [133.243.18.250]) by karc.crl.go.jp (8.8.2+2.6Wbeta9/3.4W4) with ESMTP id IAA19152 for ; Thu, 4 Mar 1999 08:25:51 +0900 (JST) Received: from mailgate.crl.go.jp (crlgw [133.243.18.250]) by crlgw.crl.go.jp (8.8.8+2.7Wbeta7/3.5Wpl7-MS980331) with ESMTP id IAA20531 for ; Thu, 4 Mar 1999 08:32:12 +0900 (JST) Received: from nonki.cs.nyu.edu (NONKI.CS.NYU.EDU [128.122.140.99]) by mailgate.crl.go.jp (8.8.8+2.7Wbeta7/3.6W) with ESMTP id IAA29258 for ; Thu, 4 Mar 1999 08:32:09 +0900 (JST) Received: (from sekine@localhost) by nonki.cs.nyu.edu (8.9.1/8.9.1) id SAA06355; Wed, 3 Mar 1999 18:34:13 -0500 (EST) Date: Wed, 3 Mar 1999 18:34:13 -0500 (EST) From: Satoshi Sekine Message-Id: <199903032334.SAA06355@nonki.cs.nyu.edu> To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 171 Subject: [irex 171] Trip report to DARPA workshop Errors-To: owner-irex@po.crl.go.jp Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3131 *** EOOH *** X-Authentication-Warning: po.crl.go.jp: uchimoto set sender to owner-irex@po.crl.go.jp using -f Date: Wed, 3 Mar 1999 18:34:13 -0500 (EST) From: Satoshi Sekine To: irex@karc.crl.go.jp CC: sekine@cs.nyu.edu Reply-To: irex@karc.crl.go.jp X-Sequence: irex 171 Subject: [irex 171] Trip report to DARPA workshop Sender: owner-irex@po.crl.go.jp Content-Type: text Content-Length: 3131 IREXメイリングリストの皆様: 今日はDARPAの音声認識のワークショップに行ってきましたので そこでの報告を簡単にします。 * Dona Harmon IREXの顧問をお願いしている、TRECのchairの彼女に会って、 TRECの話を聞いたり、こちらの話をしました。NACSISと共同でワークショップを 開く予定については非常に喜んでいました。 * Tomek Strzalkowski 彼がco-chairをしているTRECでの新しい課題であるQ&Aについて詳しく聞き ました。基本的には、人間の質問にどれだけ人間を納得させられる答を 自動的に返せるかという物で、IREXの将来にも関連して非常に面白く思えます。 詳細はhttp://www.research.att.com/~singhal/qa-track.html (ちなみに、彼はNYUにも長くいた人物で私も良く知っています) * InfoMedia系のデモ いわゆるInfoMediaをFine TuneしたようなデモがSRI,BBN,Dragon,Mitre(?) からありました。音声、画像、検索、抽出、要約などを有機的に結合した システムで、皆商品化を考えているようで立派なビデオを流していました。 実際、私がCMUのInfoMediaを始めて見たのは3、4年前のDARPAの音声の会議でしたが 非常に感動したのを覚えています。(私は5年前から3年間NYUからこの音声の コンテストに参加していました。) * Allen Sears DARPAの音声や言語の研究を十数年ひっぱって来たProgram Managerですが、 他の仕事に移り、George Darlington (すみません、スペルは正しくないかも しれません)が引き継ぐようです。Searsは政府からこの分野に(大量の)お金を 取ってきていた帳本人で、皆の称賛を受けていました。日本でもこのような 人がいるといいのですが。。。 * TIDES (Translingual Information Detection, Extraction and Summarization) 音声のプロジェクトはGeorgeによって引き継がれるようですが、他にTIDESと いう名のDARPAのプロジェクト(DARPA内で提案中のようです)の紹介がありました。 これは、機械翻訳、情報検索、抽出、要約を有機的に結合したような物を目的に していますが、最近のDARPAの機械翻訳は、日本語、スペイン語、フランス語の ようなメジャーな言語を対象にしているのではなく、まったく新しい言語に対する 機械翻訳を即座に作成するという方向を模索しているようで、このTIDESも その方向にあるようでした。(この背景には米軍がユーゴの言葉などのマイナーな 言葉に対する需要が増えているというのがあるようです) 音声の流れもそうですが、検索や抽出はかなり完成されたコンポーネントと 見られているようで、音声や機械翻訳からの需要があるようです。 * 東工大の古井先生 毎年、DARPAのWorkshopに来られている古井先生が、(多分)日本からの唯一の参加者 として来られていました。音声の先生ですが、IREXの紹介をしたり、音声の 日本での状況を聞かせてもらいました。お互い「こういう(DARPAのような)恵まれた 状況は羨ましいよね」という感想です。 以上、3日の会議の内の1日(最終日)しか出席していませんが、 質問なりありましたら、答えられる範囲でお答えします。 (他の2日はGrishmanが出ていましたので、聞ける範囲なら聞きます) 関根