001
無
233
情報化が完全に浸透した現在
情報化が完全に浸透した現在、個人が扱わなければいけない
コンピュータ上の情報量は、その能力の限界をはるかに越える程になっています。
特に、新聞記事やホームページなどのテキストの広大な海から自分に有用な情報を
見つける事は至難の技であります。
このような状況に鑑み、情報検索や情報抽出といった技術が欧米、日本などを
初め世界中で研究、開発されております。
特に米国で行なわれているMUCやTRECといったコンテストは、この分野の
技術を推進するために重要な役割を担ってきたと認識されています。
日本でも、非常に優れた研究が行なわれてきましたが、主に個々の研究所や
大学等で行なわれてきたため、共通のプラットフォームでのシステム間の評価や
問題点や議論の共有という事が難しい状況でありました。
002
無
277
IREXメイリングリストの皆様
IREXメイリングリストの皆様
先程、IREX kick−off meetingを終了しました。
10名以上の参加があり、色々と有意義な意見交換がありました。
その様子は間も無く議事録を公開いたしますので、
そちらを御参照ください。ここでは、いくつか運営上の話をします。
言語処理の分野における日本の権威の一人であられる京都大学の
長尾先生に顧問になっていただく事になりました。
運営していく立場としても参加者の間でも非常に励みになると思います。
石崎先生からのメイルがありましたが、人工知能学会の後援を
いただく方向で検討しています。(石崎先生と直接話をしましたが、
研究会という形ではなく、ワンタイムのワークショップ開催援助という
形式がいいと判断しています。)
今後、その他の学会にもアプローチしてみようと考えています。
評価、ワークショップの日程の変更を提案します。
12月開催では、準備期間が短く、正解作成の時期が学生を
雇うのに適さないとの事から、テストの開催を4月、ワークショップを
6月辺りに行なおうかと考えています。この変更によって
何らかの悪影響がある方は早目に関根まで連絡願います。
003
無
742
他
固有名詞的表現は、組織名、人名、地名、固有物名の固有の対象を示す表現を言う。
固有名詞や固有名詞を含む複合語、その省略形などの形で表現されている。ただし、指
示代名詞や普通名詞を利用した照応表現はここでの抽出対象には含まない。(例:それ、
当委員会、会議)
表現が、例えば、組織名にも地名にも取れるものがある。(例:成田空港問題。成田空港
に着陸した。ホワイトハウスの発表。ホワイトハウスに到着した。)その場合は、使用さ
れているコンテクストから、それがその場合にどちらを意味するかを参考に判断する。
004
無
742
他の他
範囲表現は、全体を時間表現とはせずに、個別の部分を抽出する。
4月3日から4月11日まで
以降まで
概算表現は数値表現に含めない。
約500億円
50ドル以上
0.5%くらい
20%台
1000円弱