* NEの課題 + 一般的なNEというのをきちんと定義できるか? + 固有のタスクを設定し、それに対するNEの方がいいのではないか? + 一般的な方が初心者に入りやすく、大勢の参加を得やすい。 + まずは技術を磨きたい、その為にも特定の目的を固定しない方がいいのでは。 + タスク限定にした場合、そのようなシステムを労力かけて作ってしまっていた MUCの失敗を考えて欲い。したがって、タスク限定にした場合の技術課題は MUC6で取られたようなポータビリティにあると思うが、初心者にここまで 最初からやってもらうのは非常に難しいと考える。 + ただ、この方向は非常に重要と考えるので、将来に向けて議論はしていきたい。 + MUC/METの後追のように感じられるが、特に民間における応用を 考えた新しい課題に挑戦してはどうか? + 今回は、課題の認知を目的としており、ある意味で後追でも構わないと考える。 ただし、彼等の定義をそのまま受け入れた訳ではなく、自分らで取捨選択した。 新しい課題は、今回のコンテストを通じ皆で考えていって将来に継げたい。 + 固有表現はあるハイアラーキーを持っており、それをある所で切って定義と しなくてはいけない。新聞記事においては、ここで定義された切口は妥当だと 考える。 * IREX-1に期待する事 + 抽出技術の有効性や重要度みたいな議論をワークショップなり、定期的な ワーキンググループ活動なりを通じてIREX-1で中心にやって、評価の方は サンプル的に選んで評価するというような運営の仕方はないでしょうか? + MUCの十年間で技術は進歩したし、コンテストの意義はあると思う。 + とりあえず、皆が経験しないとちゃんとした議論にならないと思う。 + IREXでは(成績よりも)技術内容を評価できるようにして欲い。 + IREXは抽出の問題の全体象を研究者や一般のユーザにバランス良く認識 させる場になって欲しい。 + 固有名の考え方とか情報抽出タスクの目標とか「現状での課題」というのを ある程度議論してから(IREX-0でも何でもよいですが)、本番の評価(IREX-1)を やったのでは駄目なのかな? + IREX-0をIREX-1に、IREX-1をIREX-2に置き換えてはどうでしょうか? + ワークショップでデモのセッションを作ってはどうか? * 定義作成 + 定義作成はタグ付けをし、具体例を見ながらでないといけない。 * 期待する技術 + 主催する側としては、使われる技術の仮定はしていない。あえて言うなら 簡単に期待できる以上のものが出てくる事を期待する。 * 人間のパフォーマンス + 人間がやった時の正解率も計って欲い + 計る予定である。 * 評価対象データ + 評価対象データ(毎日95年後半)を既に使用してしまっている。 + 以下ような可能性が考えられる。 1。これまで各社でやられていた作業はIREXのNEを特に目的とした作業では ないので、それらの作業は許してしまう。 2。そういった事をしていたという事を告白してもらい、結果には 「追い風参考」的なマークを付ける。 3。各社にとにかく、該当記事のデータを使ってはいないシステムを作って もらうようにお願いする。 4。全参加者が使用していないデータを探す。 + 2が妥当ではないか。 * 役職名 + 役職名は新聞で良く出て有用な場合が多い。 + 有用な場合は想定できるが、固有名ではないので今回は入れない。 * 固有物名 + サービス名を入れるか?(未解決) + 制度、税の名前を入れるか? (未解決) + 賞、法律、作品名などの抽象物も固有物名とする。 * 地名 + 米国国籍の米国は地名ではなく組織に近い。 + 地名に由来する場合は地名とする。(民族名等も) * 時間の範囲表現 + 今年一〜三月、2週間のような範囲表現をどうするか(未解決) * 複合名詞の扱い + フィリピン人のフィリピンを地名として取る意味は? + 接辞、複合名詞として切れる場合は切ってから考えないと定義の一貫性が 保てない。 * クラス + 橋田ドラマ、森永アイスクリームのようなクラス名は取らない。