日本語の構文解析における3つの「係り受け」

安岡孝一

日本語の構文解析においては、3つのレベルでの「係り受け」が存在する。

  1. 佐伯梅友・橋本進吉らによる句の「係り受け」(いわゆる学校文法)
  2. 吉田将・栗原俊彦らによる二文節間の「係り受け」(いわゆる文節係り受け)
  3. Joakim Nivre・金山博らによる単語間の「係り受け」(いわゆる依存文法)
これらの3つの「係り受け」は、それぞれに関係はあるものの、情報処理という視点から見た場合には、アプローチがかなり異なっている。この記事の[問2]例文「Alexは男性にも女性にも使われる名前で、女性の名Alexandraの愛称であるが、男性の名Alexanderの愛称でもある。」をもとに、概説しておこう。

(1) 句の「係り受け」

いわゆる学校文法における句の「係り受け」は、文全体を少しずつ区切っていきながら、区切りにおける「係り受け」を考える、という点に大きな特徴がある。「係り受け」は一般に、文頭に近い方の句から文末の方へと係る。ただし、句の「係り受け」の中には「並置」と呼ばれる考え方があって、この場合は単に並べて図示される。[問2]の例では、たとえば「男性の名Alexanderの」は「愛称」に係っており、その中で「男性の名」と「Alexander」が並んでいて、さらにその中で「男性の」が「名」に係っている。ちなみに[問2]は、述部における「並置」構造、主部の共有、そして「女性の名Alexandraの愛称」における「並置」構造を読み解く問題だと考えられる。

(2) 二文節間の「係り受け」

入力として与えられた日本文を、事前に文節に区切った上で、二文節間の「係り受け」を解析するやり方で、各文節の「係り受け」先を一つに限定している点に特徴がある。二文節間の「係り受け」は、文頭に近い方の文節から文末の方へと係る。「並置」も考慮せず、文頭の方から文末の方へと係る。[問2]の例では、たとえば「男性の」は「名Alexanderの」に係っており、「名Alexanderの」は「愛称でもある。」に係っている。ちなみに「東ロボくん」に使われているCaboChaは、二文節間の「係り受け」解析器であり、上記の図はCaboChaの出力結果である。

(3) 単語間の「係り受け」

入力として与えられた文を、事前に単語に区切った上で、単語間の「係り受け」を有向グラフとして解析するやり方である。言語に限定されないよう、一貫して被修飾語から修飾語へリンク(矢印)が伸びることから、倒置文などに強い。各リンクには「係り受け」の種類を表すタグが付与されており、たとえば、述語から主語へ伸びるリンクはnsubjが、名詞による体言修飾にはnmodが付与される。名詞の「並置」は、それらが同一のものを指している場合にはapposが、そうでない場合はconjが付与される。なお、最先端のAI(ニューラルネットと機械学習)による「係り受け」解析エンジン(UniDic2UDGiNZA)は、単語間の「係り受け」解析器を実装している。

3つの「係り受け」の違い

ここまで見てきたように、これら3つの「係り受け」は、それぞれ句レベル・文節レベル・単語レベルでの「係り受け」であり、内容的にもかなり違いがある。同じ「係り受け」という単語を使うと、混乱を生じる。たとえば[問2]のこの記事は、混乱の典型例である。[問2]そのものは(1)の「係り受け」(特に「並置」構造)を読み解く問題なのに、「係り受けとは、どれが主語でどれが述語か、どれが修飾語でどの言葉を修飾しているかの関係を指す」という説明は、(3)の「係り受け」である。それに加え、「東ロボくん」は『国語』の解析に「係り受け」を用いておらず、『数学』の解析に使われているCaboChaは、(2)の「係り受け」解析器である。このような混乱を起こさないよう、(1)(2)(3)の「係り受け」をちゃんと意識して区別すべく、読者諸氏は心がけられたい。

参考文献

  1. 佐伯梅友・金田一京助・竹田復:中等文法 口語, 文部省検定済教科書 15 三省堂 中文801 (1948年8月).
  2. 吉田将:二文節間の係り受けを基礎とした日本語文の構文分析, 電子通信学会論文誌, Vol.55-D, No.4 (1972年4月), pp.238-244.
  3. 金山博・宮尾祐介・田中貴秋・森信介・浅原正幸・植松すみれ:日本語Universal Dependenciesの試案, 言語処理学会第21回年次大会発表論文集(2015年3月), pp.505-508.