学位論文要旨



No 127398
著者(漢字) タム,ワイロック
著者(英字)
著者(カナ) タム,ワイロック
標題(和) 助数詞構文における作用域・分配性・範疇化
標題(洋) Scope, Distributivity and Categorization in Classifier Constructions
報告番号 127398
報告番号 甲27398
学位授与日 2011.08.25
学位種別 課程博士
学位種類 博士(学際情報学)
学位記番号 博学情第42号
研究科 学際情報学府
専攻 学際情報学
論文審査委員 主査: 東京大学 准教授 矢田部,修一
 東京大学 教授 中川,裕志
 東京大学 教授 石崎,雅人
 東北大学 教授 吉本,啓
 Microsoft Research Asia 首席研究員 辻井,潤一
内容要旨 要旨を表示する

本論文では、助数詞構文における作用域・分配性・範疇化について論じる。主な対象言語は日本語であり、日本語における助数詞構文というのは例えば「二人の医者が来た」・「医者が二人来た」のような文のことである。この種の構文のシンタクスに関しては既に多くの先行研究があるが、この種の構文における「二人」などの表現の意味に関しては、先行研究は、形式的言語学の内部でも計算言語学の内部でも、それほど多くはない。これは、言語の形式的扱いに興味をもつ研究コミュニティにおいては、通常、文法の被覆率を向上させることが、個々の現象を意味論的に正確に扱う事よりも優先されるためである。文法の被覆率の向上はまず様々な統語現象を扱うことによって追及されるため、結果として、形式的・計算的な文法による言語研究においては、統語論と意味論の研究の進行に大きな差が出ることになった。助数詞構文の解析において、この差を埋めることが、本研究の大目的である。

この構文は日本語などの言語において重要な役割を果たすものであり、その正確な解析は、動詞によって記述されるある関係に関与する個体の数量や、それらの個体がどのように関係し合っているのかを理解するためには必須である。

本論文の各章では、以下のような目的が追求されている。

第1章ではまず、助数詞を含む、使用頻度の高い2つの構文――すなわち、「二人の医者が来た」のように数量表現が名詞的表現の前に来る構文と、「医者が二人来た」のような、いわゆる浮遊数量詞構文――の統語構造を示し、次に分配性(distributivity)、範疇化の概念に関する説明を提示する。また、複数名詞句が使われている英語の文が、各名詞句のスコープ・分配性に応じて持つことになる、様々な意味の概観を行う。 意味の点から見て、複数名詞句を含む英語の文こそ、日本語における助数詞構文に対応するものと言えるからである。日本語の助数詞構文が、対応する英文が持つ意味のうちのどれを表すことができ、どれを表すことができないか、そして実際に観察される意味はどのように作り出されるのか、を明らかにするのが本論文の中心的な課題である。

第2章では、本論文で理論的枠組みとして用いる線状化に基づく主辞駆動句構造文法(Linearization-based Head-Driven Phrase Structure Grammar)について概観し、さらに、助数詞の意味表現について述べる。Y. Matsumotoなどによる先行研究に基づき、本論文では、各々の助数詞の意味は、選言的(disjunctive)にしか表しえないものとして分析される。また、「二人の母」のような表現は、「母二人」という意味にも「二人の子供の母」という意味にも取れる、というふうに、「二人」の部分が「母」の数を表す場合とそうでない場合があるわけであるが、一般に、助数詞表現が後続の名詞が表すものの数を表すのか、そうでないのか、を或る程度正確に判定することを自然言語処理システムにとって可能にするようなメカニズムを提案する。この曖昧性解消モデルは、名詞オントロジーである日本語語彙体系、京都コーパスから得た助数詞と名詞の組に対する母語話者の解釈、および日本語話し言葉コーパスを情報源として用い、機械学習の手法を適用することで開発した。この提案の細部は論文末のAppendixの部分で述べられている。

第3章では、日本語の助数詞構文の意味解釈に関する、ある程度包括的な理論を提示し、その理論が、先行文献において提案されている理論より優れていることを示す。理論的枠組みとしては、線状化に基づく主辞駆動句構造文法(Linearization-based Head-Driven Phrase Structure Grammar)とUnderspecified Discourse Representation Theory とを組み合わせたものを用い、「2人の学生」のような、名詞句の内部に助数詞が現れる構文と、「学生が2人来た」のような、名詞句の外に助数詞が現れる浮遊数量詞構文との双方の意味を正しく捉える理論を提案する。線状化に基づく主辞駆動句構造文法によって助数詞構文の統語構造を扱い、その意味は Underspecified Discourse Representation Theory によって扱う。我々は、まず導入として、統語的にはより単純である名詞句内数量詞構文の解析を与え、次に、浮遊数量詞構文の統語構造を Yatabe (1993) による線状化に基づく主辞駆動句構造文法における意味役割階層の概念を再解釈することによって与える。助数詞構文の意味論は、以下の2つに焦点を当てておこなう。第一は、浮遊数量詞構文において、名詞とそれに対応する助数詞が離れている場合に、分配読みだけが可能となる場合についての説明を与えることであり、第二は、代名詞構文において最も顕著な読みである累積読みについて説明を与えることである。累積読みは、ある関係にある個体の数量のみを指定し、それぞれの個体がどのように関係しているかについては特に指定しない。分配読み、累積読みそれぞれの表現は名詞領域における全体-部分構造を必要とする。分配性およびスコープを正しく説明するために必要な道具立ては以上のものだけである、というのが本論文における仮説である。

浮遊数量詞構文の意味に関する重要な先行研究としてNakanishiの研究があり、そこでは、日本語の浮遊数量詞は、名詞句が表すものに関して量化を行うと同時に、文が表すイヴェントに関しても量化を行うものであるとの主張が行われている。本論文では、Nakanishiがそのような理論によって説明しようとしている現象は、ほとんど、浮遊数量詞によって修飾されている名詞句は必ず分配的(distributive)に解釈されなければならないという、独立に知られている制約によって説明が付くということ、そして、Nakanishiが自身の理論の論拠として挙げている観察のうち、その制約によって説明が付かないものに関しては、観察の妥当性を疑う理由があること、を述べる。具体的には、一回しか起こりえないタイプのイヴェントを表す述語が浮遊数量詞と共起しえないこと(例えば「??ガンマンが3人次郎を殺した」という文が不自然であることなど)は、イヴェントに言及しなくても、浮遊数量詞が必ず分配的に解釈されるという制約に言及するだけで説明が付くこと等を示す。一方、individual-level predicate(恒常的な状態を表す述語)が浮遊数量詞と共起しえない、という観察をakanishiは自説のさらなる根拠としているが、この観察には経験的妥当性がないということを指摘する。

1.恒常的な状態を表す述語(indivisual-level predicate)を主辞とする浮遊数量詞構文と一時的な状態を表す述語(stage-level predicate)を主辞とする浮遊数量詞構文の文法性の差を単調性制約を用いることなく、より正確に説明することが可能である。

2.一時的な状態を表す述語の意味構造は、恒常的な状態を表す述語と異なり、束に似た構造で表すことが適切であるという主張に対し、合理的な理由づけがない。

3.Nakanishi の名詞領域のモデルには不備があるため、名詞の意味構造と述語の意味構造の類似性を論じることには意味が無い。

Nakanishi の仮説を以上の論拠により棄却し、我々の仮説の優位性を示した後、この章の結論を述べる。

本論文で提案されている文法の統語的な部分とsemantic のpreliminary version意味論の一部は計算機上に実装されている。Johnson(1985)において提示されている、不連続な構成素をも分析できるパーサー上での実装である

審査要旨 要旨を表示する

本論文は、日本語における「二人」・「三つ」などの数量表現の意味を、包括的かっ形式的に厳密に記述することを目指したものである。「二人の学生が来た」のように、数量表現が名詞を左側から修飾している名詞句内数量詞構文と、「学生がゆうべ二人来た」のように、数量詞が名詞から切り離されている、いわゆる浮遊数量詞構文の双方において、数量表現が表しうる意味を、それらの表現の作用域および分配性に基づいて分類し、従来提案されてきた諸理論を援用しつつも、新たな分析を行っている。

本論文は、次の二点において学問的に意義のある貢献となっている。

まず、第一に、・名詞句内数量詞構文の表しうる意味に関して、Head-Driven Phrase Structure Grammar(主辞駆動句構造文法)およびUnderspeeified Discourse Representation Theory(不完全指定談話表示理論)を用いて、従来の理論より心理学的妥当性が高いと思われる理論を提案している。「二人の学生が三冊の本を読んだ」というような文は、「二人の学生が、それぞれ三冊ずつの本(つまり全部で最高六冊の本)を読んだ」という場面を描くのにも使えるし、「二人の学生および三冊の本が存在し、それら二人の学生のいずれもがそれら三冊の本のうちのいずれかを読んだし、逆に、それら三冊の本のうちのいずれもがそれら二人の学生のうちの誰かによって読まれた」、という場面を描くのにも使える、ということが観察される。このタイプの構文の意味を包括的に捉えようとする理論としては、Fred Landmanの理論があり、従来から存在する理論の中では最も妥当性の高いものであると考えられるが、Landmanの理論は、この「二人の学生が三冊の本を読んだ」のような文には少なくとも九つの意味がある、ということを予測し、かっ、この文を聞いた人の頭の中では必ずそれら九つの意味の中のいずれかが即時に選ばれるはずだということを予測するもので、特に後者の予測は心理学的妥当性に欠けるものである。このタイプの文の意味を人が理解しようとする揚合、文の表しうる意味のうちの一つが必ずすぐに選び出されるわけではない、ということが心理学的実験によって既に示されているからである。本論文において、タム氏は、主辞駆動句構造文法・不完全指定談話表示理論を利用した分析を構築することによって、Landmanの理論のこの問題点を少なくとも部分的に解決する理論を提示することに成功している。

第二に、本論文は、日本語の浮遊数量詞構文の表す意味に課せられる制約を従来の理論以上に正確に捉える新たな理論を提示している。浮遊数量詞構文は次のような意味で分配的にしか解釈されえないということが知られている。名詞句内数量詞構文の「三人の学生がピアノを持ち上げた」は、「学生三人のうちの一人一人がピアノを持ち上げた」という分配的な解釈と、「学生三人が力を合わせてピアノを持ち上げた」という集合的な解釈の両方があるのに対し、浮遊数量詞構文の「学生がゆうべ三人ピアノを持ち上げた」という文は、「学生三人のうちの一人一人がピアノを持ち上げた」という分配的な解釈しかなく、「学生三入が力を合わせてピアノを持ち上げた」という集合的な意味は表しえない。この観察に関して、郡司、橋田、中西といった人たちが理論的な説明を試みているが、彼らの主張によると、浮遊数量詞構文が分配的な意味しか持たないのは、この構文においては、名詞句のあらわす「もの」の持っ構造と、文全体のあらわすイヴェントの持つ構造との間に同型性が存在することが求められているからである。先の文例に即して言うと、一人ひとりの学生が、三人の学生からなるグループの部分であるのと全く同様に、「一人の学生がピアノを持ち上げる」というイヴェントは、「学生三人のうちの一入一人がピアノを持ち上げる」というイヴェントの一部分を成している、と考えられる。一方、「一人の学生がピアノを持ち上げる」というイヴェントは、「学生三人が力を合わせてピアノを持ち上げる」というイヴェントの一部分を成しているとは言えない。このコントラストが、郡司、橋田、中西によると、浮遊数量詞構文が集合的な解釈を持たない理由である。中西氏は、さらに、この理論によって、浮遊数量詞構文には恒常的状態を表す述語を用いにくいことなども説明できると論じている。この従来の理論に対して、タムワイロック氏は、イヴェントの構造に言及せず、浮遊数量詞構文は分配的にしか解釈できないということを直接に述べる理論の方が妥当性が高いということを主張している。その根拠として、恒常的状態を表す述語であっても浮遊数量詞構文に用いることが可能なケースを取り上げ、本論文で提示されている理論の方がそのようなケースを自然に説明できるということを示している。

審査の場で、本論文には説明が不足していて読みづらい箇所があること、論じるべきであるのに論じられていない点も若干残っていることなどの問題点が指摘された。しかし、そのような問題点があるとしても、本論文は、理論言語学において広く論じられている重要な問題に関して、新たな観察を提示し、従来の理論よりも包括的な理論を構築したものと認められる。

よって、本審査委員会は、本論文が博士(学際情報学)の学位に相当するものと判断する。

UTokyo Repositoryリンク