データサイエンス特別講義 第1回(2023年度)
10月13日(金)15:10より、「データサイエンス特別講義 第1回」を開催。
(併催:DSC(データ駆動型サイエンス創造センター)トーク会、コロキアムA)
====================
日時: 10月13日(金)15:10-16:40
場所: エーアイ大講義室[L1](IS)+オンライン(webex)
言語: 日本語
講師: 持橋大地 先生(統計数理研究所 数理・推論研究系 准教授)
演題: ホログラフィック埋め込みによるCCG構文解析
概要:
CCG(組み合わせ範疇文法)は、その表現力の高さとλのような論理式との整合性の高さから、自然言語処理において最も有望な文法モデルの一つである。従来はこのために、各語彙にその文法的な働きを人間がアノテーションする必要があったが、実際の使用を考えると、こうした手作業に頼ることはほぼ不可能である。そこで本研究ではPlate(1995)によって提案され、知識グラフに適用されて高い性能を見せているホログラフ埋め込み(Nickel+ 2016)を埋め込みベクトルの合成演算子として適用し、句構造のベクトルを再帰的に計算することで構文解析を行う、ホログラフ埋め込みに基づくCCG構文解析(Holographic CCG) を提案する。実験により、本手法はC&Cパーザーのデコーダーを用いる中で世界最高精度を達成し、数学的に見通しのよいモデルでありながら、Transformerを用いたブラックボックスの深層学習とほぼ同程度の構文解析精度を達成した。提案手法により、構文構造を埋め込み空間上のグラフ構造として、数学的に見通しよく表現し、学習することが可能になる。
文献:
“Holographic CCG Parsing”. Ryosuke Yamaki, Tadahiro Taniguchi, Daichi Mochihashi.
ACL 2023, pp.262-276, 2023. (Long, Oral)
http://chasen.org/~daiti-m/paper/yamaki23holccg.pdf