このエントリーをはてなブックマークに追加
ID 49877
フルテキストURL
タイトル(別表記)
Construction of Annotated Corpus of Verb Meanings and Semantic Role Labels Based on Verb Thesaurus
著者
竹内 孔一 岡山大学大学院自然科学研究科 Kaken ID publons researchmap
森本 真依子 岡山大学大学院自然科学研究科
抄録
文法的構造を基に述語を中心として文の意味を記述する項構造が文の形式的解析から文の意味を処理するためのインターフェースとして期待されている.項構造は述語の語義と係り関係にある要素の役割で記述されるフレームであり,項構造が正しく付与できると,動詞の語義曖昧性解消ならびに同義の言い換えとどの要素が言い換え可能かまで明らかにすることが期待できる.英語ではすでに項構造を人手で付与した大規模コーパスが公開され利用されているが,日本語ではEDRで構築されたものの文書単位で付与されたため学習事例として利用が困難である.そこで本稿では語義の事例を中心に項構造を付与した意味役割付与データ(120語の動詞に対して1483文)を構築し,語義付与に起こる問題と現段階での対処について整理を行う.体系として動詞項構造シソーラスを利用した.項構造を文に付与することで体系の不備を同時に整理することを目標としている.構築した項構造タグ付きコーパスは公開する予定である.
抄録(別表記)
Argument structure is widely recognized as an interface of mapping from grammatical structure of a sentence to shallow semantic structure. In English several large-scale language resources such as FrameNet, Propbank, and Dorr's LCS are proposed and each of them defines a kind of argument structure and some of them construct annotated corpora. These annotated corpora are very useful to build a statistical annotation system of semantic role labels. While in Japanese EDR provided a large-scale annotated corpus of semantic role labels; however the annotated sentences are not collected on the basis of verbs, thus it is hard to utilize the annotated corpus as a training corpus of statistical semantic role label system. Thus we propose another annotation corpus of argument structure on the basis of the Japanese Verb Thesaurus which is provided in previous work. Currently we annotated 1483 sentences for 120 verbs. In this manuscript we confirm that the problem issues of argument structure annotation, current annotation scheme, development of tool and quality of annotated corpus.
発行日
2009-10-09
出版物タイトル
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
109巻
234号
出版者
一般社団法人電子情報通信学会
開始ページ
13
終了ページ
18
ISSN
0913-5685
NCID
AN10091225
資料タイプ
テクニカルレポート
言語
日本語
著作権者
一般社団法人電子情報通信学会
論文のバージョン
publisher
査読
有り