ID | 49877 |
フルテキストURL | |
タイトル(別表記) | Construction of Annotated Corpus of Verb Meanings and Semantic Role Labels Based on Verb Thesaurus
|
著者 |
森本 真依子
岡山大学大学院自然科学研究科
|
抄録 | 文法的構造を基に述語を中心として文の意味を記述する項構造が文の形式的解析から文の意味を処理するためのインターフェースとして期待されている.項構造は述語の語義と係り関係にある要素の役割で記述されるフレームであり,項構造が正しく付与できると,動詞の語義曖昧性解消ならびに同義の言い換えとどの要素が言い換え可能かまで明らかにすることが期待できる.英語ではすでに項構造を人手で付与した大規模コーパスが公開され利用されているが,日本語ではEDRで構築されたものの文書単位で付与されたため学習事例として利用が困難である.そこで本稿では語義の事例を中心に項構造を付与した意味役割付与データ(120語の動詞に対して1483文)を構築し,語義付与に起こる問題と現段階での対処について整理を行う.体系として動詞項構造シソーラスを利用した.項構造を文に付与することで体系の不備を同時に整理することを目標としている.構築した項構造タグ付きコーパスは公開する予定である.
|
抄録(別表記) | Argument structure is widely recognized as an interface of mapping from grammatical structure of a sentence to shallow semantic structure. In English several large-scale language resources such as FrameNet, Propbank, and Dorr's LCS are proposed and each of them defines a kind of argument structure and some of them construct annotated corpora. These annotated corpora are very useful to build a statistical annotation system of semantic role labels. While in Japanese EDR provided a large-scale annotated corpus of semantic role labels; however the annotated sentences are not collected on the basis of verbs, thus it is hard to utilize the annotated corpus as a training corpus of statistical semantic role label system. Thus we propose another annotation corpus of argument structure on the basis of the Japanese Verb Thesaurus which is provided in previous work. Currently we annotated 1483 sentences for 120 verbs. In this manuscript we confirm that the problem issues of argument structure annotation, current annotation scheme, development of tool and quality of annotated corpus.
|
発行日 | 2009-10-09
|
出版物タイトル |
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
|
巻 | 109巻
|
号 | 234号
|
出版者 | 一般社団法人電子情報通信学会
|
開始ページ | 13
|
終了ページ | 18
|
ISSN | 0913-5685
|
NCID | AN10091225
|
資料タイプ |
テクニカルレポート
|
言語 |
日本語
|
著作権者 | 一般社団法人電子情報通信学会
|
論文のバージョン | publisher
|
査読 |
有り
|