このエントリーをはてなブックマークに追加
ID 47734
FullText URL
Title Alternative
A Method for Extracting Composite Terms from Japanese Domain Corpora
Author
Koyama, Teruo
Kageura, Kyo
Abstract
テキストコーパスからの用語抽出は、自然言語処理技術の重要な応用である。従来テキストコーパスから用語候補を抽出する方法として、主として候補出現に関わる統計的指標を用いて用語性を判定する方法が採用されて来たが、統計的手法では出現頻度の低い候補についての判定が困難であった。今回の発表では、複合語に注目し、用語性を損なう形態素出現パターンを排除する形での用語候補抽出を行うことにより、高い精度で複合語用語抽出が可能となることを示す。
Abstract Alternative
Term extraction is one of the most important application of natural language processing technologies. Statistic criteria are widely adopted to evaluate the termhood of the extracted candidates. However, it is difficult to evaluate the termhood of less frequent candidates. In this study we propose a method for Japanese composite term extraction in which unproper morpheme patterns are eliminated. Using the new method, high precision of term extraction can be attained for Japanese composite terms.
Published Date
2006-11-22
Publication Title
情報処理学会研究報告. 自然言語処理研究会報告
Publication Title Alternative
IPSJ SIG Technical Report
Volume
volume2006
Issue
issue124
Publisher
情報処理学会
Publisher Alternative
Information Processing Society of Japan
Start Page
55
End Page
60
ISSN
09196072
NCID
AN10115061
Content Type
Technical Report
Official Url
http://www.bookpark.ne.jp/cm/ipsj/search.asp?flag=6&keyword=IPSJ-NL06176008&mode=PDF
language
日本語
Copyright Holders
ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。Notice for the use of this material The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
File Version
publisher
Refereed
True