ID | 47728 |
FullText URL | |
Title Alternative | Term Extraction based on the Forward and Backward Connectivities of Candidates
|
Author |
Koyama, Teruo
|
Abstract | テキストコーパスからの複合語用語抽出においては、抽出精度を低下させることなく、出現頻度の低い候補まで抽出することが重要である。従来主として用いられてきた統計的手法では、特に低頻度の用語候補の抽出に問題があった。我々はこれまでに用語候補となる複合語を構成する形態素の細分類に応じた位置制約を設定することにより、低頻度の候補まで抽出する方法を提案して来た。今回の発表では、この手法を改善し、多くの用語は文書中に少なくとも一回は提題的な形で出現するという予測の下に、候補となる形態素並びの前後接続関係に制約を設ける方法を提案する。実際にこの方法を適用することによりさらに低頻度の候補まで、抽出精度を落とすことなく取り出せることを確認した。
|
Abstract Alternative | In composite term extraction problems, it is important to extract candidates of relatively low occurrences in the corpora, with enough precision. In previous works, we have developed a method which can extract term candidates of low occurrences, using the revised classification of Japanese morphemes. In this paper, we propose a improved method considering forward and backward connective relations of candidates. Using the method, composite term candidates of less occurrences can be extracted with high precision.
|
Published Date | 2009-09-21
|
Publication Title |
情報処理学会研究報告. 自然言語処理研究会報告
|
Publication Title Alternative | IPSJ SIG Technical Report
|
Volume | volume2009-NL-193
|
Issue | issue13
|
Publisher | 情報処理学会
|
Publisher Alternative | Information Processing Society of Japan
|
Start Page | 1
|
End Page | 6
|
ISSN | 09196072
|
NCID | AN10115061
|
Content Type |
Technical Report
|
Official Url | http://www.bookpark.ne.jp/cm/ipsj/search.asp?flag=6&keyword=IPSJ-NL09193013&mode=PDF
|
language |
Japanese
|
Copyright Holders | ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。Notice for the use of this material The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, © 2009 Information Processing Society of Japan.
|
File Version | publisher
|
Refereed |
True
|