このエントリーをはてなブックマークに追加
ID 47730
フルテキストURL
タイトル(別表記)
An evaluation of document set similarity based on morpheme occurence patterns
著者
小山 照夫 国立情報学研究所
竹内 孔一 岡山大学大学院自然科学研究科 Kaken ID publons researchmap
抄録
研究抄録テキストコーパスから抽出された用語候補を体系的に整理する一つの有力な方法として、部分研究領域に関連付けた用語の分類を考えることができる。本研究では、動詞概念との共起に基づく用語クラスタリングによって、特定研究分野のいくつかの部分研究領域が同定できることを示すとともに、同定された部分領域との関連により、テキストコーパスから抽出された用語候補の分類が可能であることを示す。
抄録(別表記)
Term classification associate to research sub-domain is an important approach for systematized classification of term candidates extracted from text corpora. The authors have developed a method which identify some of the important research sub-domains in research abstract corpora. The authors also proved that relatively frequent term candidates extracted from the corpus can be related to identified sub-domains.
備考
情報処理学会研究報告. 情報学基礎研究会報告 Vol.2008 No.4 pp.87-92
発行日
2008-01-22
出版物タイトル
情報処理学会研究報告. 自然言語処理研究会報告
出版物タイトル(別表記)
IPSJ SIG Technical Report
2008巻
4号
出版者
情報処理学会
出版者(別表記)
Information Processing Society of Japan
開始ページ
87
終了ページ
92
ISSN
09196072
NCID
AN10115061
資料タイプ
テクニカルレポート
オフィシャル URL
http://www.bookpark.ne.jp/cm/ipsj/search.asp?from=&flag=6&keyword=IPSJ-NL08183013&page=0&vn=&ym=&mode=PDF
言語
日本語
著作権者
ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。Notice for the use of this material The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
論文のバージョン
publisher
査読
有り