このエントリーをはてなブックマークに追加
ID 49872
フルテキストURL
タイトル(別表記)
Extraction of Verb Synonyms Using Graph-Based Clustering
著者
竹内 孔一 岡山大学大学院自然科学研究科
高橋 秀幸 岡山大学大学院自然科学研究科
小林 大介 岡山大学工学部情報工学科
抄録
本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトルベースのクラスタリングより精度が高いことを示した.しかし,近年ベクトルベースのクラスタリングでKernel K-meansという非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-meansでのグラフ-ベクトルの等価性には限界があり,本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する.
抄録(別表記)
This manuscript describes evaluation results of Kernel K-means clustering approach comparing with modified Aizawa's co-clustering approach for verb synonym extraction task. Kernel K-means approach is one of the state-of-the-art vector-based clustering method which can divide vector-spaces with non-linear boundary by incorporating Kernel method. Besides the mathematical framework of Kernel K-means can cover Spectral Graph Clustering. In this manuscript, however, we reveal Aizawa's co-clustering approach overcomes Kernel K-means on the verb synonym extraction task (bi-graph clustering) in Japanese. From this results we discuss that the equivalence between graph-vector space in Kernel K-means approach can be limited, and then Kernel K-means decease their accuracy in our verb synonym extraction.
発行日
2010-10-16
出版物タイトル
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
110巻
245号
出版者
一般社団法人電子情報通信学会
開始ページ
13
終了ページ
18
ISSN
0913-5685
NCID
AN10091225
資料タイプ
テクニカルレポート
言語
Japanese
著作権者
一般社団法人電子情報通信学会
論文のバージョン
publisher
査読
有り