このエントリーをはてなブックマークに追加
ID 49872
FullText URL
Title Alternative
Extraction of Verb Synonyms Using Graph-Based Clustering
Author
Takahashi, Hideyuki
Kobayashi, Daisuke
Abstract
本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトルベースのクラスタリングより精度が高いことを示した.しかし,近年ベクトルベースのクラスタリングでKernel K-meansという非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-meansでのグラフ-ベクトルの等価性には限界があり,本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する.
Abstract Alternative
This manuscript describes evaluation results of Kernel K-means clustering approach comparing with modified Aizawa's co-clustering approach for verb synonym extraction task. Kernel K-means approach is one of the state-of-the-art vector-based clustering method which can divide vector-spaces with non-linear boundary by incorporating Kernel method. Besides the mathematical framework of Kernel K-means can cover Spectral Graph Clustering. In this manuscript, however, we reveal Aizawa's co-clustering approach overcomes Kernel K-means on the verb synonym extraction task (bi-graph clustering) in Japanese. From this results we discuss that the equivalence between graph-vector space in Kernel K-means approach can be limited, and then Kernel K-means decease their accuracy in our verb synonym extraction.
Published Date
2010-10-16
Publication Title
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
Volume
volume110
Issue
issue245
Publisher
一般社団法人電子情報通信学会
Start Page
13
End Page
18
ISSN
0913-5685
NCID
AN10091225
Content Type
Technical Report
language
Japanese
Copyright Holders
一般社団法人電子情報通信学会
File Version
publisher
Refereed
True