ID | 49872 |
FullText URL | |
Title Alternative | Extraction of Verb Synonyms Using Graph-Based Clustering
|
Author |
Takahashi, Hideyuki
Kobayashi, Daisuke
|
Abstract | 本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトルベースのクラスタリングより精度が高いことを示した.しかし,近年ベクトルベースのクラスタリングでKernel K-meansという非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-meansでのグラフ-ベクトルの等価性には限界があり,本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する.
|
Abstract Alternative | This manuscript describes evaluation results of Kernel K-means clustering approach comparing with modified Aizawa's co-clustering approach for verb synonym extraction task. Kernel K-means approach is one of the state-of-the-art vector-based clustering method which can divide vector-spaces with non-linear boundary by incorporating Kernel method. Besides the mathematical framework of Kernel K-means can cover Spectral Graph Clustering. In this manuscript, however, we reveal Aizawa's co-clustering approach overcomes Kernel K-means on the verb synonym extraction task (bi-graph clustering) in Japanese. From this results we discuss that the equivalence between graph-vector space in Kernel K-means approach can be limited, and then Kernel K-means decease their accuracy in our verb synonym extraction.
|
Published Date | 2010-10-16
|
Publication Title |
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
|
Volume | volume110
|
Issue | issue245
|
Publisher | 一般社団法人電子情報通信学会
|
Start Page | 13
|
End Page | 18
|
ISSN | 0913-5685
|
NCID | AN10091225
|
Content Type |
Technical Report
|
language |
Japanese
|
Copyright Holders | 一般社団法人電子情報通信学会
|
File Version | publisher
|
Refereed |
True
|