start-ver=1.4 cd-journal=joma no-vol=2009-NL-193 cd-vols= no-issue=13 article-no= start-page=1 end-page=6 dt-received= dt-revised= dt-accepted= dt-pub-year=2009 dt-pub=20090921 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Term Extraction based on the Forward and Backward Connectivities of Candidates kn-title=候補の接続関係を考慮した複合語用語抽出 en-subtitle= kn-subtitle= en-abstract=In composite term extraction problems, it is important to extract candidates of relatively low occurrences in the corpora, with enough precision. In previous works, we have developed a method which can extract term candidates of low occurrences, using the revised classification of Japanese morphemes. In this paper, we propose a improved method considering forward and backward connective relations of candidates. Using the method, composite term candidates of less occurrences can be extracted with high precision. kn-abstract=テキストコーパスからの複合語用語抽出においては、抽出精度を低下させることなく、出現頻度の低い候補まで抽出することが重要である。従来主として用いられてきた統計的手法では、特に低頻度の用語候補の抽出に問題があった。我々はこれまでに用語候補となる複合語を構成する形態素の細分類に応じた位置制約を設定することにより、低頻度の候補まで抽出する方法を提案して来た。今回の発表では、この手法を改善し、多くの用語は文書中に少なくとも一回は提題的な形で出現するという予測の下に、候補となる形態素並びの前後接続関係に制約を設ける方法を提案する。実際にこの方法を適用することによりさらに低頻度の候補まで、抽出精度を落とすことなく取り出せることを確認した。 en-copyright= kn-copyright= en-aut-name=KoyamaTeruo en-aut-sei=Koyama en-aut-mei=Teruo kn-aut-name=小山照夫 kn-aut-sei=小山 kn-aut-mei=照夫 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=国立情報学研究所 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2008 cd-vols= no-issue=113 article-no= start-page=51 end-page=56 dt-received= dt-revised= dt-accepted= dt-pub-year=2008 dt-pub=20081119 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=An evaluation of document set similarity based on morpheme occurence patterns kn-title=形態素出現パタンに基づく文書集合類似性評価 en-subtitle= kn-subtitle= en-abstract=We can assume that two different document sets may show similar morpheme occurrence patterns, if the sets both discuss about similar topics with similar discussion manners. In this paper, the authors show the occurrence patterns of morphemes really indicates the similarity of the sets. The authors also show the difference of the patterns in both sets indicate the difference of topics or discussion manner between the sets. The authors also show how to find key morphemes that indicate the similarity or difference of the sets. kn-abstract=類似したテーマを類似した論述構造で扱う文書を集めた文書集合同士では、共通 した形態素利用パタンが出現すると予想される。一方で、形態素出現傾向の相違は、文書集合の間で扱われるテーマあるいは論述構造の相違を示すものと考えられる。本研究では、異なる学会の研究抄録を集めた文書集合について、形態素出現傾向が集合間の類似性や相違を評価する指標として有効であることを確認するとともに、どの形態素が文書集合間の類似性ないしは相違性に寄与しているかを評価する方法について発表する。 en-copyright= kn-copyright= en-aut-name=KoyamaTeruo en-aut-sei=Koyama en-aut-mei=Teruo kn-aut-name=小山照夫 kn-aut-sei=小山 kn-aut-mei=照夫 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=国立情報学研究所 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2008 cd-vols= no-issue=4 article-no= start-page=87 end-page=92 dt-received= dt-revised= dt-accepted= dt-pub-year=2008 dt-pub=20080122 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=An evaluation of document set similarity based on morpheme occurence patterns kn-title=用語クラスタリングに基づく部分研究領域推定と用語分類 en-subtitle= kn-subtitle= en-abstract=Term classification associate to research sub-domain is an important approach for systematized classification of term candidates extracted from text corpora. The authors have developed a method which identify some of the important research sub-domains in research abstract corpora. The authors also proved that relatively frequent term candidates extracted from the corpus can be related to identified sub-domains. kn-abstract=研究抄録テキストコーパスから抽出された用語候補を体系的に整理する一つの有力な方法として、部分研究領域に関連付けた用語の分類を考えることができる。本研究では、動詞概念との共起に基づく用語クラスタリングによって、特定研究分野のいくつかの部分研究領域が同定できることを示すとともに、同定された部分領域との関連により、テキストコーパスから抽出された用語候補の分類が可能であることを示す。 en-copyright= kn-copyright= en-aut-name=KoyamaTeruo en-aut-sei=Koyama en-aut-mei=Teruo kn-aut-name=小山照夫 kn-aut-sei=小山 kn-aut-mei=照夫 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=国立情報学研究所 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2007 cd-vols= no-issue=113 article-no= start-page=39 end-page=44 dt-received= dt-revised= dt-accepted= dt-pub-year=2007 dt-pub=20071119 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Constrution of Semantic Verb Class Using Graph-Based Co-clustering Approach kn-title=グラフ構造に基づく同時クラスタリングを利用した動詞の属性クラスの抽出 en-subtitle= kn-subtitle= en-abstract=This paper presents our ongoing research for clustering Japanese verbs for constructing Japanese verb lexicon which is founded on the theory of lexical conceptual structure (LCS). The key issue of this research is how to extract a core cluster of Japanese verbs with a highly relating cluster of nouns because not only verbs but also nouns are polysemouns words. In this paper we applied an approach of co-clustering on the basis of graph sctructure into clustering task of verbs and nouns, and present experimental results on Japanese Verb-Case-Noun data from both large Web corpus and Maichini news paper corpus from 1991 to 1998. kn-abstract=テキスト中に現れる動詞と名詞の格関係を利用して動詞のクラスタリングを行い意味的に類似の集合の構築を目指す.ここでの問題は名詞と動詞はそれぞれ多義であり,かつその語義が観測可能でないことである.本稿ではある名詞の集合と動詞の集合がなすクラスタがある1つのクラスタ (ある潜在的な意味クラスタ) に属すると考え,同時共起クラスタリングを適用する.Web の5億文のデータから獲得された格フレームデータ,ならびに毎日新聞 91 から 98 年を利用して得られた動詞集合について評価することで,本手法により大量のデータがあれば質の良い動詞集合が得られることを明らかにする. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2007 cd-vols= no-issue=113 article-no= start-page=31 end-page=38 dt-received= dt-revised= dt-accepted= dt-pub-year=2007 dt-pub=20071119 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Toward Construction of Verb Thesaurus for Paraphrasing Metaphor Expressions on the Basis of Metaphor Analysis kn-title=メタファ分析に基づく置換可能な動詞カテゴリの作成 en-subtitle= kn-subtitle= en-abstract=Metaphor expression, especially consisting of a noun and verb, is irregular expression thus it is not easy to be dealt with in natural language applications such as machine translation, summarization, and document understanding. We believe it is important that metaphor expressions should be paraphrased into normalized basic expressions in order to extract a fact embedded in the expression: for example a metaphor expression “the wind plays” can be paraphrased into a basic expression “the wind blows”. In order to realize this task, in this paper we propose a verb thesaurus organized on the basis of semantic coherency for verbs. From the work of manual construction of a thesaurus on 50 verbs we discuss the possibility of our approach. kn-abstract=動詞と名詞による表現において動詞の意味のずれにより生じるメタファが機械翻訳や要約などの自然言語処理や文章の理解において問題となる場合がある。そのメタファに内在する事実を扱うためには、前もって一般的な表現へと変換処理をする必要があると考えられる。例えば「風が遊ぶ」というメタファを「風が吹く」などの一般的な表現に言い換える処理が必要であろう。本稿ではこの処理に必要となる動詞カテゴリの作成を提案する。実際に 50 の動詞について類似性に基づきカテゴリを作成し考察をすることで、置換可能な動詞間の類似性や共起する名詞の扱い方が動詞カテゴリの網羅性と信頼性の向上にどのように関わるかを明らかにする。 en-copyright= kn-copyright= en-aut-name=IchinoseMitsuru en-aut-sei=Ichinose en-aut-mei=Mitsuru kn-aut-name=一ノ瀬充 kn-aut-sei=一ノ瀬 kn-aut-mei=充 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2007 cd-vols= no-issue=76 article-no= start-page=49 end-page=54 dt-received= dt-revised= dt-accepted= dt-pub-year=2007 dt-pub=20070724 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Hierarchical Structurization of Japanese Composite Terms based on Nesting Relations kn-title=日本語複合語用語の入れ子関係に基づく階層的体系化 en-subtitle= kn-subtitle= en-abstract=We introduce a method for structurizing term candidates extracted from a Japanese domain corpus, based on nesting relations between the candidates. From the nesting relations, we can infer hypernym-hyponym relations and related term relations. Arranging both relations separately, we can get clearer hierarchical relations. kn-abstract=日本語専門分野テキストコーパスから抽出された日本語複合語用語候補について、候補間の入れ子関係から階層関係を推定し、体系化を行う試みについて発表する。入れ子関係からは、上位語-下位語関係、および関連語関係を推定することが可能であるが、それぞれの関係を別途整理することにより、見通しの良い階層表示が可能となることを示す。 en-copyright= kn-copyright= en-aut-name=KoyamaTeruo en-aut-sei=Koyama en-aut-mei=Teruo kn-aut-name=小山照夫 kn-aut-sei=小山 kn-aut-mei=照夫 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=国立情報学研究所 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 en-keyword=用語抽出 kn-keyword=用語抽出 en-keyword=用語体系化 kn-keyword=用語体系化 en-keyword=用語階層関係 kn-keyword=用語階層関係 END start-ver=1.4 cd-journal=joma no-vol=2006 cd-vols= no-issue=124 article-no= start-page=55 end-page=60 dt-received= dt-revised= dt-accepted= dt-pub-year=2006 dt-pub=20061122 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=A Method for Extracting Composite Terms from Japanese Domain Corpora kn-title=日本語専門分野テキストコーパスからの複合語用語の抽出 en-subtitle= kn-subtitle= en-abstract=Term extraction is one of the most important application of natural language processing technologies. Statistic criteria are widely adopted to evaluate the termhood of the extracted candidates. However, it is difficult to evaluate the termhood of less frequent candidates. In this study we propose a method for Japanese composite term extraction in which unproper morpheme patterns are eliminated. Using the new method, high precision of term extraction can be attained for Japanese composite terms. kn-abstract=テキストコーパスからの用語抽出は、自然言語処理技術の重要な応用である。従来テキストコーパスから用語候補を抽出する方法として、主として候補出現に関わる統計的指標を用いて用語性を判定する方法が採用されて来たが、統計的手法では出現頻度の低い候補についての判定が困難であった。今回の発表では、複合語に注目し、用語性を損なう形態素出現パターンを排除する形での用語候補抽出を行うことにより、高い精度で複合語用語抽出が可能となることを示す。 en-copyright= kn-copyright= en-aut-name=KoyamaTeruo en-aut-sei=Koyama en-aut-mei=Teruo kn-aut-name=小山照夫 kn-aut-sei=小山 kn-aut-mei=照夫 aut-affil-num=1 ORCID= en-aut-name=KageuraKyo en-aut-sei=Kageura en-aut-mei=Kyo kn-aut-name=影浦峡 kn-aut-sei=影浦 kn-aut-mei=峡 aut-affil-num=2 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=3 ORCID= affil-num=1 en-affil= kn-affil=国立情報学研究所 affil-num=2 en-affil= kn-affil=東京大学大学院教育学研究科 affil-num=3 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2006 cd-vols= no-issue=94 article-no= start-page=35 end-page=42 dt-received= dt-revised= dt-accepted= dt-pub-year=2006 dt-pub=20060912 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Web Search Result Clustering Based on Structure of Compound Nouns kn-title=複合名詞に着目したWeb検索結果のクラスタリング en-subtitle= kn-subtitle= en-abstract=In this paper, we propose a aclustering method based on structure of compound nouns. Japanese compound nouns usually provide concrete concepts, thus we can assume that compound nouns must be a good clue to index documents for Web document clustering. The other benefit of using compound nouns is their compositional structure that can ve divided into sub concepts. This indicates that we can construct hierarchical Web document clustering based on their strcture. From the practical experiments of constructing hierarchical clusters on the results of a Web search engine, we succeeded in showing that the clearly lusterized web documents with understandable hierarchical indexes of compound nouns. kn-abstract=本稿では複合名詞に着目したWeb検索結果のクラスタリング手法を提案する.本手法では検索結果のタイトルと要約を利用し,階層的で一つの検索結果が複数のクラスタに含まれることを認めるクラスタリングを行う.本手法は次の2つの仮説に基づいている.1)複合名詞は固有の概念を表すため,文書を特徴付けやすい.2)複合名詞間の語構成関係を利用して,部分複合による類概念,および上位下位関係のクラスラベルを作成することで見通しの良いWeb文書の分類ができる.実験の結果,複合名詞の構造は分かりやすいクラスタ構造の形成に利用でき,また自然なラベル付けに有効であった.このことから,複合名詞は検索結果全体を見渡すためのよいインデックスであると言える. en-copyright= kn-copyright= en-aut-name=HiraoKazuki en-aut-sei=Hirao en-aut-mei=Kazuki kn-aut-name=平尾一樹 kn-aut-sei=平尾 kn-aut-mei=一樹 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2006 cd-vols= no-issue=94 article-no= start-page=13 end-page=20 dt-received= dt-revised= dt-accepted= dt-pub-year=2006 dt-pub=20060912 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Construction of rule-based model for semantic role labeling with the EDR thesaurus and an LCS dictionary kn-title=名詞の概念体系を利用した規則に基づく意味役割付与モデルの構築 en-subtitle= kn-subtitle= en-abstract=We present a rule-based model for semantic role labelingbecause semantic role labels should be assigned by means of metoric relationsips between mouns and vers. The purpose of this resarch is to reveal the this resarch is to reveal the restritional and preference rules between nouns and verbs. Our model uses the EDR thesaurus as semantics of nouns, and a lexical conceptual structure dictionary as verb semantics. Experimental results show that dealing with systemantic nominal categorization is the key to improve the accuracy of semantic role labeling. kn-abstract=本稿では名詞の概念体系辞書と述語のもつ語の概念構造を用いた規則ベースの意味役割付与モデルの構築を提案する.意味役割は名詞と述語との関係から決定されることから,本研究では述語の持つイベント構造と述語がとる名詞との間にどのようなメカニズムが存在するのかを明らかにすることを目標とする.新聞コーバスを対象とした評価実験から,名詞間の概念の類似度を正しく計ること,機能語の単位を正しく取り出すことが精度向上へのポイントであることが明らかになった. en-copyright= kn-copyright= en-aut-name=ShimomuraTakuya en-aut-sei=Shimomura en-aut-mei=Takuya kn-aut-name=下村拓也 kn-aut-sei=下村 kn-aut-mei=拓也 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2005 cd-vols= no-issue=94 article-no= start-page=123 end-page=130 dt-received= dt-revised= dt-accepted= dt-pub-year=2005 dt-pub=20050930 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Construction of Compositional Lexical Database Based on Lexical Conceptual Structure kn-title=分類の根拠を明示した動詞語彙概念構造辞書の構築 en-subtitle= kn-subtitle= en-abstract=This paper presents our ongoing research for constructing a Japanese verb lexicon which is founded on the theory of lexical conceptual structure (LCS). LCS provides a framework for capturing the relation between syntactic behaviors of lexical items and their semantic properties, which is useful for a range of NLP tasks including translation, paraphrasing and summarization. We discuss design issues involved in LCS dictionary development, and present an overview of the current specification of the lexicon, which is designed to allow successive future refinements. kn-abstract=本研究では語彙概念構造を利用した動詞の辞書データベースを構築する.語彙概念構造は構文上での語の振る舞いを基に意味構造を記述するもので,こうした辞書データは言語処理において特に言語生成,例えば翻訳や言い換え,要約といった応用に必須となる言語資源である.提案する辞書データは語彙概念構造のみを記述するのではなく,語彙概念構造の分析で明らかにする語の振る舞い,ならびに分析の基となる統語テストを記述するため,分類根拠がわかりやすく透明性の高い辞書データとなることが期待できる. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= en-aut-name=InuiKentaro en-aut-sei=Inui en-aut-mei=Kentaro kn-aut-name=乾健太郎 kn-aut-sei=乾 kn-aut-mei=健太郎 aut-affil-num=2 ORCID= en-aut-name=FujitaAtsushi en-aut-sei=Fujita en-aut-mei=Atsushi kn-aut-name=藤田篤 kn-aut-sei=藤田 kn-aut-mei=篤 aut-affil-num=3 ORCID= en-aut-name=TakeuchiNao en-aut-sei=Takeuchi en-aut-mei=Nao kn-aut-name=竹内奈央 kn-aut-sei=竹内 kn-aut-mei=奈央 aut-affil-num=4 ORCID= en-aut-name=AbeShuya en-aut-sei=Abe en-aut-mei=Shuya kn-aut-name=阿部修也 kn-aut-sei=阿部 kn-aut-mei=修也 aut-affil-num=5 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=奈良先端科学技術大学院大学 affil-num=3 en-affil= kn-affil=京都大学情報学研究科 affil-num=4 en-affil= kn-affil= affil-num=5 en-affil= kn-affil=奈良先端科学技術大学院大学 END start-ver=1.4 cd-journal=joma no-vol=2012-NL-207 cd-vols= no-issue=15 article-no= start-page=1 end-page=7 dt-received= dt-revised= dt-accepted= dt-pub-year=2012 dt-pub=20120719 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Discussion of Possible Semantic Description for Documents Based on Analysis of Predicate-Argument Structure kn-title=述語の分析に基づく文書解析の考察 en-subtitle= kn-subtitle= en-abstract=The results of our previous work of construction of Japanese verb thesaurus revealed that a verb meaning often contains not only action or change-of-state meaning, i.e., objective meaning, but subjective meanings. To describe verb meaning, lexical conceptual structure was applied, but it does not have a place of subjective and modal meaning; then they are described using natural language embedded in an extended LCS-based schema. Modal logic gives us a description framework, but verb meanings have more complex meaning, such as event attributes, progress and possibility. In the manuscript we summarize the wide variety of verb and adjective verb meaning from the view of change-of-state and subjective meaning, then discuss a description framework of them according to modal logic study. kn-abstract=動詞間で共通する意味属性を考慮して,シソーラス上に整理した動詞項構造シソーラスを提案し,形容動詞まで拡張して分析を進めてきた.動詞項構造シソーラスの背景には語彙概念構造という状態変化を主に記述する形式を拡張してきたが,「必要だ」や「必ず〜する」といった主観的な内容を記述する場所が無く,意味記述の中に自然言語で埋めることになっている.本稿では述語の分析から必要となる意味構造の要件を明らかにする.その中でも可能世界意味論に関係している点を事例をもとに明確化し,文書解析のための意味構造について考察する.さらに,人工知能で議論されてきた様相論理,動的命題,設計学,オントロジー工学との関係について概観する. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= en-aut-name=TakeuchiNao en-aut-sei=Takeuchi en-aut-mei=Nao kn-aut-name=竹内奈央 kn-aut-sei=竹内 kn-aut-mei=奈央 aut-affil-num=2 ORCID= en-aut-name=IshiharaYasuhiro en-aut-sei=Ishihara en-aut-mei=Yasuhiro kn-aut-name=石原靖弘 kn-aut-sei=石原 kn-aut-mei=靖弘 aut-affil-num=3 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院 affil-num=2 en-affil= kn-affil= affil-num=3 en-affil= kn-affil=岡山大学大学院 END start-ver=1.4 cd-journal=joma no-vol=110 cd-vols= no-issue=245 article-no= start-page=13 end-page=18 dt-received= dt-revised= dt-accepted= dt-pub-year=2010 dt-pub=20101016 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Extraction of Verb Synonyms Using Graph-Based Clustering kn-title=グラフに基づくクラスタリングによる動詞類義語の獲得(自然言語の論理と感情) en-subtitle= kn-subtitle= en-abstract=This manuscript describes evaluation results of Kernel K-means clustering approach comparing with modified Aizawa's co-clustering approach for verb synonym extraction task. Kernel K-means approach is one of the state-of-the-art vector-based clustering method which can divide vector-spaces with non-linear boundary by incorporating Kernel method. Besides the mathematical framework of Kernel K-means can cover Spectral Graph Clustering. In this manuscript, however, we reveal Aizawa's co-clustering approach overcomes Kernel K-means on the verb synonym extraction task (bi-graph clustering) in Japanese. From this results we discuss that the equivalence between graph-vector space in Kernel K-means approach can be limited, and then Kernel K-means decease their accuracy in our verb synonym extraction. kn-abstract=本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトルベースのクラスタリングより精度が高いことを示した.しかし,近年ベクトルベースのクラスタリングでKernel K-meansという非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-meansでのグラフ-ベクトルの等価性には限界があり,本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= en-aut-name=TakahashiHideyuki en-aut-sei=Takahashi en-aut-mei=Hideyuki kn-aut-name=高橋秀幸 kn-aut-sei=高橋 kn-aut-mei=秀幸 aut-affil-num=2 ORCID= en-aut-name=KobayashiDaisuke en-aut-sei=Kobayashi en-aut-mei=Daisuke kn-aut-name=小林大介 kn-aut-sei=小林 kn-aut-mei=大介 aut-affil-num=3 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=3 en-affil= kn-affil=岡山大学工学部情報工学科 END start-ver=1.4 cd-journal=joma no-vol=109 cd-vols= no-issue=234 article-no= start-page=1 end-page=5 dt-received= dt-revised= dt-accepted= dt-pub-year=2009 dt-pub=20091009 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Bio-medical Term Extraction with Morpho-Syntactic Rules on Simple Rule Language kn-title=SRLを利用した規則ベースの感染症用語抽出 en-subtitle= kn-subtitle= en-abstract=Simple rule language, rule-based term extraction, bio-medical terms, Disease surveillance system Bio-medical term extraction is a key technology for a surveillance system of epidemic disease news from the Web. In the previous work we applied statistical learning model to extract terms from the Web site. The previous approach is good at extracting terms with high precision rates; however it is weak at extracting new terms that do not exist in the training data. Since we usually have new disease names a new term extraction approach with high coverage for unknown or low-frequent terms is needed. Recently, Simple rule Language (SRL), a rule-based word extraction language, is freely available. The SRL also has an developing environment called SRL editor. Thus we are constructing rules of bio-medical terms on the several language (such as English, Japanese, Thai and Vietnam) for the multilingual disease surveillance system. In this manuscript we confirm how we construct rules to extract Japanese bio-medical terms from Japanese news articles. kn-abstract=我々は感染症情報をWeb上から集めて提示するBioCasterシステムを構築している.感染症情報は各国のローカルニュースに速報が出ることが予測されることから英語のみならず日本語を含めたアジア言語での開発を進めている.核となる技術は感染症に関する用語を記事から見つける用語抽出であるが,既存の手法では学習データを利用した統計的学習モデルを利用して構築した.しかしながら,新たな病気など学習データに無い用語が現れた際うまく獲得できないことが予測されるため規則に基づく用語抽出システムの構築を行う.規則ベースで用語を抽出するシステムとしてSRL(Simple Rule Language)が公開されており,ユーザは語構成ならびに文脈を規則で記述することで用語を抽出できる.そこで本研究では感染症情報に必要な用語についてどのようにSRL上で定義できるかについて明らかにする. en-copyright= kn-copyright= en-aut-name=ShinnouTakashi en-aut-sei=Shinnou en-aut-mei=Takashi kn-aut-name=新納貴志 kn-aut-sei=新納 kn-aut-mei=貴志 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= en-aut-name=NigelCollier en-aut-sei=Nigel en-aut-mei=Collier kn-aut-name=ナイジェルコリアー kn-aut-sei=ナイジェル kn-aut-mei=コリアー aut-affil-num=3 ORCID= affil-num=1 en-affil= kn-affil=岡山大学工学部情報工学科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=3 en-affil= kn-affil=国立情報学研究所 END start-ver=1.4 cd-journal=joma no-vol=109 cd-vols= no-issue=234 article-no= start-page=13 end-page=18 dt-received= dt-revised= dt-accepted= dt-pub-year=2009 dt-pub=20091009 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Construction of Annotated Corpus of Verb Meanings and Semantic Role Labels Based on Verb Thesaurus kn-title=動詞項構造シソーラスに基づく動詞語義ならびに意味役割付与データの構築 en-subtitle= kn-subtitle= en-abstract=Argument structure is widely recognized as an interface of mapping from grammatical structure of a sentence to shallow semantic structure. In English several large-scale language resources such as FrameNet, Propbank, and Dorr's LCS are proposed and each of them defines a kind of argument structure and some of them construct annotated corpora. These annotated corpora are very useful to build a statistical annotation system of semantic role labels. While in Japanese EDR provided a large-scale annotated corpus of semantic role labels; however the annotated sentences are not collected on the basis of verbs, thus it is hard to utilize the annotated corpus as a training corpus of statistical semantic role label system. Thus we propose another annotation corpus of argument structure on the basis of the Japanese Verb Thesaurus which is provided in previous work. Currently we annotated 1483 sentences for 120 verbs. In this manuscript we confirm that the problem issues of argument structure annotation, current annotation scheme, development of tool and quality of annotated corpus. kn-abstract=文法的構造を基に述語を中心として文の意味を記述する項構造が文の形式的解析から文の意味を処理するためのインターフェースとして期待されている.項構造は述語の語義と係り関係にある要素の役割で記述されるフレームであり,項構造が正しく付与できると,動詞の語義曖昧性解消ならびに同義の言い換えとどの要素が言い換え可能かまで明らかにすることが期待できる.英語ではすでに項構造を人手で付与した大規模コーパスが公開され利用されているが,日本語ではEDRで構築されたものの文書単位で付与されたため学習事例として利用が困難である.そこで本稿では語義の事例を中心に項構造を付与した意味役割付与データ(120語の動詞に対して1483文)を構築し,語義付与に起こる問題と現段階での対処について整理を行う.体系として動詞項構造シソーラスを利用した.項構造を文に付与することで体系の不備を同時に整理することを目標としている.構築した項構造タグ付きコーパスは公開する予定である. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= en-aut-name=MorimotoMaiko en-aut-sei=Morimoto en-aut-mei=Maiko kn-aut-name=森本真依子 kn-aut-sei=森本 kn-aut-mei=真依子 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=109 cd-vols= no-issue=390 article-no= start-page=1 end-page=6 dt-received= dt-revised= dt-accepted= dt-pub-year=2010 dt-pub=20100118 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Construction of Argument Structure Analyzer Toward Searching Same Situations and Actions kn-title=類似した動作や状況を検索するための意味役割及び動詞語義付与システムの構築(第1回集合知シンポジウム〜言語処理が紡ぎ出す未来〜) en-subtitle= kn-subtitle= en-abstract=This manuscript proposes an argument structure analyzer that can identify verb meanings and semantic roles of their arguments from not only for sentences but compound nouns. The motivation of development of this analyzer is we need a tool to find the same or quasi-same situations, actions and changes in events. For this purpose various levels of paraphrases should be identified taking into account context, however, the proposed analyzer focus on providing lexicon-based paraphrasable relations i.e., matching "employ/use/utilize these tools" and "employment of these tools''. In this paper we clarify how we construct the modules of the analyzer, i.e., identification of idioms, deverbal-noun-argument identification in compound nouns, identification of content verbs, and identification of predicate verb semantics and their semantic roles on the basis of example based matching. The base data of verb meanings we use is a Japanese Verb Thesaurus build in our previous work and freely distributed. kn-abstract=本研究では類似した動作や状態を検索するための基礎技術として,動作表現の類似関係を付与する項構造付与システムを構築している.項構造とは動詞と名詞の係り関係まで含めて動作の共通部分を記述するもので,例えば「XがYを逮捕する」「Yを捕まえる」には概念を共通していることを示す.本研究ではすでに,4425語(7473語義)の動詞に対して動詞間の項構造関係をシソーラス形式で整理して公開している.そこでこのオントロジーを基に規則ベースの項構造付与システムの構築を行った.本報告では項構造付与に必要なサブタスクとして,慣用句同定,複合名詞内係関係同定,主動詞探索を取り上げ事例による語義決定法について述べる.また,現状での語義付与精度について簡単な評価実験を行う. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= en-aut-name=TsuchiyamaSuguru en-aut-sei=Tsuchiyama en-aut-mei=Suguru kn-aut-name=土山傑 kn-aut-sei=土山 kn-aut-mei=傑 aut-affil-num=2 ORCID= en-aut-name=MoriyaMasato en-aut-sei=Moriya en-aut-mei=Masato kn-aut-name=守屋将人 kn-aut-sei=守屋 kn-aut-mei=将人 aut-affil-num=3 ORCID= en-aut-name=MoriyasuYuuki en-aut-sei=Moriyasu en-aut-mei=Yuuki kn-aut-name=森安祐樹 kn-aut-sei=森安 kn-aut-mei=祐樹 aut-affil-num=4 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学工学部情報工学科 affil-num=3 en-affil= kn-affil=岡山大学工学部情報工学科 affil-num=4 en-affil= kn-affil=岡山大学工学部情報工学科 END