start-ver=1.4 cd-journal=joma no-vol=109 cd-vols= no-issue=390 article-no= start-page=1 end-page=6 dt-received= dt-revised= dt-accepted= dt-pub-year=2010 dt-pub=20100118 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Construction of Argument Structure Analyzer Toward Searching Same Situations and Actions kn-title=類似した動作や状況を検索するための意味役割及び動詞語義付与システムの構築(第1回集合知シンポジウム?言語処理が紡ぎ出す未来?) en-subtitle= kn-subtitle= en-abstract=This manuscript proposes an argument structure analyzer that can identify verb meanings and semantic roles of their arguments from not only for sentences but compound nouns. The motivation of development of this analyzer is we need a tool to find the same or quasi-same situations, actions and changes in events. For this purpose various levels of paraphrases should be identified taking into account context, however, the proposed analyzer focus on providing lexicon-based paraphrasable relations i.e., matching "employ/use/utilize these tools" and "employment of these tools''. In this paper we clarify how we construct the modules of the analyzer, i.e., identification of idioms, deverbal-noun-argument identification in compound nouns, identification of content verbs, and identification of predicate verb semantics and their semantic roles on the basis of example based matching. The base data of verb meanings we use is a Japanese Verb Thesaurus build in our previous work and freely distributed. kn-abstract=本研究では類似した動作や状態を検索するための基礎技術として,動作表現の類似関係を付与する項構造付与システムを構築している.項構造とは動詞と名詞の係り関係まで含めて動作の共通部分を記述するもので,例えば「XがYを逮捕する」「Yを捕まえる」には概念を共通していることを示す.本研究ではすでに,4425語(7473語義)の動詞に対して動詞間の項構造関係をシソーラス形式で整理して公開している.そこでこのオントロジーを基に規則ベースの項構造付与システムの構築を行った.本報告では項構造付与に必要なサブタスクとして,慣用句同定,複合名詞内係関係同定,主動詞探索を取り上げ事例による語義決定法について述べる.また,現状での語義付与精度について簡単な評価実験を行う. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= en-aut-name=TsuchiyamaSuguru en-aut-sei=Tsuchiyama en-aut-mei=Suguru kn-aut-name=土山傑 kn-aut-sei=土山 kn-aut-mei=傑 aut-affil-num=2 ORCID= en-aut-name=MoriyaMasato en-aut-sei=Moriya en-aut-mei=Masato kn-aut-name=守屋将人 kn-aut-sei=守屋 kn-aut-mei=将人 aut-affil-num=3 ORCID= en-aut-name=MoriyasuYuuki en-aut-sei=Moriyasu en-aut-mei=Yuuki kn-aut-name=森安祐樹 kn-aut-sei=森安 kn-aut-mei=祐樹 aut-affil-num=4 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学工学部情報工学科 affil-num=3 en-affil= kn-affil=岡山大学工学部情報工学科 affil-num=4 en-affil= kn-affil=岡山大学工学部情報工学科 END start-ver=1.4 cd-journal=joma no-vol=109 cd-vols= no-issue=234 article-no= start-page=13 end-page=18 dt-received= dt-revised= dt-accepted= dt-pub-year=2009 dt-pub=20091009 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Construction of Annotated Corpus of Verb Meanings and Semantic Role Labels Based on Verb Thesaurus kn-title=動詞項構造シソーラスに基づく動詞語義ならびに意味役割付与データの構築 en-subtitle= kn-subtitle= en-abstract=Argument structure is widely recognized as an interface of mapping from grammatical structure of a sentence to shallow semantic structure. In English several large-scale language resources such as FrameNet, Propbank, and Dorr's LCS are proposed and each of them defines a kind of argument structure and some of them construct annotated corpora. These annotated corpora are very useful to build a statistical annotation system of semantic role labels. While in Japanese EDR provided a large-scale annotated corpus of semantic role labels; however the annotated sentences are not collected on the basis of verbs, thus it is hard to utilize the annotated corpus as a training corpus of statistical semantic role label system. Thus we propose another annotation corpus of argument structure on the basis of the Japanese Verb Thesaurus which is provided in previous work. Currently we annotated 1483 sentences for 120 verbs. In this manuscript we confirm that the problem issues of argument structure annotation, current annotation scheme, development of tool and quality of annotated corpus. kn-abstract=文法的構造を基に述語を中心として文の意味を記述する項構造が文の形式的解析から文の意味を処理するためのインターフェースとして期待されている.項構造は述語の語義と係り関係にある要素の役割で記述されるフレームであり,項構造が正しく付与できると,動詞の語義曖昧性解消ならびに同義の言い換えとどの要素が言い換え可能かまで明らかにすることが期待できる.英語ではすでに項構造を人手で付与した大規模コーパスが公開され利用されているが,日本語ではEDRで構築されたものの文書単位で付与されたため学習事例として利用が困難である.そこで本稿では語義の事例を中心に項構造を付与した意味役割付与データ(120語の動詞に対して1483文)を構築し,語義付与に起こる問題と現段階での対処について整理を行う.体系として動詞項構造シソーラスを利用した.項構造を文に付与することで体系の不備を同時に整理することを目標としている.構築した項構造タグ付きコーパスは公開する予定である. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= en-aut-name=MorimotoMaiko en-aut-sei=Morimoto en-aut-mei=Maiko kn-aut-name=森本真依子 kn-aut-sei=森本 kn-aut-mei=真依子 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=109 cd-vols= no-issue=234 article-no= start-page=1 end-page=5 dt-received= dt-revised= dt-accepted= dt-pub-year=2009 dt-pub=20091009 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Bio-medical Term Extraction with Morpho-Syntactic Rules on Simple Rule Language kn-title=SRLを利用した規則ベースの感染症用語抽出 en-subtitle= kn-subtitle= en-abstract=Simple rule language, rule-based term extraction, bio-medical terms, Disease surveillance system Bio-medical term extraction is a key technology for a surveillance system of epidemic disease news from the Web. In the previous work we applied statistical learning model to extract terms from the Web site. The previous approach is good at extracting terms with high precision rates; however it is weak at extracting new terms that do not exist in the training data. Since we usually have new disease names a new term extraction approach with high coverage for unknown or low-frequent terms is needed. Recently, Simple rule Language (SRL), a rule-based word extraction language, is freely available. The SRL also has an developing environment called SRL editor. Thus we are constructing rules of bio-medical terms on the several language (such as English, Japanese, Thai and Vietnam) for the multilingual disease surveillance system. In this manuscript we confirm how we construct rules to extract Japanese bio-medical terms from Japanese news articles. kn-abstract=我々は感染症情報をWeb上から集めて提示するBioCasterシステムを構築している.感染症情報は各国のローカルニュースに速報が出ることが予測されることから英語のみならず日本語を含めたアジア言語での開発を進めている.核となる技術は感染症に関する用語を記事から見つける用語抽出であるが,既存の手法では学習データを利用した統計的学習モデルを利用して構築した.しかしながら,新たな病気など学習データに無い用語が現れた際うまく獲得できないことが予測されるため規則に基づく用語抽出システムの構築を行う.規則ベースで用語を抽出するシステムとしてSRL(Simple Rule Language)が公開されており,ユーザは語構成ならびに文脈を規則で記述することで用語を抽出できる.そこで本研究では感染症情報に必要な用語についてどのようにSRL上で定義できるかについて明らかにする. en-copyright= kn-copyright= en-aut-name=ShinnouTakashi en-aut-sei=Shinnou en-aut-mei=Takashi kn-aut-name=新納貴志 kn-aut-sei=新納 kn-aut-mei=貴志 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= en-aut-name=NigelCollier en-aut-sei=Nigel en-aut-mei=Collier kn-aut-name=ナイジェルコリアー kn-aut-sei=ナイジェル kn-aut-mei=コリアー aut-affil-num=3 ORCID= affil-num=1 en-affil= kn-affil=岡山大学工学部情報工学科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=3 en-affil= kn-affil=国立情報学研究所 END start-ver=1.4 cd-journal=joma no-vol=110 cd-vols= no-issue=245 article-no= start-page=13 end-page=18 dt-received= dt-revised= dt-accepted= dt-pub-year=2010 dt-pub=20101016 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Extraction of Verb Synonyms Using Graph-Based Clustering kn-title=グラフに基づくクラスタリングによる動詞類義語の獲得(自然言語の論理と感情) en-subtitle= kn-subtitle= en-abstract=This manuscript describes evaluation results of Kernel K-means clustering approach comparing with modified Aizawa's co-clustering approach for verb synonym extraction task. Kernel K-means approach is one of the state-of-the-art vector-based clustering method which can divide vector-spaces with non-linear boundary by incorporating Kernel method. Besides the mathematical framework of Kernel K-means can cover Spectral Graph Clustering. In this manuscript, however, we reveal Aizawa's co-clustering approach overcomes Kernel K-means on the verb synonym extraction task (bi-graph clustering) in Japanese. From this results we discuss that the equivalence between graph-vector space in Kernel K-means approach can be limited, and then Kernel K-means decease their accuracy in our verb synonym extraction. kn-abstract=本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトルベースのクラスタリングより精度が高いことを示した.しかし,近年ベクトルベースのクラスタリングでKernel K-meansという非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-meansでのグラフ-ベクトルの等価性には限界があり,本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= en-aut-name=TakahashiHideyuki en-aut-sei=Takahashi en-aut-mei=Hideyuki kn-aut-name=高橋秀幸 kn-aut-sei=高橋 kn-aut-mei=秀幸 aut-affil-num=2 ORCID= en-aut-name=KobayashiDaisuke en-aut-sei=Kobayashi en-aut-mei=Daisuke kn-aut-name=小林大介 kn-aut-sei=小林 kn-aut-mei=大介 aut-affil-num=3 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=3 en-affil= kn-affil=岡山大学工学部情報工学科 END