情報処理学会Acta Medica Okayama091960722009-NL-193132009候補の接続関係を考慮した複合語用語抽出16ENTeruoKoyamaKoichiTakeuchiテキストコーパスからの複合語用語抽出においては、抽出精度を低下させることなく、出現頻度の低い候補まで抽出することが重要である。従来主として用いられてきた統計的手法では、特に低頻度の用語候補の抽出に問題があった。我々はこれまでに用語候補となる複合語を構成する形態素の細分類に応じた位置制約を設定することにより、低頻度の候補まで抽出する方法を提案して来た。今回の発表では、この手法を改善し、多くの用語は文書中に少なくとも一回は提題的な形で出現するという予測の下に、候補となる形態素並びの前後接続関係に制約を設ける方法を提案する。実際にこの方法を適用することによりさらに低頻度の候補まで、抽出精度を落とすことなく取り出せることを確認した。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama0919607220081132008形態素出現パタンに基づく文書集合類似性評価5156ENTeruoKoyamaKoichiTakeuchi類似したテーマを類似した論述構造で扱う文書を集めた文書集合同士では、共通 した形態素利用パタンが出現すると予想される。一方で、形態素出現傾向の相違は、文書集合の間で扱われるテーマあるいは論述構造の相違を示すものと考えられる。本研究では、異なる学会の研究抄録を集めた文書集合について、形態素出現傾向が集合間の類似性や相違を評価する指標として有効であることを確認するとともに、どの形態素が文書集合間の類似性ないしは相違性に寄与しているかを評価する方法について発表する。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama09196072200842008用語クラスタリングに基づく部分研究領域推定と用語分類8792ENTeruoKoyamaKoichiTakeuchi研究抄録テキストコーパスから抽出された用語候補を体系的に整理する一つの有力な方法として、部分研究領域に関連付けた用語の分類を考えることができる。本研究では、動詞概念との共起に基づく用語クラスタリングによって、特定研究分野のいくつかの部分研究領域が同定できることを示すとともに、同定された部分領域との関連により、テキストコーパスから抽出された用語候補の分類が可能であることを示す。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama0919607220071132007グラフ構造に基づく同時クラスタリングを利用した動詞の属性クラスの抽出3944ENKoichiTakeuchiテキスト中に現れる動詞と名詞の格関係を利用して動詞のクラスタリングを行い意味的に類似の集合の構築を目指す.ここでの問題は名詞と動詞はそれぞれ多義であり,かつその語義が観測可能でないことである.本稿ではある名詞の集合と動詞の集合がなすクラスタがある1つのクラスタ (ある潜在的な意味クラスタ) に属すると考え,同時共起クラスタリングを適用する.Web の5億文のデータから獲得された格フレームデータ,ならびに毎日新聞 91 から 98 年を利用して得られた動詞集合について評価することで,本手法により大量のデータがあれば質の良い動詞集合が得られることを明らかにする.No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama0919607220071132007メタファ分析に基づく置換可能な動詞カテゴリの作成3138ENMitsuruIchinoseKoichiTakeuchi動詞と名詞による表現において動詞の意味のずれにより生じるメタファが機械翻訳や要約などの自然言語処理や文章の理解において問題となる場合がある。そのメタファに内在する事実を扱うためには、前もって一般的な表現へと変換処理をする必要があると考えられる。例えば「風が遊ぶ」というメタファを「風が吹く」などの一般的な表現に言い換える処理が必要であろう。本稿ではこの処理に必要となる動詞カテゴリの作成を提案する。実際に 50 の動詞について類似性に基づきカテゴリを作成し考察をすることで、置換可能な動詞間の類似性や共起する名詞の扱い方が動詞カテゴリの網羅性と信頼性の向上にどのように関わるかを明らかにする。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama091960722007762007日本語複合語用語の入れ子関係に基づく階層的体系化4954ENTeruoKoyamaKoichiTakeuchi日本語専門分野テキストコーパスから抽出された日本語複合語用語候補について、候補間の入れ子関係から階層関係を推定し、体系化を行う試みについて発表する。入れ子関係からは、上位語-下位語関係、および関連語関係を推定することが可能であるが、それぞれの関係を別途整理することにより、見通しの良い階層表示が可能となることを示す。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama0919607220061242006日本語専門分野テキストコーパスからの複合語用語の抽出5560ENTeruoKoyamaKyoKageuraKoichiTakeuchiテキストコーパスからの用語抽出は、自然言語処理技術の重要な応用である。従来テキストコーパスから用語候補を抽出する方法として、主として候補出現に関わる統計的指標を用いて用語性を判定する方法が採用されて来たが、統計的手法では出現頻度の低い候補についての判定が困難であった。今回の発表では、複合語に注目し、用語性を損なう形態素出現パターンを排除する形での用語候補抽出を行うことにより、高い精度で複合語用語抽出が可能となることを示す。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama091960722006942006複合名詞に着目したWeb検索結果のクラスタリング3542ENKazukiHiraoKoichiTakeuchi本稿では複合名詞に着目したWeb検索結果のクラスタリング手法を提案する.本手法では検索結果のタイトルと要約を利用し,階層的で一つの検索結果が複数のクラスタに含まれることを認めるクラスタリングを行う.本手法は次の2つの仮説に基づいている.1)複合名詞は固有の概念を表すため,文書を特徴付けやすい.2)複合名詞間の語構成関係を利用して,部分複合による類概念,および上位下位関係のクラスラベルを作成することで見通しの良いWeb文書の分類ができる.実験の結果,複合名詞の構造は分かりやすいクラスタ構造の形成に利用でき,また自然なラベル付けに有効であった.このことから,複合名詞は検索結果全体を見渡すためのよいインデックスであると言える.No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama091960722006942006名詞の概念体系を利用した規則に基づく意味役割付与モデルの構築1320ENTakuyaShimomuraKoichiTakeuchi本稿では名詞の概念体系辞書と述語のもつ語の概念構造を用いた規則ベースの意味役割付与モデルの構築を提案する.意味役割は名詞と述語との関係から決定されることから,本研究では述語の持つイベント構造と述語がとる名詞との間にどのようなメカニズムが存在するのかを明らかにすることを目標とする.新聞コーバスを対象とした評価実験から,名詞間の概念の類似度を正しく計ること,機能語の単位を正しく取り出すことが精度向上へのポイントであることが明らかになった.No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama091960722005942005分類の根拠を明示した動詞語彙概念構造辞書の構築123130ENKoichiTakeuchiKentaroInuiAtsushiFujitaNaoTakeuchiShuyaAbe本研究では語彙概念構造を利用した動詞の辞書データベースを構築する.語彙概念構造は構文上での語の振る舞いを基に意味構造を記述するもので,こうした辞書データは言語処理において特に言語生成,例えば翻訳や言い換え,要約といった応用に必須となる言語資源である.提案する辞書データは語彙概念構造のみを記述するのではなく,語彙概念構造の分析で明らかにする語の振る舞い,ならびに分析の基となる統語テストを記述するため,分類根拠がわかりやすく透明性の高い辞書データとなることが期待できる.No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama0919-60722012-NL-207152012述語の分析に基づく文書解析の考察17ENKoichiTakeuchiNaoTakeuchiYasuhiroIshihara動詞間で共通する意味属性を考慮して,シソーラス上に整理した動詞項構造シソーラスを提案し,形容動詞まで拡張して分析を進めてきた.動詞項構造シソーラスの背景には語彙概念構造という状態変化を主に記述する形式を拡張してきたが,「必要だ」や「必ず〜する」といった主観的な内容を記述する場所が無く,意味記述の中に自然言語で埋めることになっている.本稿では述語の分析から必要となる意味構造の要件を明らかにする.その中でも可能世界意味論に関係している点を事例をもとに明確化し,文書解析のための意味構造について考察する.さらに,人工知能で議論されてきた様相論理,動的命題,設計学,オントロジー工学との関係について概観する.No potential conflict of interest relevant to this article was reported.一般社団法人電子情報通信学会Acta Medica Okayama0913-56851102452010グラフに基づくクラスタリングによる動詞類義語の獲得(自然言語の論理と感情)1318ENKoichiTakeuchiHideyukiTakahashiDaisukeKobayashi本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトルベースのクラスタリングより精度が高いことを示した.しかし,近年ベクトルベースのクラスタリングでKernel K-meansという非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-meansでのグラフ-ベクトルの等価性には限界があり,本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する.No potential conflict of interest relevant to this article was reported.一般社団法人電子情報通信学会Acta Medica Okayama0913-56851092342009SRLを利用した規則ベースの感染症用語抽出15ENTakashiShinnouKoichiTakeuchiCollierNigel我々は感染症情報をWeb上から集めて提示するBioCasterシステムを構築している.感染症情報は各国のローカルニュースに速報が出ることが予測されることから英語のみならず日本語を含めたアジア言語での開発を進めている.核となる技術は感染症に関する用語を記事から見つける用語抽出であるが,既存の手法では学習データを利用した統計的学習モデルを利用して構築した.しかしながら,新たな病気など学習データに無い用語が現れた際うまく獲得できないことが予測されるため規則に基づく用語抽出システムの構築を行う.規則ベースで用語を抽出するシステムとしてSRL(Simple Rule Language)が公開されており,ユーザは語構成ならびに文脈を規則で記述することで用語を抽出できる.そこで本研究では感染症情報に必要な用語についてどのようにSRL上で定義できるかについて明らかにする.No potential conflict of interest relevant to this article was reported.一般社団法人電子情報通信学会Acta Medica Okayama0913-56851092342009動詞項構造シソーラスに基づく動詞語義ならびに意味役割付与データの構築1318ENKoichiTakeuchiMaikoMorimoto文法的構造を基に述語を中心として文の意味を記述する項構造が文の形式的解析から文の意味を処理するためのインターフェースとして期待されている.項構造は述語の語義と係り関係にある要素の役割で記述されるフレームであり,項構造が正しく付与できると,動詞の語義曖昧性解消ならびに同義の言い換えとどの要素が言い換え可能かまで明らかにすることが期待できる.英語ではすでに項構造を人手で付与した大規模コーパスが公開され利用されているが,日本語ではEDRで構築されたものの文書単位で付与されたため学習事例として利用が困難である.そこで本稿では語義の事例を中心に項構造を付与した意味役割付与データ(120語の動詞に対して1483文)を構築し,語義付与に起こる問題と現段階での対処について整理を行う.体系として動詞項構造シソーラスを利用した.項構造を文に付与することで体系の不備を同時に整理することを目標としている.構築した項構造タグ付きコーパスは公開する予定である.No potential conflict of interest relevant to this article was reported.一般社団法人電子情報通信学会Acta Medica Okayama0913-56851093902010類似した動作や状況を検索するための意味役割及び動詞語義付与システムの構築(第1回集合知シンポジウム〜言語処理が紡ぎ出す未来〜)16ENKoichiTakeuchiSuguruTsuchiyamaMasatoMoriyaYuukiMoriyasu本研究では類似した動作や状態を検索するための基礎技術として,動作表現の類似関係を付与する項構造付与システムを構築している.項構造とは動詞と名詞の係り関係まで含めて動作の共通部分を記述するもので,例えば「XがYを逮捕する」「Yを捕まえる」には概念を共通していることを示す.本研究ではすでに,4425語(7473語義)の動詞に対して動詞間の項構造関係をシソーラス形式で整理して公開している.そこでこのオントロジーを基に規則ベースの項構造付与システムの構築を行った.本報告では項構造付与に必要なサブタスクとして,慣用句同定,複合名詞内係関係同定,主動詞探索を取り上げ事例による語義決定法について述べる.また,現状での語義付与精度について簡単な評価実験を行う.No potential conflict of interest relevant to this article was reported.