電子情報通信学会Acta Medica Okayama091356851183552018参照データとidf を利用した事前採点不要な小論文評価手法103108ENMasayukiOhnoGraduate School of Natural Science and Technology, Okayama UniversityKoichiTakeuchiGraduate School of Natural Science and Technology, Okayama UniversityKotaMotojinGraduate School of Natural Science and Technology, Okayama UniversityYuyaObataGraduate School of Natural Science and Technology, Okayama UniversityMasahiroTaguchiGraduate School of Humanities and Social Science, Okayama UniversityYoshihikoInadaGraduate School of Education, Okayama UniversityMasayaIizukaInstitute for Education and Student Services, Okayama UniversityTatsuhikoAboInstitute for Education and Student Services, Okayama UniversityHitoshiUedaInstitute for Education and Student Services, Okayama University大学入試において2020 年から記述式問題が導入されることから記述式の問題を自動で採点する手法の開発が求められている.本論では,エッセイタイプの小論文課題を対象に,課題に関連する参照データとWikipedia 全文から作成したidf を利用した事前採点不要な自動採点手法を提案する.先行研究において,日本語小論文を対象とした自動採点では,多くの事前採点が必要となり,実際の数百人規模の試験では利用することが難しいと考えられる.そこで本研究では,事前採点が不要な小論文採点手法を提案する.また,小論文の模擬試験を実施して小論文データを構築する.構築した小論文データに対して採点手法を用い,実験を行い評価する.また小論文データの人手による採点に対しても評価を行う.評価実験の結果neologd 辞書を利用した形態素解析器を用いて, idf 値を利用した形態素の一致数が,人手の評価値と相関が高いことを示す.No potential conflict of interest relevant to this article was reported.言語処理学会Acta Medica Okayama242018小論文自動採点データ構築と理解力および妥当性評価手法の構築368371ENMasayukiOhnoKoichiTakeuchiMasahiroTaguchiYoshihikoInadaMasayaIizukaNo potential conflict of interest relevant to this article was reported.電子情報通信学会Acta Medica Okayama091356851172072017小論文採点支援のための関連文書取得法の考察4751ENKotaMotojinGraduate School of Natural Science and Technology, Okayama UniversityKoichiTakeuchiGraduate School of Natural Science and Technology, Okayama UniversityMasayukiOhnoGraduate School of Natural Science and Technology, Okayama UniversityMasahiroTaguchiGraduate School of Natural Science and Technology, Okayama UniversityYoshihikoInadaGraduate School of Natural Science and Technology, Okayama UniversityMasayaIizukaGraduate School of Natural Science and Technology, Okayama UniversityTatsuhikoAboGraduate School of Natural Science and Technology, Okayama UniversityHitoshiUedaGraduate School of Natural Science and Technology, Okayama University本研究では,小論文採点システムにおいて必要となる小論文に関連した文書を取得する方法を開発した.本研究プロジェクトの自動採点の評価軸の1 つに「妥当性」がある.妥当性の評価手法として,小論文の内容がWikipediaの文書の内容と,どの程度一致しているかを基準に妥当性スコアを算出する方法を考えている.しかし,Wikipediaの文書は多様であり,小論文で取り上げていない議題に関する文書も多く存在する.そこで本論文では小論文ごとに適切な文書を取得する方法を提案する.いくつかの手法を試した結果,単語ベクトルを使用した方法が,関連した文書を獲得することができたことを報告する.No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama792017HTML内の並列構造を利用したWebページ上のイベント情報抽出607608ENKoichiTakeuchiNo potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama792017統計的学習モデルを利用した日本語慣用句の意味的曖昧性解消599600ENKoichiTakeuchiNo potential conflict of interest relevant to this article was reported.言語処理学会Acta Medica Okayama232017小論文の自動採点に向けたオープンな基本データの構築 および現段階での自動採点手法の評価839842ENKoichiTakeuchiMasahiroTaguchiYoshihikoInadaMasayaIizukaTatsuhikoAboHitoshiUedaNo potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama0919-60722012-NL-207152012述語の分析に基づく文書解析の考察17ENKoichiTakeuchiNaoTakeuchiYasuhiroIshihara動詞間で共通する意味属性を考慮して,シソーラス上に整理した動詞項構造シソーラスを提案し,形容動詞まで拡張して分析を進めてきた.動詞項構造シソーラスの背景には語彙概念構造という状態変化を主に記述する形式を拡張してきたが,「必要だ」や「必ず〜する」といった主観的な内容を記述する場所が無く,意味記述の中に自然言語で埋めることになっている.本稿では述語の分析から必要となる意味構造の要件を明らかにする.その中でも可能世界意味論に関係している点を事例をもとに明確化し,文書解析のための意味構造について考察する.さらに,人工知能で議論されてきた様相論理,動的命題,設計学,オントロジー工学との関係について概観する.No potential conflict of interest relevant to this article was reported.一般社団法人電子情報通信学会Acta Medica Okayama0913-56851102452010グラフに基づくクラスタリングによる動詞類義語の獲得(自然言語の論理と感情)1318ENKoichiTakeuchiHideyukiTakahashiDaisukeKobayashi本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトルベースのクラスタリングより精度が高いことを示した.しかし,近年ベクトルベースのクラスタリングでKernel K-meansという非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-meansでのグラフ-ベクトルの等価性には限界があり,本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する.No potential conflict of interest relevant to this article was reported.一般社団法人電子情報通信学会Acta Medica Okayama0913-56851093902010類似した動作や状況を検索するための意味役割及び動詞語義付与システムの構築(第1回集合知シンポジウム〜言語処理が紡ぎ出す未来〜)16ENKoichiTakeuchiSuguruTsuchiyamaMasatoMoriyaYuukiMoriyasu本研究では類似した動作や状態を検索するための基礎技術として,動作表現の類似関係を付与する項構造付与システムを構築している.項構造とは動詞と名詞の係り関係まで含めて動作の共通部分を記述するもので,例えば「XがYを逮捕する」「Yを捕まえる」には概念を共通していることを示す.本研究ではすでに,4425語(7473語義)の動詞に対して動詞間の項構造関係をシソーラス形式で整理して公開している.そこでこのオントロジーを基に規則ベースの項構造付与システムの構築を行った.本報告では項構造付与に必要なサブタスクとして,慣用句同定,複合名詞内係関係同定,主動詞探索を取り上げ事例による語義決定法について述べる.また,現状での語義付与精度について簡単な評価実験を行う.No potential conflict of interest relevant to this article was reported.一般社団法人電子情報通信学会Acta Medica Okayama0913-56851092342009SRLを利用した規則ベースの感染症用語抽出15ENTakashiShinnouKoichiTakeuchiCollierNigel我々は感染症情報をWeb上から集めて提示するBioCasterシステムを構築している.感染症情報は各国のローカルニュースに速報が出ることが予測されることから英語のみならず日本語を含めたアジア言語での開発を進めている.核となる技術は感染症に関する用語を記事から見つける用語抽出であるが,既存の手法では学習データを利用した統計的学習モデルを利用して構築した.しかしながら,新たな病気など学習データに無い用語が現れた際うまく獲得できないことが予測されるため規則に基づく用語抽出システムの構築を行う.規則ベースで用語を抽出するシステムとしてSRL(Simple Rule Language)が公開されており,ユーザは語構成ならびに文脈を規則で記述することで用語を抽出できる.そこで本研究では感染症情報に必要な用語についてどのようにSRL上で定義できるかについて明らかにする.No potential conflict of interest relevant to this article was reported.一般社団法人電子情報通信学会Acta Medica Okayama0913-56851092342009動詞項構造シソーラスに基づく動詞語義ならびに意味役割付与データの構築1318ENKoichiTakeuchiMaikoMorimoto文法的構造を基に述語を中心として文の意味を記述する項構造が文の形式的解析から文の意味を処理するためのインターフェースとして期待されている.項構造は述語の語義と係り関係にある要素の役割で記述されるフレームであり,項構造が正しく付与できると,動詞の語義曖昧性解消ならびに同義の言い換えとどの要素が言い換え可能かまで明らかにすることが期待できる.英語ではすでに項構造を人手で付与した大規模コーパスが公開され利用されているが,日本語ではEDRで構築されたものの文書単位で付与されたため学習事例として利用が困難である.そこで本稿では語義の事例を中心に項構造を付与した意味役割付与データ(120語の動詞に対して1483文)を構築し,語義付与に起こる問題と現段階での対処について整理を行う.体系として動詞項構造シソーラスを利用した.項構造を文に付与することで体系の不備を同時に整理することを目標としている.構築した項構造タグ付きコーパスは公開する予定である.No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama091960722009-NL-193132009候補の接続関係を考慮した複合語用語抽出16ENTeruoKoyamaKoichiTakeuchiテキストコーパスからの複合語用語抽出においては、抽出精度を低下させることなく、出現頻度の低い候補まで抽出することが重要である。従来主として用いられてきた統計的手法では、特に低頻度の用語候補の抽出に問題があった。我々はこれまでに用語候補となる複合語を構成する形態素の細分類に応じた位置制約を設定することにより、低頻度の候補まで抽出する方法を提案して来た。今回の発表では、この手法を改善し、多くの用語は文書中に少なくとも一回は提題的な形で出現するという予測の下に、候補となる形態素並びの前後接続関係に制約を設ける方法を提案する。実際にこの方法を適用することによりさらに低頻度の候補まで、抽出精度を落とすことなく取り出せることを確認した。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama0919607220081132008形態素出現パタンに基づく文書集合類似性評価5156ENTeruoKoyamaKoichiTakeuchi類似したテーマを類似した論述構造で扱う文書を集めた文書集合同士では、共通 した形態素利用パタンが出現すると予想される。一方で、形態素出現傾向の相違は、文書集合の間で扱われるテーマあるいは論述構造の相違を示すものと考えられる。本研究では、異なる学会の研究抄録を集めた文書集合について、形態素出現傾向が集合間の類似性や相違を評価する指標として有効であることを確認するとともに、どの形態素が文書集合間の類似性ないしは相違性に寄与しているかを評価する方法について発表する。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama09196072200842008用語クラスタリングに基づく部分研究領域推定と用語分類8792ENTeruoKoyamaKoichiTakeuchi研究抄録テキストコーパスから抽出された用語候補を体系的に整理する一つの有力な方法として、部分研究領域に関連付けた用語の分類を考えることができる。本研究では、動詞概念との共起に基づく用語クラスタリングによって、特定研究分野のいくつかの部分研究領域が同定できることを示すとともに、同定された部分領域との関連により、テキストコーパスから抽出された用語候補の分類が可能であることを示す。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama0919607220071132007グラフ構造に基づく同時クラスタリングを利用した動詞の属性クラスの抽出3944ENKoichiTakeuchiテキスト中に現れる動詞と名詞の格関係を利用して動詞のクラスタリングを行い意味的に類似の集合の構築を目指す.ここでの問題は名詞と動詞はそれぞれ多義であり,かつその語義が観測可能でないことである.本稿ではある名詞の集合と動詞の集合がなすクラスタがある1つのクラスタ (ある潜在的な意味クラスタ) に属すると考え,同時共起クラスタリングを適用する.Web の5億文のデータから獲得された格フレームデータ,ならびに毎日新聞 91 から 98 年を利用して得られた動詞集合について評価することで,本手法により大量のデータがあれば質の良い動詞集合が得られることを明らかにする.No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama0919607220071132007メタファ分析に基づく置換可能な動詞カテゴリの作成3138ENMitsuruIchinoseKoichiTakeuchi動詞と名詞による表現において動詞の意味のずれにより生じるメタファが機械翻訳や要約などの自然言語処理や文章の理解において問題となる場合がある。そのメタファに内在する事実を扱うためには、前もって一般的な表現へと変換処理をする必要があると考えられる。例えば「風が遊ぶ」というメタファを「風が吹く」などの一般的な表現に言い換える処理が必要であろう。本稿ではこの処理に必要となる動詞カテゴリの作成を提案する。実際に 50 の動詞について類似性に基づきカテゴリを作成し考察をすることで、置換可能な動詞間の類似性や共起する名詞の扱い方が動詞カテゴリの網羅性と信頼性の向上にどのように関わるかを明らかにする。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama091960722007762007日本語複合語用語の入れ子関係に基づく階層的体系化4954ENTeruoKoyamaKoichiTakeuchi日本語専門分野テキストコーパスから抽出された日本語複合語用語候補について、候補間の入れ子関係から階層関係を推定し、体系化を行う試みについて発表する。入れ子関係からは、上位語-下位語関係、および関連語関係を推定することが可能であるが、それぞれの関係を別途整理することにより、見通しの良い階層表示が可能となることを示す。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama0919607220061242006日本語専門分野テキストコーパスからの複合語用語の抽出5560ENTeruoKoyamaKyoKageuraKoichiTakeuchiテキストコーパスからの用語抽出は、自然言語処理技術の重要な応用である。従来テキストコーパスから用語候補を抽出する方法として、主として候補出現に関わる統計的指標を用いて用語性を判定する方法が採用されて来たが、統計的手法では出現頻度の低い候補についての判定が困難であった。今回の発表では、複合語に注目し、用語性を損なう形態素出現パターンを排除する形での用語候補抽出を行うことにより、高い精度で複合語用語抽出が可能となることを示す。No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama091960722006942006複合名詞に着目したWeb検索結果のクラスタリング3542ENKazukiHiraoKoichiTakeuchi本稿では複合名詞に着目したWeb検索結果のクラスタリング手法を提案する.本手法では検索結果のタイトルと要約を利用し,階層的で一つの検索結果が複数のクラスタに含まれることを認めるクラスタリングを行う.本手法は次の2つの仮説に基づいている.1)複合名詞は固有の概念を表すため,文書を特徴付けやすい.2)複合名詞間の語構成関係を利用して,部分複合による類概念,および上位下位関係のクラスラベルを作成することで見通しの良いWeb文書の分類ができる.実験の結果,複合名詞の構造は分かりやすいクラスタ構造の形成に利用でき,また自然なラベル付けに有効であった.このことから,複合名詞は検索結果全体を見渡すためのよいインデックスであると言える.No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama091960722006942006名詞の概念体系を利用した規則に基づく意味役割付与モデルの構築1320ENTakuyaShimomuraKoichiTakeuchi本稿では名詞の概念体系辞書と述語のもつ語の概念構造を用いた規則ベースの意味役割付与モデルの構築を提案する.意味役割は名詞と述語との関係から決定されることから,本研究では述語の持つイベント構造と述語がとる名詞との間にどのようなメカニズムが存在するのかを明らかにすることを目標とする.新聞コーバスを対象とした評価実験から,名詞間の概念の類似度を正しく計ること,機能語の単位を正しく取り出すことが精度向上へのポイントであることが明らかになった.No potential conflict of interest relevant to this article was reported.情報処理学会Acta Medica Okayama091960722005942005分類の根拠を明示した動詞語彙概念構造辞書の構築123130ENKoichiTakeuchiKentaroInuiAtsushiFujitaNaoTakeuchiShuyaAbe本研究では語彙概念構造を利用した動詞の辞書データベースを構築する.語彙概念構造は構文上での語の振る舞いを基に意味構造を記述するもので,こうした辞書データは言語処理において特に言語生成,例えば翻訳や言い換え,要約といった応用に必須となる言語資源である.提案する辞書データは語彙概念構造のみを記述するのではなく,語彙概念構造の分析で明らかにする語の振る舞い,ならびに分析の基となる統語テストを記述するため,分類根拠がわかりやすく透明性の高い辞書データとなることが期待できる.No potential conflict of interest relevant to this article was reported.