start-ver=1.4 cd-journal=joma no-vol=65 cd-vols= no-issue=10 article-no= start-page=1488 end-page=1500 dt-received= dt-revised= dt-accepted= dt-pub-year=2024 dt-pub=20241015 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=A Method for Inter-Broadcaster Data Integration of Non-Identifiable Television Viewing Log kn-title=非特定テレビ視聴履歴データの放送局間統合手法 en-subtitle= kn-subtitle= en-abstract=Recently, TV broadcasters have been collecting and utilizing non-personal TV viewing log data, including start and end times of viewing, from TVs connected to the Internet in a format that does not identify individual viewers. However, since each broadcaster can only use its own non-personal TV viewing log data, it has not yet been able to obtain useful knowledge despite the vast amount of data it has accumulated. In addition, the collection methods and data granularity of non-personal TV viewing log data vary from station to station, and the data accumulated by each station cannot be integrated and used. In this paper, we propose a method for matching non-specific viewing history data collected by each broadcaster using its own method, and design and implement a simulator to evaluate the proposed method. The proposed method estimates that TVs whose channel transition timing matches five items collected at the time of viewing history data collection (IP address, zip code, manufacturer ID, browser major version, and browser minor version) are the same TVs. In addition, we designed a simulator that reproduces viewer behavior and applied this method to the viewing history data synthesized from the simulator. As a result, we succeeded in matching approximately 2.41 million TVs out of the 2.5 million units of data generated, showing an identification rate of 96.5%. kn-abstract=近年,各テレビ放送局において,個人を特定しない形式で,インターネット接続されたテレビから視聴開始時刻や視聴終了時刻等を含む非特定視聴履歴データを収集し,利活用する取り組みが進められている.しかし,各放送局は自局の非特定視聴履歴データしか利用できないため,膨大なデータを蓄積しているにもかかわらず,有用な知見を得るまでに至っていないのが現状である.さらに,非特定視聴履歴データの収集方式やデータ粒度は,各局各様となっており,各局が蓄積したデータを統合し,利用することもできていない.そこで本論文では,各局が独自の方式で取得している非特定視聴履歴データを放送局間で統合する手法を提案し,評価するためのシミュレータ設計と実装を行い,提案手法の評価を行う.
提案手法では,各局の視聴履歴データのうち,共通しているIPアドレス・郵便番号・メーカID・ブラウザメジャーバージョン・ブラウザマイナーバージョンの5項目でテレビ受像機を分離処理する.そして,分離された中でこれらの5項目が一致するテレビのうち,さらにチャンネル遷移時刻が一致するテレビを同一テレビと推定する.また,視聴者行動を再現するシミュレータを設計し,そのシミュレータから合成された視聴履歴データに対して,本手法を適用した結果,生成された250万台分のデータのうち約241万台のテレビIDのマッチングに成功し,再現率96.5%であることを示した. en-copyright= kn-copyright= en-aut-name=MatsudaHiroki en-aut-sei=Matsuda en-aut-mei=Hiroki kn-aut-name=松田裕貴 kn-aut-sei=松田 kn-aut-mei=裕貴 aut-affil-num=1 ORCID= en-aut-name=SakakibaraTaichi en-aut-sei=Sakakibara en-aut-mei=Taichi kn-aut-name=榊原太一 kn-aut-sei=榊原 kn-aut-mei=太一 aut-affil-num=2 ORCID= en-aut-name=MayumiDaiki en-aut-sei=Mayumi en-aut-mei=Daiki kn-aut-name=真弓大輝 kn-aut-sei=真弓 kn-aut-mei=大輝 aut-affil-num=3 ORCID= en-aut-name=MatsudaYuki en-aut-sei=Matsuda en-aut-mei=Yuki kn-aut-name=松田裕貴 kn-aut-sei=松田 kn-aut-mei=裕貴 aut-affil-num=4 ORCID= en-aut-name=MizumotoTeruhiro en-aut-sei=Mizumoto en-aut-mei=Teruhiro kn-aut-name=水本旭洋 kn-aut-sei=水本 kn-aut-mei=旭洋 aut-affil-num=5 ORCID= en-aut-name=YasumotoKeiichi en-aut-sei=Yasumoto en-aut-mei=Keiichi kn-aut-name=安本慶一 kn-aut-sei=安本 kn-aut-mei=慶一 aut-affil-num=6 ORCID= affil-num=1 en-affil=Nara Institute of Science and Technology kn-affil=奈良先端科学技術大学院大学 affil-num=2 en-affil=Yomiuri Telecasting Corporation kn-affil=讀賣テレビ放送株式会社 affil-num=3 en-affil=Nara Institute of Science and Technology kn-affil=奈良先端科学技術大学院大学 affil-num=4 en-affil=Okayama University kn-affil=岡山大学 affil-num=5 en-affil=Chiba Institute of Technology kn-affil=千葉工業大学 affil-num=6 en-affil=Nara Institute of Science and Technology kn-affil=奈良先端科学技術大学院大学 en-keyword=テレビ (TV) kn-keyword=テレビ (TV) en-keyword=視聴履歴データ (TV viewing log data) kn-keyword=視聴履歴データ (TV viewing log data) en-keyword=ビッグデータ (Big data) kn-keyword=ビッグデータ (Big data) en-keyword=IoT kn-keyword=IoT en-keyword=クロスデバイスマッチング (Cross-device matching) kn-keyword=クロスデバイスマッチング (Cross-device matching) en-keyword=クロスデバイストラッキング (Cross-device tracking) kn-keyword=クロスデバイストラッキング (Cross-device tracking) END start-ver=1.4 cd-journal=joma no-vol=79 cd-vols= no-issue= article-no= start-page=607 end-page=608 dt-received= dt-revised= dt-accepted= dt-pub-year=2017 dt-pub=201703 dt-online= en-article= kn-article= en-subject= kn-subject= en-title= kn-title=HTML内の並列構造を利用したWebページ上のイベント情報抽出 en-subtitle= kn-subtitle= en-abstract= kn-abstract= en-copyright= kn-copyright= en-aut-name= en-aut-sei= en-aut-mei= kn-aut-name=河村一希 kn-aut-sei=河村 kn-aut-mei=一希 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=79 cd-vols= no-issue= article-no= start-page=599 end-page=600 dt-received= dt-revised= dt-accepted= dt-pub-year=2017 dt-pub=201703 dt-online= en-article= kn-article= en-subject= kn-subject= en-title= kn-title=統計的学習モデルを利用した日本語慣用句の意味的曖昧性解消 en-subtitle= kn-subtitle= en-abstract= kn-abstract= en-copyright= kn-copyright= en-aut-name= en-aut-sei= en-aut-mei= kn-aut-name=宮田周 kn-aut-sei=宮田 kn-aut-mei=周 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2012-NL-207 cd-vols= no-issue=15 article-no= start-page=1 end-page=7 dt-received= dt-revised= dt-accepted= dt-pub-year=2012 dt-pub=20120719 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Discussion of Possible Semantic Description for Documents Based on Analysis of Predicate-Argument Structure kn-title=述語の分析に基づく文書解析の考察 en-subtitle= kn-subtitle= en-abstract=The results of our previous work of construction of Japanese verb thesaurus revealed that a verb meaning often contains not only action or change-of-state meaning, i.e., objective meaning, but subjective meanings. To describe verb meaning, lexical conceptual structure was applied, but it does not have a place of subjective and modal meaning; then they are described using natural language embedded in an extended LCS-based schema. Modal logic gives us a description framework, but verb meanings have more complex meaning, such as event attributes, progress and possibility. In the manuscript we summarize the wide variety of verb and adjective verb meaning from the view of change-of-state and subjective meaning, then discuss a description framework of them according to modal logic study. kn-abstract=動詞間で共通する意味属性を考慮して,シソーラス上に整理した動詞項構造シソーラスを提案し,形容動詞まで拡張して分析を進めてきた.動詞項構造シソーラスの背景には語彙概念構造という状態変化を主に記述する形式を拡張してきたが,「必要だ」や「必ず〜する」といった主観的な内容を記述する場所が無く,意味記述の中に自然言語で埋めることになっている.本稿では述語の分析から必要となる意味構造の要件を明らかにする.その中でも可能世界意味論に関係している点を事例をもとに明確化し,文書解析のための意味構造について考察する.さらに,人工知能で議論されてきた様相論理,動的命題,設計学,オントロジー工学との関係について概観する. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= en-aut-name=TakeuchiNao en-aut-sei=Takeuchi en-aut-mei=Nao kn-aut-name=竹内奈央 kn-aut-sei=竹内 kn-aut-mei=奈央 aut-affil-num=2 ORCID= en-aut-name=IshiharaYasuhiro en-aut-sei=Ishihara en-aut-mei=Yasuhiro kn-aut-name=石原靖弘 kn-aut-sei=石原 kn-aut-mei=靖弘 aut-affil-num=3 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院 affil-num=2 en-affil= kn-affil= affil-num=3 en-affil= kn-affil=岡山大学大学院 END start-ver=1.4 cd-journal=joma no-vol=2005 cd-vols= no-issue=94 article-no= start-page=123 end-page=130 dt-received= dt-revised= dt-accepted= dt-pub-year=2005 dt-pub=20050930 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Construction of Compositional Lexical Database Based on Lexical Conceptual Structure kn-title=分類の根拠を明示した動詞語彙概念構造辞書の構築 en-subtitle= kn-subtitle= en-abstract=This paper presents our ongoing research for constructing a Japanese verb lexicon which is founded on the theory of lexical conceptual structure (LCS). LCS provides a framework for capturing the relation between syntactic behaviors of lexical items and their semantic properties, which is useful for a range of NLP tasks including translation, paraphrasing and summarization. We discuss design issues involved in LCS dictionary development, and present an overview of the current specification of the lexicon, which is designed to allow successive future refinements. kn-abstract=本研究では語彙概念構造を利用した動詞の辞書データベースを構築する.語彙概念構造は構文上での語の振る舞いを基に意味構造を記述するもので,こうした辞書データは言語処理において特に言語生成,例えば翻訳や言い換え,要約といった応用に必須となる言語資源である.提案する辞書データは語彙概念構造のみを記述するのではなく,語彙概念構造の分析で明らかにする語の振る舞い,ならびに分析の基となる統語テストを記述するため,分類根拠がわかりやすく透明性の高い辞書データとなることが期待できる. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= en-aut-name=InuiKentaro en-aut-sei=Inui en-aut-mei=Kentaro kn-aut-name=乾健太郎 kn-aut-sei=乾 kn-aut-mei=健太郎 aut-affil-num=2 ORCID= en-aut-name=FujitaAtsushi en-aut-sei=Fujita en-aut-mei=Atsushi kn-aut-name=藤田篤 kn-aut-sei=藤田 kn-aut-mei=篤 aut-affil-num=3 ORCID= en-aut-name=TakeuchiNao en-aut-sei=Takeuchi en-aut-mei=Nao kn-aut-name=竹内奈央 kn-aut-sei=竹内 kn-aut-mei=奈央 aut-affil-num=4 ORCID= en-aut-name=AbeShuya en-aut-sei=Abe en-aut-mei=Shuya kn-aut-name=阿部修也 kn-aut-sei=阿部 kn-aut-mei=修也 aut-affil-num=5 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=奈良先端科学技術大学院大学 affil-num=3 en-affil= kn-affil=京都大学情報学研究科 affil-num=4 en-affil= kn-affil= affil-num=5 en-affil= kn-affil=奈良先端科学技術大学院大学 END start-ver=1.4 cd-journal=joma no-vol=2006 cd-vols= no-issue=94 article-no= start-page=13 end-page=20 dt-received= dt-revised= dt-accepted= dt-pub-year=2006 dt-pub=20060912 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Construction of rule-based model for semantic role labeling with the EDR thesaurus and an LCS dictionary kn-title=名詞の概念体系を利用した規則に基づく意味役割付与モデルの構築 en-subtitle= kn-subtitle= en-abstract=We present a rule-based model for semantic role labelingbecause semantic role labels should be assigned by means of metoric relationsips between mouns and vers. The purpose of this resarch is to reveal the this resarch is to reveal the restritional and preference rules between nouns and verbs. Our model uses the EDR thesaurus as semantics of nouns, and a lexical conceptual structure dictionary as verb semantics. Experimental results show that dealing with systemantic nominal categorization is the key to improve the accuracy of semantic role labeling. kn-abstract=本稿では名詞の概念体系辞書と述語のもつ語の概念構造を用いた規則ベースの意味役割付与モデルの構築を提案する.意味役割は名詞と述語との関係から決定されることから,本研究では述語の持つイベント構造と述語がとる名詞との間にどのようなメカニズムが存在するのかを明らかにすることを目標とする.新聞コーバスを対象とした評価実験から,名詞間の概念の類似度を正しく計ること,機能語の単位を正しく取り出すことが精度向上へのポイントであることが明らかになった. en-copyright= kn-copyright= en-aut-name=ShimomuraTakuya en-aut-sei=Shimomura en-aut-mei=Takuya kn-aut-name=下村拓也 kn-aut-sei=下村 kn-aut-mei=拓也 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2006 cd-vols= no-issue=94 article-no= start-page=35 end-page=42 dt-received= dt-revised= dt-accepted= dt-pub-year=2006 dt-pub=20060912 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Web Search Result Clustering Based on Structure of Compound Nouns kn-title=複合名詞に着目したWeb検索結果のクラスタリング en-subtitle= kn-subtitle= en-abstract=In this paper, we propose a aclustering method based on structure of compound nouns. Japanese compound nouns usually provide concrete concepts, thus we can assume that compound nouns must be a good clue to index documents for Web document clustering. The other benefit of using compound nouns is their compositional structure that can ve divided into sub concepts. This indicates that we can construct hierarchical Web document clustering based on their strcture. From the practical experiments of constructing hierarchical clusters on the results of a Web search engine, we succeeded in showing that the clearly lusterized web documents with understandable hierarchical indexes of compound nouns. kn-abstract=本稿では複合名詞に着目したWeb検索結果のクラスタリング手法を提案する.本手法では検索結果のタイトルと要約を利用し,階層的で一つの検索結果が複数のクラスタに含まれることを認めるクラスタリングを行う.本手法は次の2つの仮説に基づいている.1)複合名詞は固有の概念を表すため,文書を特徴付けやすい.2)複合名詞間の語構成関係を利用して,部分複合による類概念,および上位下位関係のクラスラベルを作成することで見通しの良いWeb文書の分類ができる.実験の結果,複合名詞の構造は分かりやすいクラスタ構造の形成に利用でき,また自然なラベル付けに有効であった.このことから,複合名詞は検索結果全体を見渡すためのよいインデックスであると言える. en-copyright= kn-copyright= en-aut-name=HiraoKazuki en-aut-sei=Hirao en-aut-mei=Kazuki kn-aut-name=平尾一樹 kn-aut-sei=平尾 kn-aut-mei=一樹 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2006 cd-vols= no-issue=124 article-no= start-page=55 end-page=60 dt-received= dt-revised= dt-accepted= dt-pub-year=2006 dt-pub=20061122 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=A Method for Extracting Composite Terms from Japanese Domain Corpora kn-title=日本語専門分野テキストコーパスからの複合語用語の抽出 en-subtitle= kn-subtitle= en-abstract=Term extraction is one of the most important application of natural language processing technologies. Statistic criteria are widely adopted to evaluate the termhood of the extracted candidates. However, it is difficult to evaluate the termhood of less frequent candidates. In this study we propose a method for Japanese composite term extraction in which unproper morpheme patterns are eliminated. Using the new method, high precision of term extraction can be attained for Japanese composite terms. kn-abstract=テキストコーパスからの用語抽出は、自然言語処理技術の重要な応用である。従来テキストコーパスから用語候補を抽出する方法として、主として候補出現に関わる統計的指標を用いて用語性を判定する方法が採用されて来たが、統計的手法では出現頻度の低い候補についての判定が困難であった。今回の発表では、複合語に注目し、用語性を損なう形態素出現パターンを排除する形での用語候補抽出を行うことにより、高い精度で複合語用語抽出が可能となることを示す。 en-copyright= kn-copyright= en-aut-name=KoyamaTeruo en-aut-sei=Koyama en-aut-mei=Teruo kn-aut-name=小山照夫 kn-aut-sei=小山 kn-aut-mei=照夫 aut-affil-num=1 ORCID= en-aut-name=KageuraKyo en-aut-sei=Kageura en-aut-mei=Kyo kn-aut-name=影浦峡 kn-aut-sei=影浦 kn-aut-mei=峡 aut-affil-num=2 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=3 ORCID= affil-num=1 en-affil= kn-affil=国立情報学研究所 affil-num=2 en-affil= kn-affil=東京大学大学院教育学研究科 affil-num=3 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2007 cd-vols= no-issue=76 article-no= start-page=49 end-page=54 dt-received= dt-revised= dt-accepted= dt-pub-year=2007 dt-pub=20070724 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Hierarchical Structurization of Japanese Composite Terms based on Nesting Relations kn-title=日本語複合語用語の入れ子関係に基づく階層的体系化 en-subtitle= kn-subtitle= en-abstract=We introduce a method for structurizing term candidates extracted from a Japanese domain corpus, based on nesting relations between the candidates. From the nesting relations, we can infer hypernym-hyponym relations and related term relations. Arranging both relations separately, we can get clearer hierarchical relations. kn-abstract=日本語専門分野テキストコーパスから抽出された日本語複合語用語候補について、候補間の入れ子関係から階層関係を推定し、体系化を行う試みについて発表する。入れ子関係からは、上位語-下位語関係、および関連語関係を推定することが可能であるが、それぞれの関係を別途整理することにより、見通しの良い階層表示が可能となることを示す。 en-copyright= kn-copyright= en-aut-name=KoyamaTeruo en-aut-sei=Koyama en-aut-mei=Teruo kn-aut-name=小山照夫 kn-aut-sei=小山 kn-aut-mei=照夫 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=国立情報学研究所 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 en-keyword=用語抽出 kn-keyword=用語抽出 en-keyword=用語体系化 kn-keyword=用語体系化 en-keyword=用語階層関係 kn-keyword=用語階層関係 END start-ver=1.4 cd-journal=joma no-vol=2007 cd-vols= no-issue=113 article-no= start-page=31 end-page=38 dt-received= dt-revised= dt-accepted= dt-pub-year=2007 dt-pub=20071119 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Toward Construction of Verb Thesaurus for Paraphrasing Metaphor Expressions on the Basis of Metaphor Analysis kn-title=メタファ分析に基づく置換可能な動詞カテゴリの作成 en-subtitle= kn-subtitle= en-abstract=Metaphor expression, especially consisting of a noun and verb, is irregular expression thus it is not easy to be dealt with in natural language applications such as machine translation, summarization, and document understanding. We believe it is important that metaphor expressions should be paraphrased into normalized basic expressions in order to extract a fact embedded in the expression: for example a metaphor expression “the wind plays” can be paraphrased into a basic expression “the wind blows”. In order to realize this task, in this paper we propose a verb thesaurus organized on the basis of semantic coherency for verbs. From the work of manual construction of a thesaurus on 50 verbs we discuss the possibility of our approach. kn-abstract=動詞と名詞による表現において動詞の意味のずれにより生じるメタファが機械翻訳や要約などの自然言語処理や文章の理解において問題となる場合がある。そのメタファに内在する事実を扱うためには、前もって一般的な表現へと変換処理をする必要があると考えられる。例えば「風が遊ぶ」というメタファを「風が吹く」などの一般的な表現に言い換える処理が必要であろう。本稿ではこの処理に必要となる動詞カテゴリの作成を提案する。実際に 50 の動詞について類似性に基づきカテゴリを作成し考察をすることで、置換可能な動詞間の類似性や共起する名詞の扱い方が動詞カテゴリの網羅性と信頼性の向上にどのように関わるかを明らかにする。 en-copyright= kn-copyright= en-aut-name=IchinoseMitsuru en-aut-sei=Ichinose en-aut-mei=Mitsuru kn-aut-name=一ノ瀬充 kn-aut-sei=一ノ瀬 kn-aut-mei=充 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2007 cd-vols= no-issue=113 article-no= start-page=39 end-page=44 dt-received= dt-revised= dt-accepted= dt-pub-year=2007 dt-pub=20071119 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Constrution of Semantic Verb Class Using Graph-Based Co-clustering Approach kn-title=グラフ構造に基づく同時クラスタリングを利用した動詞の属性クラスの抽出 en-subtitle= kn-subtitle= en-abstract=This paper presents our ongoing research for clustering Japanese verbs for constructing Japanese verb lexicon which is founded on the theory of lexical conceptual structure (LCS). The key issue of this research is how to extract a core cluster of Japanese verbs with a highly relating cluster of nouns because not only verbs but also nouns are polysemouns words. In this paper we applied an approach of co-clustering on the basis of graph sctructure into clustering task of verbs and nouns, and present experimental results on Japanese Verb-Case-Noun data from both large Web corpus and Maichini news paper corpus from 1991 to 1998. kn-abstract=テキスト中に現れる動詞と名詞の格関係を利用して動詞のクラスタリングを行い意味的に類似の集合の構築を目指す.ここでの問題は名詞と動詞はそれぞれ多義であり,かつその語義が観測可能でないことである.本稿ではある名詞の集合と動詞の集合がなすクラスタがある1つのクラスタ (ある潜在的な意味クラスタ) に属すると考え,同時共起クラスタリングを適用する.Web の5億文のデータから獲得された格フレームデータ,ならびに毎日新聞 91 から 98 年を利用して得られた動詞集合について評価することで,本手法により大量のデータがあれば質の良い動詞集合が得られることを明らかにする. en-copyright= kn-copyright= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=1 ORCID= affil-num=1 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2008 cd-vols= no-issue=4 article-no= start-page=87 end-page=92 dt-received= dt-revised= dt-accepted= dt-pub-year=2008 dt-pub=20080122 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=An evaluation of document set similarity based on morpheme occurence patterns kn-title=用語クラスタリングに基づく部分研究領域推定と用語分類 en-subtitle= kn-subtitle= en-abstract=Term classification associate to research sub-domain is an important approach for systematized classification of term candidates extracted from text corpora. The authors have developed a method which identify some of the important research sub-domains in research abstract corpora. The authors also proved that relatively frequent term candidates extracted from the corpus can be related to identified sub-domains. kn-abstract=研究抄録テキストコーパスから抽出された用語候補を体系的に整理する一つの有力な方法として、部分研究領域に関連付けた用語の分類を考えることができる。本研究では、動詞概念との共起に基づく用語クラスタリングによって、特定研究分野のいくつかの部分研究領域が同定できることを示すとともに、同定された部分領域との関連により、テキストコーパスから抽出された用語候補の分類が可能であることを示す。 en-copyright= kn-copyright= en-aut-name=KoyamaTeruo en-aut-sei=Koyama en-aut-mei=Teruo kn-aut-name=小山照夫 kn-aut-sei=小山 kn-aut-mei=照夫 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=国立情報学研究所 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2008 cd-vols= no-issue=113 article-no= start-page=51 end-page=56 dt-received= dt-revised= dt-accepted= dt-pub-year=2008 dt-pub=20081119 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=An evaluation of document set similarity based on morpheme occurence patterns kn-title=形態素出現パタンに基づく文書集合類似性評価 en-subtitle= kn-subtitle= en-abstract=We can assume that two different document sets may show similar morpheme occurrence patterns, if the sets both discuss about similar topics with similar discussion manners. In this paper, the authors show the occurrence patterns of morphemes really indicates the similarity of the sets. The authors also show the difference of the patterns in both sets indicate the difference of topics or discussion manner between the sets. The authors also show how to find key morphemes that indicate the similarity or difference of the sets. kn-abstract=類似したテーマを類似した論述構造で扱う文書を集めた文書集合同士では、共通 した形態素利用パタンが出現すると予想される。一方で、形態素出現傾向の相違は、文書集合の間で扱われるテーマあるいは論述構造の相違を示すものと考えられる。本研究では、異なる学会の研究抄録を集めた文書集合について、形態素出現傾向が集合間の類似性や相違を評価する指標として有効であることを確認するとともに、どの形態素が文書集合間の類似性ないしは相違性に寄与しているかを評価する方法について発表する。 en-copyright= kn-copyright= en-aut-name=KoyamaTeruo en-aut-sei=Koyama en-aut-mei=Teruo kn-aut-name=小山照夫 kn-aut-sei=小山 kn-aut-mei=照夫 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=国立情報学研究所 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=2009-NL-193 cd-vols= no-issue=13 article-no= start-page=1 end-page=6 dt-received= dt-revised= dt-accepted= dt-pub-year=2009 dt-pub=20090921 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=Term Extraction based on the Forward and Backward Connectivities of Candidates kn-title=候補の接続関係を考慮した複合語用語抽出 en-subtitle= kn-subtitle= en-abstract=In composite term extraction problems, it is important to extract candidates of relatively low occurrences in the corpora, with enough precision. In previous works, we have developed a method which can extract term candidates of low occurrences, using the revised classification of Japanese morphemes. In this paper, we propose a improved method considering forward and backward connective relations of candidates. Using the method, composite term candidates of less occurrences can be extracted with high precision. kn-abstract=テキストコーパスからの複合語用語抽出においては、抽出精度を低下させることなく、出現頻度の低い候補まで抽出することが重要である。従来主として用いられてきた統計的手法では、特に低頻度の用語候補の抽出に問題があった。我々はこれまでに用語候補となる複合語を構成する形態素の細分類に応じた位置制約を設定することにより、低頻度の候補まで抽出する方法を提案して来た。今回の発表では、この手法を改善し、多くの用語は文書中に少なくとも一回は提題的な形で出現するという予測の下に、候補となる形態素並びの前後接続関係に制約を設ける方法を提案する。実際にこの方法を適用することによりさらに低頻度の候補まで、抽出精度を落とすことなく取り出せることを確認した。 en-copyright= kn-copyright= en-aut-name=KoyamaTeruo en-aut-sei=Koyama en-aut-mei=Teruo kn-aut-name=小山照夫 kn-aut-sei=小山 kn-aut-mei=照夫 aut-affil-num=1 ORCID= en-aut-name=TakeuchiKoichi en-aut-sei=Takeuchi en-aut-mei=Koichi kn-aut-name=竹内孔一 kn-aut-sei=竹内 kn-aut-mei=孔一 aut-affil-num=2 ORCID= affil-num=1 en-affil= kn-affil=国立情報学研究所 affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 END start-ver=1.4 cd-journal=joma no-vol=52 cd-vols= no-issue=3 article-no= start-page=1348 end-page=1356 dt-received= dt-revised= dt-accepted= dt-pub-year=2011 dt-pub=20110315 dt-online= en-article= kn-article= en-subject= kn-subject= en-title=A MAC-address Relaying NAT Router for Host Identification from Outside of Internal Network kn-title=内部ネットワーク上のホストを外部から識別するためのMACアドレス中継型NATルータ en-subtitle= kn-subtitle= en-abstract=As an alleviation method against IPv4 address exhaustion problem, NAT (Network Address Translation) has been commonly used. Since NAT allows many internal hosts to share one single global IP address, it can save the number of required global IP addresses. However, with NAT, each internal host cannot be identified from the external network. Consequently, if access control system on external network would permit network access from one internal host, it automatically would permit all network access from any other internal hosts as well, for example. In this paper, we propose a NAT router with MAC address relaying function that copies the source MAC address of receiving frames sent by internal hosts into frames sent to the external network since source MAC addresses, which are the sender identifiers in data link layer, are basically unused except for MAC address learning function of layer 2 switches. According to the results of experiments, we confirmed that the prototype NAT router with MAC address relaying function allows access to external networks by internal hosts to be controlled individually based on MAC address and obtains high throughput as well. kn-abstract=IPv4アドレスの枯渇問題の軽減策の1つとして,NAT(Network Address Translation)がある.NATは複数の内部ホストが1つのグローバルIPアドレスを共用できるため,必要なグローバルIPアドレスの数を節約できる.しかし,外部ネットワーク側では個々の内部ホストを識別できないため,たとえば外部ネットワーク側でアクセス制御を行うと,1台の内部ホストが外部ネットワークに対するアクセス許可を受けただけで他の内部ホストまで外部ネットワークにアクセス可能な状態になるなどの問題が生じる.そこで,本論文ではデータリンク層での送信元識別子である送信元MACアドレスが基本的にはレイヤ2機器のMACアドレス学習機能にしか使われていない点に着目し,内部ホストから送信されたフレームに含まれる送信元MACアドレスをそのまま外部ネットワーク側に中継する機能を持つNATルータを提案する.本提案に基づいて試作したNATルータを評価した結果,MACアドレスに基づいて内部ホストを個別にアクセス制御でき,また十分なスループットが得られることを確認した. en-copyright= kn-copyright= en-aut-name=YamaiNariyoshi en-aut-sei=Yamai en-aut-mei=Nariyoshi kn-aut-name=山井成良 kn-aut-sei=山井 kn-aut-mei=成良 aut-affil-num=1 ORCID= en-aut-name=MurakamiRyo en-aut-sei=Murakami en-aut-mei=Ryo kn-aut-name=村上亮 kn-aut-sei=村上 kn-aut-mei=亮 aut-affil-num=2 ORCID= en-aut-name=OkayamaKiyohiko en-aut-sei=Okayama en-aut-mei=Kiyohiko kn-aut-name=岡山聖彦 kn-aut-sei=岡山 kn-aut-mei=聖彦 aut-affil-num=3 ORCID= en-aut-name=NakamuraMotonori en-aut-sei=Nakamura en-aut-mei=Motonori kn-aut-name=中村素典 kn-aut-sei=中村 kn-aut-mei=素典 aut-affil-num=4 ORCID= affil-num=1 en-affil= kn-affil=岡山大学情報統括センター affil-num=2 en-affil= kn-affil=岡山大学大学院自然科学研究科 affil-num=3 en-affil= kn-affil=岡山大学情報統括センター affil-num=4 en-affil= kn-affil=国立情報学研究所 END