テキストマイニング

narciso1 / Pixabay

テキストマイニングとは

テキストマイニング(Text Mining)とは

  • @IT情報マネジメント用語事典

    • 形式化されていないテキストデータ(通常の自然文)を単語などに分割し、その出現頻度や相関関係などをデータマイニングの手法を使って解析することで、一定の知見や発想を得るテキストデータ分析手法の総称
  • IT用語辞典

    • 定型化されていない文章の集まりを自然言語解析の手法を使って単語やフレーズに分割し、それらの出現頻度や相関関係を分析して有用な情報を抽出する手法やシステム
  • NIKKEI RESEARCH REPORT 2004-I(PDF)

    • 文章の中に埋もれている共通性や相関関係を発掘し、有用な知見を獲得する分析手法
  • IBM 東京基礎研究所(TRL)

    • 文章データをさまざまな観点から分析し、役に立つ知識・情報を取り出そうという技術
  • SPSS Clementineによるテキストマイニング

    • 大量のテキストデータを使って、役に立つ知識や情報を見つけ出す技術

のような定義に見られるように、「テキスト=文章データ」から「マイニング=採掘する」、つまり、文章データから何らかの有益な情報を引き出すための手法・システムです。

テキストマイニングソフト

特許分析・特許解析用のテキストマイニングソフトとしては、野村総合研究所が提供しているTrue Teller(トゥルー テラー)や、Thomson Scientific(トムソン・サイエンティフィック)が提供しているAureka(オーレカ)などが代表的ですが、最近様々なテキストマイニングソフト・テキストマイニングツールが発表されています。ここでは各社のテキストマイニングソフト・ツールと関連資料について紹介しています。

> > テキストマイニングソフト

テキストマイニング関連文献

テキストマイニング関連の文献でウェブ上で公開されている文献をカテゴリー別に整理して紹介しています。

> > テキストマイニング関連文献