1. ホーム
  2. 統計解析・品質管理
  3. ダウンロード
  4. テキストマイニングツール

テキストマイニングツール
SimpleWordのアンケート解析事例

本ツールのダウンロードは終了しました

アンケートの解析例

ある大学で,「図書館利用についてのご意見をお聞かせください」という質問でアンケートを行い,下のような22件の回答が集まりました. このデータ表をもとに形態素解析と集計,多変量解析をして,意味のある情報が得られるかをみてみましょう.

この解析例のデータには,インストールフォルダにある「形態素解析_lib.xls」を使っています.

データの準備

以下の説明では「意見」を「自由回答文」,「利用者」を「属性」と呼びます.
この例では自由回答文が属性とも1つずつしかありませんが,Excelに入力する場合は,複数の回答文や属性を入力,利用することができます. ただし,クロス表作成の際には,1回に指定できる自由回答文は1列とります.

NO意見利用者
1 公式でなくてもよいから図書館利用者懇親会をつくり,誰でも自由に意見交換できる場としてほしい. 教官
2 研究のために役立つ実践シリーズ本などとりそろえてほしい. 教官
3 書庫の整理を抜本的に行ってほしい.それと,教官への本の貸し出しは期間を延長してほしい. 教官
4 文献検索時,製本にまわっている分の情報がとりだせないこと.書籍入荷まで時間がかかること. 教官
5 図書館の活用の仕方がよくわからない.活用方法についての説明の改善が必要だと思います. 学生
6 コンピュータの活用を重視するなら,そのサーポートのための人的配置,配慮も充実して欲しい 学生
7 書籍購入に際して特に外国のものは期間が長すぎること.そして出張先で見つけても購入できない 教官
8 以前指定された場所に本を探しに行っても,何も無かった. 学生
9 CD-ROM検索用のパソコンが別の用途に使用されていて常に満員である.台数を増やすか,使用目的ごとに制限を加えてほしい. 学生
10 CD-ROM検索で,サービス対象機種としてMacintoshマシンを加えてほしい. 教官
11 指定図書のシステムは中止されたように記憶しているが今も可能なのかどうか? 学生
12 CD-ROM検索で農学分野の検索が出来ません.出来るようにして欲しい 学生
13 書庫の配列が新しくなって,どこに何があるのかわからない. 教官
14 蔵書数をできるだけ増やし,使いやすいようにきれいに配置して欲しい. 教官
15 図書検索が容易にできるようにして欲しい. 学生
16 対応の仕方を統一して欲しい. 教官
17 専門書の書籍の数が少ない. 教官
18 購読雑誌の検討をして欲しい. 教官
19 コピー機の位置がわかりずらい. 学生
20 夜間の利用に時間的制限がある. 学生
21 文献の入手に時間がかかる. 教官
22 夜間の利用が必要. 学生

手順1 アンケートデータをExcelに入力する

まず,Excelに自由回答文や属性データを入力します.

手順2 クロス集計を行う

メニュー[形態素解析] - [自由回答文からクロス表作成]を選択すると,設定ダイアログが表示されます.

まず,基本設定として,自由回答文の入力されている列番号と,作成したいクロス表のタイプを指定します. また,オプションとして,出力対象とする品詞の種類や,表層形/活用形の指定も行います.設定が終わると,指定された自由回答文について自動的に形態素解析を行い,クロス表をExcel上に生成します.

この例題では,「回答(ケース)×単語」(頻度型)のクロス表を作成します.

※ 未知語には,茶筌で登録されているパソコンや,CD-ROMなどが含まれます.


回答(ケース)×単語のクロス表(頻度型)

なお,「単語×属性のクロス表」を指定した場合は,次のような抽出された単語×利用者の2元集計表が作られます.

手順3 作成されたクロス表をJUSE-StatWorksで解析する

(1)数量化3類による解析

SimpleWord のメニューから「StatWorksによる解析」を選ぶと,作成したクロス表データをStatWorksにエクスポートして,数量化III類の基本表示画面まで自動的に進みます.なお,StatWorks上でその他の解析を行う場合は,ワークシートを保存しておいてください.


StatWorksのデータ表


数量化III類の基本表示画面


成分1と成分2の同時付置図 (サンプル名として利用者名を追加してあります)

成分1ではプラス側には「書庫」,「購入」,「期間」といった「運用面」に関するキーワードが,マイナス側には「活用」,「仕方」,「配置」といった「利用面」に関するキーワードがマップされています.

成分2では,プラス側に「パソコン」,「CD-ROM」,「検索」といった「新しい情報活用」に関するキーワードが,マイナス側には「旧来型の利用」に関するキーワードがマップされていることが判ります.

また,教官は「旧来の利用」,「運用面」に,学生は「利用面」,「旧来型から新しい情報活用まで」に,それぞれ多くマップされているようです.

(2)階層型クラスター分析による解析

次にクロス表を用いて,変数(単語)を分類してみましょう.


デンドログラム

意見が,「本そのもの」,「空間や時間」,「活用方法」,「コンピュータを使った活用」についてグループ化されていることが判ります.

(3)判別分析による解析

使用者(教官と学生)について意見に傾向が見られるかを,二群の判別分析で解析してみます(ワークシートに,利用者の質的変数を追加してから解析を行っています).


変数の指定


誤判別表

学生は「指定」,「活用」,「検索」,「夜間」,「制限」といったキーワード,教官は「時間」,「CD-ROM」,「本」といったキーワードに強い関係が見られます.

これらの単語の出現頻度を,利用者ごとに基本統計量で確認してみましょう.


「教官」の使う単語の頻度


「学生」の使う単語の頻度

教官は「本」などの特定のキーワードに対する意見が多いことが判ります.逆に,学生は「活用の仕方」に関する幅広い意見を持っていることが判ります.

以上,簡単ですが解析事例をご紹介致しました.

StatWorksには,ご紹介した以外にも多くの解析手法があります.これらを活用することで,驚くような発見が得られるかもしれません.JUSE-StatWorksの詳細については製品案内をご覧ください.


SimpleWordのご紹介へ