1. ホーム
  2. 統計解析・品質管理
  3. 会員広場
  4. 六一学者の千字一話(連載)

第5話 レーダーチャートでの変数の順番(六一学者の千字一話)

吉澤正先生御逝去に寄せて

六一学者の千字一話  六一学者 (吉澤 正氏)
六一学者 - 吉澤 正氏
(第10回JUSEパッケージ活用事例シンポジウムにて)


多変量解析では,多数の変数について測定された対象の特徴を視覚的に図的に比較するためにレーダーチャートがよく使われる.

筆者が最初にレーダーチャートを使ったのは昭和40年頃.企業の特徴を財務データで客観的に評価しようと,まず財務データの主成分分析を行った.その結果を利用して,企業の成長性や安定性などの指標を作り,レーダーチャートで表現することを考えた.そのような 表現は経営分析でも定番になっている.奥野・芳賀・久米・吉澤著『多変量解析法』(日科技連1971年,改訂1981年)にも例がある.

そのとき以来次のことが気になった.

  1. 生の主成分をレーダーチャートの軸に使うのは好ましくないこと
  2. レーダーチャートの軸に割りつける変数の順番はどう考えたらよいかということ

である.『多変量解析事例集第1集』(吉澤・芳賀編,日科技連,1992)で は,プロゴルファーの公式記録を使ってその問題を論じた(第2章表示13のレーダーチャートを以下に示す).

図5-1. 表示13 プロゴルファー公式記録のレーダーチャートの例(画像クリックで拡大表示)

(a)中島常幸と尾崎将司のの比較

(b)川岸良兼と杉原輝雄の比較

レーダーチャートでは,円の中に正多角形を想定してその頂点と中心を結ぶ軸を各変数に割りつけ,データの値に応じた中心からの線分の先を頂点とする多角形をによって多変量データを視覚化する.

軸ごとでは,中心から外に向うほど「好ましい」という印象を与える.第1主成分は,しばしば,総合的な規模やなんらかの大きさと解釈されることが多いので,その値が大きければ好ましいといえることもあるが,第2主成分以下は,第1主成分と無相関で,その値 が大きいから好ましい,小さいからよくないというような解釈は成り立たないことが普通.

例えば,入試データで,国語と数学の得点差のような成分は,学生の得手苦手の特徴を表すが,その大小が良いとか悪いとかの評価には繋がらない.そこで,生の主成分をレーダーチャートの軸に用いずに,もとの主要な変数を軸にしたほうがよいことが多い.

図5-2. 主成分分析(画像クリックで拡大表示)

表示10. 因子負荷量を座標とする変数のプロット

表示11. 主成分得点を座標とする対象のプロット

レーダーチャートの変数の順序問題(2)については,プロゴルファーの例では,主成分分析を行って,次のように変数順をきめている.まず,第1主成分を構成する主要な変数である“ショウキン”,“72-ストローク”,“パーセーブ”,“バーディ”を並べ,次に,第2主成分を構成する主要な変数である“パーオン”と“32-パット”,第3主成分の主要な変数“イーグル”,そして最後に試合数を軸にしている.(変数の定義は補足 を参照されたい.)

このように,主成分を構成する主要な変数を抽出して,主成分ごとにまとめて並べると,第1主成分では選手の総合的な実力を,第2や第3の主成分の変数では選手のいろいろ角度からの特徴を視覚的に見ることができる.

多変量データの視覚化の方法と顔チャートがあるが,どの変数を顔のどの部分に割り当てるかで見たときの印象が異なる.帯グラフや円グラフでもカテゴリーの順番を考える必要がある.

補足:プロゴルファーの公式記録レーダーチャートでの変数の意味
ショウキン年間賞金獲得額出場試合数でわった1試合あたりの賞金の対数
72-ストローク1ラウンドあたり平均ストローク数を72からひいてアンダーパーの数に相当する数値に変換,大きいほうが良いようにしたもの
パーセーブパーをセイブした率
バーディ1ラウンドあたりのバーディ数
パーオンパーオン率,パーより2打以上少なくオンした割合
32-パット1ラウンドあたり平均パット数を32から引いたもの
イーグル100ラウンドあたりのイーグル数
シアイ年間出場試合数,以上の記録は1987年のものであるが,毎年同様の解析ができる.

2001年6月27日掲載

イベント案内や製品などの最新情報をお届けします

メールマガジン
最新の製品アップデート情報やセミナー・イベントなどのお知らせを,eメールでお送りします