1. ホーム
  2. 統計解析・品質管理
  3. 会員広場
  4. 六一学者の千字一話(連載)

第4話 層別の層別—層別 手法の層別因子はあるか?(六一学者の千字一話)

吉澤正先生御逝去に寄せて

六一学者の千字一話  六一学者 (吉澤 正氏)
六一学者 - 吉澤 正氏
(第10回JUSEパッケージ活用事例シンポジウムにて)


層別ヒストグラム,層別箱ひげ図,層別散布図,層別因子を含む回帰分析など,層別はデータ解析で頻繁に使われる.層別は,データ解析の基礎となる重要な考え方であり,QC7つ道具の一つ.JUSE-MAの多変量解析ソフトの中では,データの分布や外れ値などを吟味するデータモニタリング手法として,いろいろな層別ができる.

また,データマイニング手法としてよく使われるAIDを多段層別分析と呼んで独自の工夫を加えている.AIDは,Automatic Interaction Detectorの略で,複数の説明変数の目的変数に対する交互作用を検出する手法として1963年にミシガン大学で開発された.ちなみに交互作用とは,説明変数の1次式では説明できない効果(影響),説明変数が量的なら変数の積の項などで,質的変数ならカテゴリー(水準)の組合せによって説明される.

さて,層別ヒストグラムは,量的変数の分布を層別因子で分けて層ごとの分布をヒストグラムで観察するためのものであり,層別散布図は,2つの量的変数の分布(同時分布という)を層ごとに観察し比較検討するためのものである.

ところで,質的変数の分布を別の層別因子で分けてみたり,2つの質的変数の同時分布を別の層別因子で分けて見ることも有用である.アンケート調査では質的変数が多いので,層別して観察することが重要である.政党の支持率を年齢層で分けてみる,性別で分けてみる,地域別でみるなどいろいろな層別によって観察するとよい.質的変数の解析でも,何が目的変数で,何が層別変数あるいは説明変数であるかを意識することが重要である.質的変数の層別による分析はソフトにも工夫がほしい.

層別の第1の目的は,全体のデータのばらつきが層に分けることによって層ごとの平均の違いによって説明できないかを検討することである.不良率などのばらつきも不良率のの大きい層がわかれば対策を取りやすい.層別の第2の目的は,層ごとにデータの分布や回帰モデルが異なるかどうか,層の間で何かの共通性があるかなどを検討することである.

層別の情報があらかじめ多数あるときは,2つの層別因子の組合せ,性別と年齢層では,若い女性,中年以上の女性,若い男性,中年以上の男性などのグループにわけて考えることもある.この場合は多重層別ともいう.単純な多重層別では,層別因子の数が多いと組合せが多すぎてしまう.そこで,逐次にグループ内のばらつきが小さくて,グループ間のばらつきが大きいようなグルーピングを行う方法が多段層別分析である.2段目からの層別は層別に使う因子を対象グループごとに異なることをみとめるところが多重層別とは違っている.

さいごに,標本調査法でも,層別の考え方は重要であることをいっておこう.たくさんの層別手法を整理するための層別因子はあるだろうか.答は読者(ホームページの閲覧者?訪問者)にお任せしたい.


2001年5月24日掲載

イベント案内や製品などの最新情報をお届けします

メールマガジン
最新の製品アップデート情報やセミナー・イベントなどのお知らせを,eメールでお送りします