1. ホーム
  2. 統計解析・品質管理
  3. 会員広場
  4. 六一学者の千字一話(連載)

第8話 ほどよくアバウトに(六一学者の千字一話)

吉澤正先生御逝去に寄せて

六一学者の千字一話  六一学者 (吉澤 正氏)
六一学者 - 吉澤 正氏
(第10回JUSEパッケージ活用事例シンポジウムにて)


某社会人大学院のデータ解析の授業で,宿題の一つとして20個のデータの平均値と標準偏差を計算させた.データは,

155 137 136 161 154 136 136 111 117 130 140 127 112 145 174 146 132 169 189 162

30人足らずのレポートを見て,その答えの多様さに驚いた.エクセルで統計関数を使えば,平均値143.45,標準偏差20.66137と表示される.平均値の答えは,136.619,143.4,143.45,145.5の4通りで,最初の答えは入力ミス,その他は丸めによる相違である.もとのデータが整数値であるので,答えは小数点以下1桁で十分であるが,143.4,143.45,145.5の3通りは正解としてもよかろう.

コンピュータ表示143.45の最後の桁が5のときは,その表示前の丸めによって5に繰り上がったケースも考えられ,その情報が明らかでないときにその5をさらに繰り上げるかあるいは切り下げるかは,JIS規格では結果が偶数値になるように勧めている.そのルールで,この場合は切り下げて,143.4とするのも意味がある.もっともこの場合は,数学的には143.45が丸め無しに正確なので,単純な四捨五入で143.5としてもよい.

標準偏差は,次のような10通りの答えがあった.

4.62, 19.42, 20.1, 20.14, 20.23966, 20.6, 20.66, 20.66137, 36.32, 426.8

計算にはエクセルを使った人,統計ソフトを使った人,電卓を使った人がいた.20.6,20.66,20.66137が大多数であるが,20.7あるいは20.66を正解としたいところ.

まず,そのうちの数個は入力ミスや手計算の途中の丸めの仕方によるもの.エクセルでも計算手順によっては標準偏差の表示桁数が違ってくる.手計算の時代には,仮平均という平均値に近い値を,この場合なら150を,各データから引いて,その合計と2乗和を求め(それぞれ69と8349),それから平方和,分散,標準偏差を求めたものである.

電卓計算で,平均からの偏差を計算した人には,平均を143.5としたり,途中の計算を間違えたりで,おかしな答えになっていた.次は,標準偏差の定義の違いによる.平方根をとらずに分散の値を答えたり,平方和をデータ数引く1の19で割らずに20で割ったことによる食い違いなどであった.

この宿題で,社会人大学院生は標準偏差のような基本統計量でも定義を忘れている人がいること,手計算が下手になっていること,そして,答えの報告で有効桁数について無頓着なことがわかった.

統計データの統計量の表示桁数は,もとのデータの測定精度(通常は有効数字で3,4桁)より1桁ぐらい多めにすればよいであろう.ただし,計算の中間過程での保存を目的とするなら,2,3桁余分に保持するとよい.昔,計算尺を使った時代には,計算尺精度での表示ということを教わったものである.人に見せたり,報告するときは“ほどよくアバウトに”することがコツである.


2001年11月7日掲載

イベント案内や製品などの最新情報をお届けします

メールマガジン
最新の製品アップデート情報やセミナー・イベントなどのお知らせを,eメールでお送りします