1. ホーム
  2. 統計解析・品質管理
  3. 導入事例
  4. JUSEパッケージ活用事例シンポジウム

第28回 JUSEパッケージ活用事例シンポジウム「データを利活用する問題解決法の新展開」を終えて(著者 西垣貴央氏(青山学院大学))

1. はじめに

2018年12月5日(水)に渋谷区千駄ヶ谷のSYDホールにて第28回JUSEパッケージ活用事例シンポジウムが開催された.今回も非常に多くの聴講者が参集し,会場は満席となり,最終的な参加者は125名であった.

シンポジウムは,(株)日本科学技術研修所の宮久保氏による事務連絡から始まり,司会は,立教大学の山口和範先生が務められた.

開会に際し,(株)日本科学技術研修所の代表取締役社長である酒井融二氏からシンポジウムの狙いと本年度のテーマの発表があった.本年度のテーマは「データを利活用する問題解決法の新展開」であり,近年IoT技術などの普及によりビッグデータを扱う場面が増え,従来の少数サンプルからの推測統計から,統計的機械学習手法が製造業の間でも非常に注目されている.昨今のデータの利活用における品質改善や統計解析について話題性のあるテーマを先生方に講演いただくとともに,産業界の優れた実践事例や,創意工夫,業務上で体験した苦労話を共有することを通じて,相互の情報交換の場や活発な議論の場としていただきたいとのことであった.

また,2018年1月にStatWorks/V5英語版の販売が開始していることや,以後の計画として,2019年春にStatWorks/V5 機械学習編が販売予定であることが発表された.

2. 記念講演


椿 広計氏
報告資料(1.08MB)
発表資料(5.73MB)

記念講演は,独立行政法人統計センター理事長の椿広計先生が務められ,「AI・IoT時代の問題解決法と人材育成-有効なデータ解析の背後にある基本原理-」というテーマで,データ解析の歴史,従来までの分析手法と統計的機械学習を用いたデータ分析との関係について講演された.

2008年10月グーグルのチーフアナリストのHal Varian先生は,次の10年間,統計家が最もセクシーな仕事だと言っている.それは,データを取る能力,データを理解する能力,データを処理する能力,データから価値を抽出する能力,可視化し人に伝える能力,これらは次の10年間とても大切な技術になるからである.これは専門家レベルのことだけを言っているのではなく,小学生や中学生等の教育についても言える.なぜなら現在私たちの周りには膨大なデータが溢れているからである.これらのことは2008年の段階で言われており,2012年経営学者ダベンポートもデータサイエンティストが21世紀に最もセクシーな仕事だと言っている.データサイエンティストというのは統計家とは違って.データをエディットするエンジニア的なことを行う人のことである.米国では政府が統計家やデータサイエンティストをカウントしていて,きちんと定義がなされ,統計家になるための教育も行われている.しかし日本では,統計家の数をカウントしていないし.定義もされておらず,とても遅れている.

日本では,近年になってようやく統計データ収集の環境・基盤の整備や政策・統計の改善が行われ始めてきている.統計センターは政府統計の総合窓口であり,様々なデータを収集し,利用できるように公開している.2018年6月に,多変量のデータ解析の教育で使用できるデータで教育用標準データセット(SSDSE:Standardized Statistical Data Set for Education)を提供した.今まではデータを大学の教員がそれぞれ自分で集めていたが,日本全体で同じデータセットを使うことで,こんな分析方法があったのか等のGood Practiceが共有されるのではないか,知の共有ができると良いと考えられて統計センターでは公開している.このデータを使って2018年に高校生と大学生を中心とした統計データコンペティションが行われた.そこではまだ高校生なのに,統計家が見ても非常に面白い分析を行っていたり,機械学習を使用した例もあったりして,若いうちから技術やデータに触れられるのは良いことだと述べられていた.

データ解析自体の歴史は,1962年Tukeyがデータ解析というのは大切であり,これまでは仮説検証とか検定が大事で裁判官の立場の推測統計だったが,これからは刑事の立場の仮説を探索するデータ解析が主流になってきて,問題を探索するというのが大切だと言っている.日本では,(株)日科技連出版社より奥野先生,久米先生,芳賀先生,吉澤先生らが多変量解析法の著者として1971年に出版している.この頃から日本でも急速に多変量解析が流行った.この頃は産学でデータ解析の知を共有しようと,データの共有が行われていた.これまでは探索的なデータ解析と言われていたが,近年ではデータマイニングに変わり,さらには人工知能・統計的機械学習と言われるようになっている.この統計モデルと機械学習の大きな違いは2段階接近なのか,1段階接近なのかの違いである.

古典的統計家が扱う統計モデルは2段階接近というもので,予測したいものの背後にある現象を解釈してから予測を行う.現象をきちんと近似したモデルに基づいて予測する.モデルというのは現実をうまく近似して解釈するものである.解釈してから予測を行うので2段階接近と言われる.統計的機機械学習は1段階接近というもので,ワンステップの最適化を行っている.統計的な予測というのは,予測誤差を小さくすることで,ブラックボックスになってもいいので予測誤差を最適化する.いきなり予測を行うので1段階接近と言われる.ここが一番の違いである.

データ解析に何を期待するのか,何のために行うのかをよく考えて扱わないといけない.
予測パフォーマンスに対する最適化ならば,統計的機械学習(AI)の優位性は顕著である.

しかし,メカニズムの理解や利用のためには,ビッグデータが存在して予測ができるだけでは不十分で,日本が古くから使われてきた最適実験計画が有効である場合もある.最後に,これからの問題解決の基本戦略を考える上で,階層性を意識したデータサイエンス教育を行うべきであるとまとめられた.

質疑応答では,「ビッグデータは古典的手法では解析できないと言われているが,古典的手法と機械学習の使い分けはデータ量で使い分けるべきなのか」という質問に対して,ビッグデータが古典的手法に適用可能性が無いと言われているのは,ビッグデータは管理されているデータではない,不均一なデータなので,探索的に層別を行う統計的機械学習などのような手法を適用される例が多い.しかし,機械学習で分析ができると言っても,メカニズムを解明できるのかというとそんなことはない.それぞれの手法の用途が異なっていて,予測がしたければ機械学習を使うほうが良いし,現象やメカニズムを解明したいのであれば古典的手法を用いるほうが良いのでは,と回答されていた.

3. 事例報告1

事例1 応答曲面解析を利用した鋳巣不良の低減


八木 浩一氏
報告資料(2.31MB)

(株)アーレスティ 八木浩一氏からは,「応答曲面解析を利用した鋳巣不良の低減」について報告がなされた.自動車メーカーで最終加工,圧検,組立を行っているエンジンのシリンダーブロックにおいて,ポンプ取付部に発生する鋳巣不良の改善事例の紹介である.

現状把握として加工後の鋳巣不良率の推移を確認すると,日々の不良率はばらつきが大きく安定していないことがわかる.そのため,ばらつきを小さくして不良率の平均値を低減したいということが目的である.また,発生している鋳巣不良として顕微鏡で観察すると湯じわがあり充填性が良いとは言えない状態であった.しかし組織は緻密で,凝固に遅れが出ていたり,異物が混入とかしているものではない.同様にSEMによる観察を行うと,充填中に湯先同士がぶつかりあってうまく融合できていないように見える.充填過程を可視化することは困難なため,流動解析としてシミュレーションを行うと,観察で行った不良の所見を裏付ける結果となった.

鋳巣が発生する対策を進めていく中で,過去の対策結果や技術的知見により,充填時間が長いこと,最終充填部への溶湯補給が足りないこと,潤滑不足によるスリーブが不足していること,潤滑の偏りによる摺動抵抗が原因であるとして分析を進めていく.得られた要因に対して,制御の鋳造機の条件によって得られるものが2つ,潤滑の条件によって得られるものが2つあるので,それぞれを応答曲面解析で最適値を求めていく.条件を変えて分析を行っていった結果,最終的に得られた最適値をもとに,各種条件を設定し対策を行った.その結果,対策後は対策前と比べると鋳巣不良率の平均は大きく下がり,頻度やばらつきも小さくなり安定した.しかしばらつきが目標値を超えることがあり,今後はそのばらつきも目標値内で収めるようにしていきたいと締められた.

質疑応答では,分析方法の根拠についてや,実験結果の誤差に関する考察についての質問があり,分析方法や結果の考察についての議論がもたれた.

事例2 生体ログビッグデータからの健康活動に関する特徴量の抽出 -ウェアラブルデバイスによる経時的活動データの分析-


山田 知明氏

国立がん研究センターの山田知明氏からは,「生体ログビッグデータから健康活動に関する特徴量の抽出 -ウェアラブルデバイスによる経時的活動データの分析-」の報告がなされた.生活習慣病の原因の一つとして身体の不活動が挙げられている.その生活習慣病予防のため,近年ではウェアラブルデバイスを使って活動量を計測し,活動ログデータとして記録している人が増えている.その収集された活動ログデータと体組成指標との関連を分析した事例を報告された.

本報告では,ウェアラブルデバイスで計測された歩数や消費カロリー等の活動量と,体脂肪やBMIなどの体組成との関連性を解明するのを目的とした.関連性が解明することでエビデンスが蓄積され,公衆衛生指針や政策への応用が期待できる.974人の約1年間の活動量と4ヶ月分の体組成をデータとして,活動強度を定義し算出した.算出した活動強度の平均や標準偏差を見る事で,すべての曜日において9時から11時が大きいことや,休日の午前中や16時頃のばらつきが大きいことがわかった.これは直感的には正しいと思われる.この活動強度データに対して主成分分析を行った.第1主成分,第2主成分,第3主成分の因子負荷量から,第1主成分は肥満軸,第2主成分は筋肉軸,第3主成分は体感筋肉軸と分析できる.この主成分からバリマックス回転させ解釈しやすい軸を生成する.その結果,若い世代ほど深夜活動が強く早朝が弱いことや,高齢者層でも年代によって差があること等がわかった.これらのデータから回帰分析を行うことで,昼間の活動と筋肉量の関係や,夜間の活動と脂肪量の関係など,時間帯別の活動が体組成指標と関連があることが示唆された.今後は,得られたデータ数が多いため,p値が小さい値を取る変数が多く存在した.そこで得られた仮説についてさらなる検証が必要であるとまとめられた.

質疑応答では,収集したデータに関する質問や分析方法に関する質問などが数多くフロアからあり,活発な議論が行われた.また,記念講演の講演者である椿広計先生から,今回は主成分を求めて回転してから回帰を行っているが,必要な主成分だけを求めてから回帰分析を行い,その後回転をしてみては,とのコメントがあった.

4. 製品紹介


犬伏 秀生
報告資料(770KB)
発表資料(2.68MB)

(株)日本科学技術研修所の犬伏秀生氏からはStatWorks/V5の新機能である機械学習編の機能と使い方について紹介がされた.近年,大量のデータを利活用するための手段として機械学習が注目されており,StatWorks/V5シリーズの一つとして「JUSE-StatWorks/V5 機械学習編」を開発中である.

開発中の機械学習編の特徴は以下のようになっている.

主なターゲット
製造業での品質管理に携わる実務者
主な使用用途
1. 機械学習の教育・研修
2. 中規模以下のデータの分析
3. 大規模データを予測・判別するためのモデルの検討
機能の特徴
・画面構成や操作性は既存製品StatWorks/V5と共通で導入しやすい
・SQCで使用される多変量解析手法との対比で理解できる機械学習手法を搭載するので初学者でも扱いやすい
・分析可能なデータサイズは,1000変数×100,000サンプル以内である
搭載する解析手法
・lasso回帰やサポートベクターマシン(SVM)などを含めて11種類ある

デモンストレーションとしてlasso回帰やサポートベクターマシーン(SVM),ランダムフォレストが実際にどう動いて,ソフトではどのように結果を閲覧できるのか等が実演された.今後の予定では,発売は2019年春を予定しており,2019年度上期から機械学習セミナーも開催予定である.また,2019年1月からStatWorks/V5有償保守契約者向けにモニター版の無償の貸し出しを行う.最新情報はHP上で随時公開していると結んだ.

コメンテーターであるトヨタ自動車(株)の渡邉克彦氏からStatWorks使用者ならすぐに使えるユーザインタフェースで大変良いと感じた.SQCも機械学習も大きなくくりでいうとデータ分析なのでうまく融合できるとよい,非常に期待しているとコメントがされた.

5. 事例報告2

事例3 多岐にわたる現象をモデル化するための方法論の研究 〜階層型判別分析による欠陥現象のモデル化


山田 大介氏
報告資料(1.35MB)
発表資料(1.32MB)

パナソニック(株) オートモーティブ&インダストリアルシステムズ社 山田大介氏から,「多岐にわたる現象をモデル化するための方法論の研究 〜階層型判別分析による欠陥現象のモデル化」についての報告がなされた.

本報告では,製造業における40ppm程度の外観不良を早期に改善するために,複数の現象の識別とモデリングの両立を検討した.IoTや機械学習が得意としている所の高精度な識別・予測と統計的品質管理手法が得意としている所の技術者が解釈可能なモデリングを組み合わせるような,高度な方法論の活用が技術者に求められている.今回は,統計的品質管理手法のモデル化について検討した.特に,外観不良現象の識別に用いられる判別分析を応用的に活用し,複数の現象の層別に適用できないデメリットを階層的に行うことで克服した.工程途中に簡易検査を入れることで,外観不良の早期対策を行う.この簡易検査に判別分析を取り入れる.1種類の不良であれば,実際の外観不良について主成分分析を行い要因である因子から判別分析を行うことで判別は可能である.しかし複数の不良現象の識別はこの方法ではうまく識別できない.そこで,階層を設け,段階的に判別分析を実施し,階層ごとのモデル式から不良現象を抽出し,因子が検出されなくなるまで段階的に現象の識別を行う.この方法を用いることで,複数の不良現象の層別およびモデル化が可能になり,識別精度が向上した.またこの結果は技術者の推定を裏付けるものであり,対策の方向性が明確化した.実際に工程途中にこの簡易検査を入れることで,改善効果として年間420万円もの効果が得られている.今後は,他手法との検討を含めさらなる精度向上を目指している,とまとめられた.

フロアからは,階層の順番には技術的に意味があるのか,不良に種類があるとわかっているならば多群判別でもできるのに,それを用いなかった理由は? など活発な議論が行われた.

6. エキスパート賞受賞講演


廣野 元久氏
発表資料(2.41MB)

第15回 JUSEパッケージ活用事例エキスパート賞を受賞した(株)リコーの廣野元久氏には,「StatWorksとの出会いから,SEM因果分析に出会うまで」として講演をしていただいた.まず,自己紹介として氏の経歴とともにStatWorksとの出会いが紹介された.その後,グラフィカルモデリング(GM)と構造方程式モデリング(SEM)についてケーススタディとともにお話になられた.GMおよびSEMとは,変数間の相関情報から統計的な理論により内部構造を単純化しグラフで表現する方法で,因果分析に利用されている.数値データを使った因果分析はシステム思考に向いており,現在の統計学習で不足しているグループワークによるケーススタディに有効であると述べられた.最後に,統計的ソフトウェアが持つべき能力と分析者が気を配るべきポイントをしっかりと意識しておく必要があるとまとめられた.

司会の立教大学山口和範先生から,長年企業でSQCやQMに携わってきた側から,現在の大学教育についてのコメントを求められ,廣野氏は手法開発と実利用の間には深い谷が存在し,大学では実利用についてあまり重要視していないと感じるので,もっとそれがなんの役に立つのかを議論してほしいと述べられた.

7. おわりに

1日にわたり,産学の立場から,データの利活用における問題解決方法と今後の課題について議論を深めることができるシンポジウムとなった.産学から多彩な人材が集い,実践事例を通して,情報交換や新しい知見の発見の場となった.会場の雰囲気を少しでもお伝えできていれば幸いであるが,本年度残念ながらご参加できなかった方は,ぜひ来年度は足をお運びいただきたい.この雰囲気を会場で体感し,活発な議論の場に身を投じてみていただければと思う.


展示ブース:左から(株)日本科学技術研修所,ニュートンワークス(株)殿,(株)日科技連出版社殿


著者:西垣 貴央 氏
青山学院大学 理工学部経営システム工学科


掲載されている著作物の著作権については,制作した当事者に帰属します.
著作者の許可なく営利,非営利,イントラネットを問わず,本著作物の複製,転用,販売等を禁止します.
所属・役職・内容等は,当時のものです.

要旨集の販売について
シンポジウムの発表内容を掲載した冊子
これまでに開催された各シンポジウムの発表要旨集を販売しております.ただし在庫がない場合もございますので,あらかじめご了承下さい.ご希望の方はセミナー事務局までお問合せ下さい.
お問い合わせ窓口へ

イベント案内や製品などの最新情報をお届けします

最新のイベント・セミナー情報をご案内します

メールマガジン
最新の製品アップデート情報やセミナー・イベントなどのお知らせを,eメールでお送りします