COMPANY

PAGE TOP

BLOG

【分析活用成功を!】機械学習活用を成功させるには 後編 (第3回)

KSKアナリティクスでは、データ前処理に特化した分析プラットフォームを開発しております。
このブログでは、データ分析活用を進める際に立ちはだかる壁とも言われ続けている前処理の視点で、
どうしたら分析活用を、より円滑に、より成功確度を高める ことができるのかについて、
話をしていきたいと思います。

前々回、「データ分析活用の壁となるデータ前処理、この壁をより低くするには?」
を掘り下げていくとアナウンスしたのですが、
そもそも「機械学習を活用したプロジェクト自体を成功させたい」ということが、
まずはの関心ごとではないかと思い、このプロジェクトの成功をテーマとして取り上げました。

前編で落とし穴を紹介しましたので、
今回は 後編として、落とし穴に対する工夫を考えていきます。

プロジェクトの成功確度を高めるには

前編では、落とし穴として4つの問題を紹介しました。

 4つの問題点
  問題1: 誰も知らない難しさ
  問題2: バランスの問題である という難しさ
  問題3: データの質・量に問題がある という難しさ
  問題4: 業務への活用の難しさ

これらの問題点の特性をに対して、成功確度を高める方法として、
5つの工夫を紹介したいと思います。

 成功確度を高める工夫
  工夫1: 活動意義の吟味   ・・・ 継続は力なりを考える
  工夫2: 課題構成の吟味   ・・・ 成功と失敗のイメージを考える
  工夫3: アプローチの吟味  ・・・ 成功するための原理(理屈)を考える
  工夫4: 課題解決の場の吟味 ・・・ 業務活用とデータと分析技術のバランスを検討可能にする
  工夫5: 推進時の吟味    ・・・ アジャイル的な推進を心がける

工夫1:活動意義の吟味

あなたが、会社から期待されて機械学習を活用した業務改善の推進者になったとして、
どのようにして成功確度を高めるかを、一緒に考えてみましょう。

狙い通りの業務改善を期待しつつも、本当に成功できるのか不安に思うのではないでしょうか。
不安の原因は、当たり前ですが「問題1:誰も知らない難しさ」で予め答えを知っていないのと、
分析技術を活用する際に顕在化する問題2〜4のリスクを感じてのことと思います。

まずは、あなたの会社で機械学習を活用することの長期的な意義について、
プロジェクトを始める前に、考えを整理しておくことをお勧めします。

 例 長期的な意義
   整理:分析活用を継続的に行い、活用力を上げることが重要 ・・・ 継続は力なり
   → 答えを知らないから、分析を行い、知りたい
   → 知っている状態になれば、より効果的なアクションができるはず
   → 答えを知らないから、今回は狙い通りの結果でなかったとしても、
      改善点(より知っている状態になれる方法)を得れば、進歩できるはず

思考実験:異常予測

ここで、「知らない状態」と「知っている状態」と「分析の意味」について、
思考実験でイメージを把握しておきましょう。
設備の稼働ログデータから、異常予測を行いたいとします。

知っている状態

「知っている状態」とは、「センサーAの値が急上昇した2日後に、必ず故障する」
というような法則を知っている場合、機械学習も不要で、
単純なIF THENルールで精度100%の予測が可能です。

知らない状態

「知らない状態」では、故障に関連が少しでもありそうな多くの種類の情報源を集めて、
機械学習を活用して、有るのか無いのか分からないが、
データの背後に隠されているかもしれない法則を頼りに予測を行うことになります。

分析の意味

理想的な異常予測は、法則を知っていて活用することに異論は無いと思います。
データ分析は、今は法則を知っていないが、より法則を知っている状態へ、
より効果的・効率的に移行したい場合に有用な手段ということが分かります。
ただし、狙いどおりの予測精度が得られるかは、知らないが故に分からないという
本質的な問題があります。

思考実験のまとめ

「知らない状態」から「知っている状態」へ移行するという知識獲得の問題であり、
狙い通りの精度に到達できなかったとしても、
分析を通じて、より知っている状態になれたのであれば、知識の面で進歩があったといえます。

逆に、分析を通じて、知識の面でも進歩が無かった場合は、
分析自体が失敗したという最悪のケースで、こうならないよう避ける必要があります。
次節で、このための工夫について、考えてみましょう。

工夫2:課題構成の吟味

プロジェクトの課題を設定する際に、「4つの問題」、「分析を通じて知識の面でも進歩なし」
を考慮して、リスクを回避するための工夫を織り込むことをお勧めします。

 リスク回避の視点
  ● 課題の目標範囲の確認 ・・・ 成功と失敗のラインを吟味
  ● 課題の複数化     ・・・ 成功の難易度の組合せを吟味

課題の目標範囲の確認

課題に対する成功イメージは、プロジェクト関係者も興味津津で、活発な意見とともに、
具体化されることと思います。プロジェクトの成功確度を高める上での工夫としては、
成功の反対、失敗イメージも、予め確認しておくことをお勧めします。

 成功の範囲を広げる上での視点
  ● 現場の視点:業務活用を考えた場合の最低限レベルや必須要件の確認
  ● 会社の視点:知識獲得の進歩での貢献はあるか?

現場の視点:成功の下限

対象の現場に対して、業務活用を考えた場合、最低限でもこのレベルがないと失敗
といった成功の下限や、これを満たさなければ意味がないといった必須要件を聞き出して、
成功となる範囲の広さや難易度、必須条件を事前に把握します。

狙いは、プロジェクトの終盤になって、現場からこのレベルでは使えないよ
といった困難な状況に陥ることを避けたいのと、
大成功をプランAとした場合に、成功の下限をプランBとして、
プロジェクトの状況に応じて、目標を切り替えられるようにしたいためです。

会社の視点:消極的な知見

「4つの問題」、特にデータの質・量の問題などの状況によっては、
成功の下限であるプランBでも達成が困難ことも想定されます。

そこで、さらなる保険のプランCとして、
今回のプロジェクト成果として現場導入は無理としても、
異常予測の思考実験で考えたような、会社として知識の進歩への貢献を設定して、
プロジェクト失敗の回避を考えます。

「知識の進歩に失敗した」がどういう状態かを手がかりに考えて、
  「分析を実施したが法則は得られず、
   対象としたデータに法則があるのかどうかも判断つかない」
というような、
  「次のアクションを考える上での有用な情報が無い状況」
と定義しました。

一般的に、データの質・量の問題に起因する失敗が多いことから、
  「今回対象としたデータには、法則が含まれていない」
という残念で消極的な知見ではありますが、次回は新たなデータを検討すべし という
アクションを考えることができるため、知識の進歩に貢献したと
いえるのではないでしょうか。

プロジェクトをやらない方がよかったという完全な失敗を回避するために、
このような網羅性を担保できるような課題を含めておくことをお勧めします。

課題の複数化

1つの課題での成功確度を高めるために、成功の下限、消極的な知見という
プランB、プランCを考えましたが、課題の難易度の面、労力と効果の面からも考えると、
さらに複数の課題候補を用意しておくのが効果的です。

推進途中でデータの質や量の面で目標達成が困難と判断したものは、対象から外したとしても、
少なくとも1つの課題は達成し、プロジェクトとしては成功させることが狙いです。

複数の課題を選定する際に、難易度の低いものや、成功の範囲が広いものを
テーマに含めておくことで、より成功確度を高めることを狙います。

工夫3:アプローチの吟味

プロジェクトの課題候補が出たところで、それぞれの課題について、
解決できるとした場合の上手くいく理屈を見える化することをお勧めします。

プロジェクトの関係者で、論理的で妥当なアプローチかを確認しあうこと、
課題解決成功の重要な要因を共有することが狙いです。

成功の理屈を考える場合は、業務活用の視点での効果が出る原理と、
分析技術的に有用な情報を抽出できる原理とに分けて行います。

 課題解決の理屈の見える化
  ● 業務活用が成功する原理  ・・・ 業務課題の定義
  ● データ分析が成功する原理 ・・・ 分析課題の定義

この理屈が分かっていない、上手く表現できない、漠然としていて曖昧である、
論理的に考えて違和感がある といった問題点が無いかを、皆で確認しましょう。

これにより、実際に分析を行わずとも失敗が予見できるレベルのアプローチを排除し、
理論的に成功可能なアプローチに対して、労力をかけるべき重要な要因は何かを、
プロジェクトの関係者で共有していくことが狙いです。

なお、当然のことですが、妥当な定義ができていないプロジェクトは、
運任せで、泥沼に陥るリスクが俄然高くなり、成功確度を大きく下げてしまうのですが、
このパターンで失敗しているプロジェクトは、思いの外多いのではと思っています。

工夫4:課題解決の場の吟味

教科書に必ず書かれていることですが、業務、データ、分析技術の3つのバランスを調整しながら
推進することが必要ですので、それぞれの視点で妥当性を吟味できる担当者を参加させることが、
成功のための大前提となります。

この体制により、「バランスの問題であるという難しさ」、「業務への活用の難しさ」という
問題点への対処を行うことが可能になります。

この他の成功確度Upのための工夫としては、現場部門の巻き込みがあり、効果的で重要なのですが、
心理学も活用するなど奥深いテーマですので、別の機会に話をしたいと思います。

工夫5:推進時の吟味

最後になりますが、プロジェクトを推進する際の工夫としては、アジャイルな推進を
お勧めします。

これは、「誰も知らない難しさ」、「バランスの問題であるという難しさ」から、
当初に定めた計画に従うことを絶対的な前提とするのではなく、
状況に応じて成功確度のより高いものに切り替えるなどの軌道修正を行うことで、
成功確度を高めることが狙いです。

まとめ

データ分析プロジェクトの落とし穴に対して、
穴に落ちるのを避けて、より成功確度を上げるための工夫として、5つを紹介しました。

主にプロジェクトを立ち上げる際に行う工夫に焦点を当てて説明しましたが、
推進中の工夫については、またの機会に話ができればと思います。

 成功確度を高める工夫
  工夫1: 活動意義の吟味   ・・・ 継続は力なりを考える
  工夫2: 課題構成の吟味   ・・・ 成功と失敗のイメージを考える
  工夫3: アプローチの吟味  ・・・ 成功するための原理(理屈)を考える
  工夫4: 課題解決の場の吟味 ・・・ 業務活用とデータと分析技術のバランスを検討可能にする
  工夫5: 推進時の吟味    ・・・ アジャイル的な推進を心がける

過去の投稿
【分析活用成功を!】データ前処理という成功の鍵を考えてみませんか (第1回)

【分析活用成功を!】機械学習活用を成功させるには 前編:落とし穴 (第2回)


データ前処理に特化した分析プラットフォーム 「KSKP」


https://www.kskp.io/

弊社のビジョン 「 誰もが当たり前にデータを分析・活用できる社会 」 実現のために、
データ前処理の壁を乗り越えることを支援します。

さらに、組織的なデータ分析・活用を発展させるために、
データ前処理に対して、共有化による労力の削減と品質の向上を支援します。

データ前処理の領域は、その特性より多様性と奥深さがあるため、
ツールの選定問題ではなく、データ前処理の要件整理と設計が必要な局面も多くあります。
製品導入だけでなく、データ前処理の問題への対処が必要な場合も、
まずは、お気軽にお問い合わせください。

【お問い合わせ】

執筆者: KSKアナリティクス 山田 賢太郎

鉄鋼業のシステム研究開発部門にて、分析技術の現場適用を推進し、
SI構築業にて、分析活用のコンサルティングを推進し、
現在、データ前処理ツールの開発に従事と、
20年以上に渡り、データ分析活用の成功について問い続けています。

$$ \begin{aligned} \newcommand\argmin{\mathop{\rm arg~min}\limits} \boldsymbol{\beta}_{\text{ridge}} & = \argmin_{\boldsymbol{\beta} \in \mathcal{R^p}} \biggl[ ||\boldsymbol{y}-\boldsymbol{X\beta}||^2 + \lambda ||\boldsymbol{\beta}||^2 \biggr] \\ & = (\boldsymbol{X}^T\boldsymbol{X} + \lambda\boldsymbol{I_{p+1}})^{-1}\boldsymbol{X}^T\boldsymbol{y} \end{aligned} $$
PAGE TOP