COMPANY

PAGE TOP

BLOG

【連載】RapidMinerで始める簡単データ分析!!~はじめに~

本連載では、RapidMiner Studio(RapidMinerデスクトップ版の正式名称)の
いくつかの基本機能と 特徴をチュートリアルを通して学んでいただき、
RrapidMinerの操作に慣れていただきます。

 < チュートリアル紹介 > 

 次回からご紹介するチュートリアルの概要をお伝えます。 

【Part1: データ読み込み】   
  RapidMiner Studioの環境設定とデータを取り込む方法 
【Part2: データ可視化】    
  より良い知見を得るためのデータの可視化方法 
【Part3: モデル作成】     
  離反しそうな顧客を予測するモデルを作成する方法 
【Part4: モデル適用】    
  (Part3とは別の)データにモデルを当てはめる方法 
【Part5: モデル評価】 
  良い結果を保証するモデルの精度を評価する方法
------------------------------------------------------------------------ 
データ分析を始めたいけれど、統計解析ソフトRや機械学習ライブラリが豊富なPythonを使って
プログラムを書くのは敷居が高い、とお悩みの皆さま。
オープンソースでGUIベースのデータマイニングソフト「RapidMiner」を使えば、
手軽に・簡単に・速くデータ分析できます!

本連載では、RapidMinerをダウンロードしてみたもののどのように使えばよいか分からないという皆さまへ、
使い方の超入門講座をお送りします。

全て読み終えた頃には、皆さまご自身でデータ分析ができるようになります。
それでは、始めていきましょう!

※ RapidMinerのダウンロードはこちら

------------------------------------------------------------------------ 
ビジネスの例を挙げて考えてみましょう。

あなたはこれまでに、顧客に関する膨大なデータを収集・蓄積してきました。
あなたは次に、このデータを使って、各顧客が今後、継続顧客のままか離反顧客になりそうかを
見極めたいと考えています。
どの顧客が離反するか、どのようにして予測すればよいでしょうか?
また、継続顧客として留め置くためには、どの顧客にマーケティング費用を費やせばよいでしょうか?

RapidMinerは、現代の企業ビジネスに合った分析プラットフォームです。
RapidMinerを使えば、「プロセス」と呼ばれる分析処理フローを速く、簡単に作成できます。
そして、プロセスに含まれる「オペレータ」と呼ばれるブロックを繋げていけば、予測モデルを作成できます。
実際には、分析から知見を得たり行動を繰り返し実行し、予測分析を完成させていきます。
そうすることで、予測に基づいた意思決定を運用できるようになります。

------------------------------------------------------------------------ 

$$ \begin{aligned} \newcommand\argmin{\mathop{\rm arg~min}\limits} \boldsymbol{\beta}_{\text{ridge}} & = \argmin_{\boldsymbol{\beta} \in \mathcal{R^p}} \biggl[ ||\boldsymbol{y}-\boldsymbol{X\beta}||^2 + \lambda ||\boldsymbol{\beta}||^2 \biggr] \\ & = (\boldsymbol{X}^T\boldsymbol{X} + \lambda\boldsymbol{I_{p+1}})^{-1}\boldsymbol{X}^T\boldsymbol{y} \end{aligned} $$
PAGE TOP