超簡単!データマイニングの分析手法とは!

こんにちは。

ITエンジニア・webディレクター・webデザイナーなどのIT人材の自立・キャリアを支援するITプロパートナーズ編集部です。

弊社では、独立精神旺盛な優秀なエンジニアの方々の独立・起業サポートや、フリーランス支援を行っています。
こちらでは、日々の現場でサポートさせていただいている中での、プロの目線で役立つお話をしてまいります。

データマイニングを有効に使える企業が、将来的に生き残る企業であることは間違いないと思ってよいでしょう。

 

今までは経験や勘で行ってきたようなことも、データマイニングを使うことで、全て根拠があり、理論的に説明の出来るものになります。

ここでは、そもそもデータマイニングって何だっけ?というところから手法まで説明していきます。

freelance

そもそもデータマイニングとは?

データマイニングとは、「顧客一人一人の考えや行動に基づき、会社と顧客が良い関係を構築できるような手法や戦略」をサポートするシステムのことです。

具体的に言うと、企業が膨大な情報をデータベース化し、そのデータを分析、解析を行い、顧客のパターンや行動心理を読み取ることで、マーケティング活動をサポートするような情報を提供したりすることです。

今まで一見何も関係の無いと思われていたような顧客の行動や、イメージでしかとらえられていなかったことが、数値化したり、データによって証明したりすることが出来るので、企業にとってはこの情報は非常に重要な顧客を理解するツールとなり得るのです。

以下の章ではデータマイニングの中でもマーケティング分野、とりわけ購買行動に関しての説明を中心に説明していきます。

データマイニングの分析手法とは?

データマイニングの基本処理の構造は、以下の流れになっています。

1.データを抽出する
2.データを並べ替える
3.データをグループ化する
4.データの性質を知る
5.データとデータの関係を知る

この5つを基に、これらを組み合わせたりすることで作られています。以下ではそれぞれについての詳細説明を行っていきます。

1.データを抽出する

取得したデータから、ゴミデータ(ノイズ)を除去し、分析対象データを抽出することをいいます。
また特定したものの中から、条件に合ったものを抽出したりできます。
特定条件を選択することで、顧客の選別や、商品群の選別など、必要に合わせたデータや選別が可能となります。

2.データを並べ替える

上位順に並べ替えたり、予測をした情報をもとにそれに沿って並び替えたりします。

3.データをグループ化する

商品をカテゴリー別に分類したり、属性毎に分類したりして分けます。

4.データの性質を知る

グループ化されたものの情報をまとめたり、統計数値を出したりします。

5.データとデータの関係性を知る

データ群とデータ群の相関性を導いたり、確率を出したりします。

このようにデータマイニングに使われているプログラムは上記の5つが全てで、あとはそれらを如何に組み合わせているかという違いだけです。

例えば、アンケートデータの基本の基本であるクロス集計は、顧客を属性や何らかの特徴でグループ化し、 各グループのデータの性質を調べる集計方法だといえます。

これら分析の手法への理解はとても重要ですが、 データマイニングが解決する課題で述べた様々なマーケティング課題の解決のためのデータマイニングの種類には、 なにをどのように組み合わるかを理解し、正しい戦略を立てた上で、そのデータを活用することが何よりも重要となってきます。

データマイニングと統計解析の違いは?

データマイニングと統計解析を混同している人がいますので注意が必要です。

データマイニングは知識発見で統計解析は仮説検証であると言われることも多いですが、それが全てではありません。

データマイニングでは取り扱うデータ量が多く、統計解析ではそこまでデータ量が集まらないのは間違いありません。
また、データマイニングには知識発見の要素もありますが、データを入れれば何らかの知識が自動的に発見できるものではありません。

データマイニングには2種類あり、知識発見だけではなく、統計解析と同じように、仮説検証もあることを認識しておく必要があります。

データマイニングには大きく2種類あり、ひとつは仮説検証的データマイニングで、もうひとつは知識発見的データマイニングです。

仮説検証的データマイニングは、目的変数があり、購買量や顧客の反応を予測したり、そのために顧客を分類したりするものです。

回帰分析、決定木、ニューラルネットワークなどの多くの手法は、 目的を持ってモデルを作るために使われます。

一方の知識発見(探索)的データマイニングには目的変数がなく、得られたデータから有用なルールやパターン、類似性などを見つけ出そうというもので、代表的な手法としてマーケットバスケット分析に用いられるアソシエーション分析があります。

仮説検証的データマイニングの分類は、

①推定、把握(量的変数)

②分類、抽出(質的変数)

③将来の予測

と分けることができます。

知識発見的データマイニングの分類は、

①アソシエーションルール策定

②クラスタリング

③両者で用いられる

④グループの特徴を推測する(プロファイリング)

と分けることが出来ます。

データマイニングで収集するデータには、売上高や売上個数のように、連続した数値で表せる量的データと、 この顧客は何を買ったのかというように、買ったか、買わないかが1/0のデータで表せる質的データ(アイテムカテゴリー型)があります。

多変量解析においても、扱う変数が量的か質的かによって用いることのできる手法が決まるように、データマイニングでも扱う変数の種類によって、 様々な手法を使い分ける必要があります。

仮説検証的データマイニングの中で、「推定、把握」というのは、例えばどのエリアでどのような商品がどの程度売れているのかといった、 量的な数値を推定したり把握したりするものです。

「分類、抽出」というのは、そのエリア別に売れている商品や商品カテゴリーを抽出し、分類、整理して分析するものです。

この2つは正しい現状認識をするという目的で使うものですが、「予測」は現状ではなく、 将来の売上高や売れ筋商品などを何らかのモデルを作って予測することをいいます。

一方の知識発見的データマイニングの「アソシエーションルール策定」は、同時に何と何が買われているかなどを探索的に知ることで、 例えば、この商品を買った人にはこの商品をお薦めしようというレコメンデーションに活用します。

「クラスタリング」は、 購買動向などから似たような人をグループ化し、グループ毎に最適な施策を打とうというものです。
この2つは、目的変数がないので、 多変量解析でいうところの要約の手法に当たりますが、分析の目的がないわけではありません。

クラスタリングと分類の違いは、グループ分けする根拠が、あらかじめ定義された属性や購買金額などによって分けるのか、 または事後に定義された探索的根拠によってグループ化されるかです。

デシル分析やRFM分析などは、同じように顧客をグループ化する方法ですが、 購買金額や頻度の大小というあらかじめ定義された根拠によって行われています。

クラスター分析は、グループ化は何らかの根拠で勝手にされ、 事後にそのグループの特徴を知るプロファイリングを行なうので、全くアプローチが違います。

仮説検証でも知識発見でも用いられる「グループの特徴を知る」の代表的データマイニングが「テキストマイニング」でしょう。

テキストマイニングは、目的を持って語られている内容を定性的、定量的に知ることもありますし、 探索的に何が語られているかを発見することもあります。

このように、データマイニングには目的を持ってあらかじめ定義された根拠に基づいて行なう、仮説検証(目的志向)的データマイニングと、 知識発見(探索)的データマイニングの2つがあります。

データマイニングを使って解決する課題

データマイニングを使い最終的に解決する課題とは、商品や顧客について、マーケティング分析をするためのデータ抽出し、相関性や関係性など必要な情報を導き出すことです。

例①)商品についての具体的に必要な情報

・どこでどの商品がどれくらい売れているのかという推定、把握。

・自社の商品はどのように分類すればよいのかという分類、抽出。

・今後力を入れるべき重点商品はどの商品なのかの分類、抽出。

・この商品は将来どの程度売れるのか将来の予測。

・どの商品とどの商品が一緒に買われているのかアソシエーションルール策定

・新商品の評判はどうだったのかをグループの特徴を知る

などです。

例②)顧客について具体的に必要な情報

・この顧客はどんな商品を買ってくれているかの推定、把握。

・優良な顧客、離反しかけている顧客は誰かの分類、抽出。

・この商品は将来どの顧客が買ってくれるのかという将来の予測。

・どの顧客クラスターにはどの商品をお薦めすればよいかのクラスタリング。

・自社の顧客は性年代別、地域別にどんな人なのかというグループの特徴を推測する。

等となります。

上記の課題はマーケティングの基本でもあり、4P施策を実現するうえで必要不可欠な知識やルールを発見することで解決され、この点はデータマイニングで何よりも重要な点です。

エンジニア・プログラマの新しい働き方を模索してみませんか?今より年収がグッと上がる働き方をご提示できるかもしれません!弊社(ITプロパートナーズでは,週2日からこなせる仕事を紹介しております。まずはこちらより、弊社のサービスにご登録後、お仕事の詳細をごらんください!

まとめ

データマイニングで重要なことは、扱うデータを科学的アプローチによって、いかに課題解決につなげるかということです。

そのためには、データの取得、蓄積、解析、 モデル構築、検証、課題解決までを一気通貫で科学することが求められ、データマイニングの必要性があるのはこの点を人間の感覚的なものではなく、データを複合的に組み合わせ論理的に帰結したものとして扱うことができるからです。

データマイニングでは、アルゴリズムや数理計画という技術を使用し、効率的に、高速に処理を行い、これを可能にします。

データマイニングを正しく利用することで、顧客満足度を高めたり、商品の無駄をなくしたりすることにもつながってくるので、サービス業、製造業、小売業など、消費者の多様化する行動や心理を理解する上でも、様々な業界でも必要不可欠なものとなっているのです。

bn04

もし、今あなたが

・フリーランスになるか悩んでる
・自分に合った案件があるのか不安
・そもそも何から始めればいいのか分からない

などお困りであれば、ぜひ弊社ITプロパートナーズのサポート内容を確認してみてください!

登録後、専属エージェントに無料相談もできますよ!

※週2日 / 30万〜のフリーランス案件を紹介中です
※ご経験やご希望によっては案件を紹介できない場合がございますのでご了承ください。


よく見られてる関連案件

b80c977483d024c14549510e194361fe 2_anken 3_anken
The following two tabs change content below.
株式会社ITプロパートナーズ

株式会社ITプロパートナーズ

「IT起業家・フリーランスの自立を支える」というビジョンの元、「週2日からの業務委託案件を紹介する、ITプロパートナーズ」を運営。 ■BestVenture100に創業初年度で選出 ■取材記事:自立する覚悟が、働き方を変える
freelance