東京に棲む日々

データ分析、統計、ITを勉強中。未だ世に出ず。

A Small Study on Segmentation by Clustering Analysis

業務で、Webログや契約者データを用いて、クラスター分析を使ったセグメンテーション(顧客分類)に関して考える必要があったので、それに関するメモ。
 

1)セグメンテーションに関して

以下の文献で、参考になることが多かったので、引用とメモ。

中村 2008 “マーケット・セグメンテーション - 購買履歴データを用いた販売機会の発見”

マーケット・セグメンテーション―購買履歴データを用いた販売機会の発見 (専修大学商学研究所叢書)

マーケット・セグメンテーション―購買履歴データを用いた販売機会の発見 (専修大学商学研究所叢書)

 

 

セグメンテーションアプローチ(顧客分類し、グループ別に異なったコミュニケーション)の際の注意点。使用する変数に関して。

 

 
スライドp.2
セグメンテーションアプローチにおいて、これらの評価指標があいまいな場合、実行不可能、もしくは結果に繋がらないと考えられる。

スライドp.3
実際に分析する場合、データ取得が容易だからと言って、性別や年齢といった変数を用いても効果は低い。
コンバージョンに直接繋がる影響の大きい変数は、一般的に抽象的かつ取得困難。


2)クラスター分析に関しての実験
「何でこのように分けたのだ」、「どのような変数がビジネス上重要なのか」といった質問に、クラスター分析は非常に弱い。クラスター分析は教師なし学習。データの一つの見方を提供する分析であるり、使用する変数によって安定性を失ってしまう分析であり、使い方を気をつけないと、間違った結論を導いてしまう可能性があるので注意が必要だと思う。

スライドp.3-7では、あるビジネス目標を達成するためのセグメンテーションにクラスター分析を用いる場合、なんでも変数を投入してクラスター分析してしまっていいのか、に関して実験してみた。
  

 

結論としては、セグメンテーションアプローチをするといった何らかのビジネス目標がある場合、データの取得が容易な変数だけを集めてクラスター分析にかけると言ったアプローチは危険で、クラスター分析に投入する変数は吟味すべきであると考える。

スライドp.8では、簡単であるが、クラスター分析によるセグメンテーションアプローチの提案。