2013年5月30日 星期四

一切都是區隔

也許您已經發現,我很少在這個部落格談到技術面的事。一般講資料分析或Data Mining的書不是都用許多篇幅介紹Data Transformation、Clustering、Decision Tree、Regression、Association這些技術嗎?為什麼我幾乎不曾在這裡提到Lift、Odds Ratio、Confidence、R-square這些資料分析常見的名詞呢?其實這只是我為這個部落格作區隔(Segmentation)的結果,希望它跟其他以技術為主的部落格可以有所差異,訴求的讀者對象也不同。而Segmentation也是這一篇的主軸(包括旁邊這張照片,看得出來嗎?)。

首先介紹Konstantinos Tsiptsis和Antonios Chorianopoulos兩位所寫的Data Mining Techniques in CRM: Inside Customer Segmentation (Wiley 2010)。其實這本書有許多章節是在講技術(Techniques),跟我的部落格走向不太一樣。但是它提供了不少Segmentation專案的案例,包括銀行、電信、零售三種產業,而且它在講每個案例的一開始都會說明這個專案所要解決或達到的業務問題或目的是什麼,甚至還包括後續應用的構想(嚴格說起來,這是目的的一部分),這是這本書跟其他以技術為主的Data Mining書籍最不一樣的地方(換句話說,它成功的把自己跟其他Data Mining書籍區隔開來)。在我看過的Data Mining技術性書籍中,業務問題或目的不是完全被忽略,就是簡單一兩句話帶過。影響所及,是以模型作為思考的起點,或是為了建置模型而建,結果就是模型完成之後難以應用。