2013年4月14日 星期日

笨蛋,問題在問題! Part 3

雖然前面兩篇提到的都是我在工作上遇到的實際狀況,但這不代表只有我自己一個人認為深入了解Business Problem是最優先的步驟。舉例來說,CRISP-DM這個Data Mining流程模式在1990年代誕生的時候,第一個步驟就是Business Understanding:
This initial phase focuses on understanding the project objectives and requirements from a business perspective, then converting this knowledge into a data mining problem definition and a preliminary plan designed to achieve the objectives.
到了2012年,Jean Paul Isson和Jesse S. Harriott寫的《Win With Advanced Business Analytics》這本書,也是把Business Challenges放在他們提出的BASP(Business Analytics Sucess Pillars)架構的第一位:
... a crucial step of any business analytics implementation requires clear understanding of organizational objectives, or "business challenges," to ensure that any solution is aligned with, and addresses, the company's biggest or most pressing needs.
那麼為什麼人們還是常常輕忽了這個重要的步驟,直接就討論要建置什麼模型呢?我觀察到一個現象,也許跟這種狀況有關。

近幾年來,市面上一下子出現許多關於Analytics的書籍,我發現這些書籍的寫作角度大致上可以分為三種層次:
  • 策略層次:敘述Analytics的優點,有時會舉出企業的實例(但不會深入描述),以鼓吹其他企業採取行動導入。雖然會指出企業在導入Analytics時必須注意的要素,基本上還是以概略性的方式來敘述,不會有細節。Thomas H. Davenport的《Competing On Analytics》和《Analytics At Work》都屬於這一類的書。
  • 規劃層次:主要是給準備導入Analytics的企業做參考,內容會比前一類的書來得具體些,除了指出必須注意的要素,通常也會解釋Analytics的流程。會強調先要了解Business Problem的多半是這一類的書。除了上面提到的《Win With Advanced Business Analytics》,Gert H. Laursen和Jesper Thorlund的《Business Analytics For Managers》也可以歸到這一類。
  • 技術層次:這類書的對象是負責建置分析模型的人,所以內容非常具有專業性,主要涵蓋處理資料的各項技術以及各類模型背後的演算法,有些由資訊廠商(贊助)出版的書還會詳述分析工具的操作與設定。屬於這類型的書籍最多,包括Gordon S. Linoff 和 Michael J. Berry寫的《Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management》等。
(以上提到的書籍只是以我自己所讀過的書來舉例,沒有推薦之意。)我個人認為,在規劃層次和技術層次之間應該還要有屬於執行層次的書,敘述各類Business Problem的實際案例,並說明如何以Analytics的方法來解決,主要對象是企業裡負責各項業務的中階主管和Analytics Team的經理。

舉例來說,策略層次的書可能提到某家企業應用Analytics在Customer Management上,得到如何如何的效益;規劃層次的書也許會舉出Customer Management的相關挑戰包括Customer Understanding、Up-selling / Cross-selling、Churn Management等問題,並說明Customer Understanding的目的可以利用Customer Segmentation的分析方式來達到;但是技術層次的書就直接跳到利用Clustering技術做Customer Segmentation時的資料轉換、離群值處理、K-means演算法等細節上。然而在實務上,Customer Understanding有許多不同的層面,並非一定要做Customer Segmentation不可。而即使在深入探討問題後決定要以Customer Segmentation來解決,也會因為應用上的需要而有不同的作法。

以零售業在應用Analytics的翹楚Tesco為例,他們的Customer Segmentation就有許多不同的面向,這些面向都是因應Tesco在不同階段所產生的業務應用問題。從最早的RFV(Recency, Frequency, Value),到之後的Basket、Bucket、Lifestyle、Habit等,全都是所謂的Customer Segmentation。換句話說,沒有所謂的「標準的」Customer Segmentation可以放諸四海皆準,從規劃層次就跳到技術層次,顯然有一大段的落差。

Analytics書籍的「斷層」現象是不是足以說明為什麼Business Problem在分析的過程中被忽略?我認為有其相關,但也沒有肯定的答案。不過屬於執行層次的書的確不好寫,因為在詳述Business Problem的實際案例時不免會洩漏該企業面臨的問題,而在說明如何把一個Business Problem定義成Analytics的問題時,似乎也會把秘密透露給競爭對手。以我個人而言,就是從每一次的專案中去累積經驗了。

沒有留言: