2013年12月11日 星期三

Amazon.com 難得也有出錯的時候

上圖是我今天收到 Amazon.com 寄給我的行銷 Email(點選可放大),雖然 Amazon.com 精準的計算出這些都是我有興趣的書,但卻忘了排除我已經跟他們買過的第二本《Show Me the Numbers: Designing Tables and Graphs to Enlighten》和第四本《Taming The Big Data Tidal Wave》。尤其第二本是我上個月才下單買的,而且也是因為我買了第二本才 trigger 他們發這封行銷資訊給我的,所以算是被我抓到一個小小的 bug 吧!

2013年12月5日 星期四

如果無心改進,垃圾永遠是垃圾

自從我在今年8月貼出《高成本的低成本行銷溝通管道》這一帖後,那幾家被點名的國內知名企業寄給我的 Email 行銷訊息持續出現在我的垃圾郵件桶(Spam)裡。其實我一點都不寄望它們會有「翻身」到 Inbox 的機會,我只是納悶:當 Gmail 今年5月在 Inbox 增加了 Promotions 這個 tab 後,美國的 Email Marketing 服務業者馬上就構思反應之道。我們國內這些大企業的行銷部怎麼仍如此淡定,不會要想辦法「反制」Gmail 和 Yahoo! 嗎?

今天在電子報裡看到《10 Best Bets for Avoiding the Spam Filter》這篇文章,內容綜合美國幾家 Email Marketing 服務業者的意見,列舉了10種避免 Email 被判別為垃圾郵件的小撇步,在此轉介給有興趣的人士參考。

2013年11月26日 星期二

Data Art

前兩天在一個部落格看到 Data Artist 這個名詞,作者把 Data Artist 描述成運用資料和分析工具作為顏料和畫筆的藝術家,這樣的比喻著實讓我眼睛一亮,但是有沒有比較明確的定義呢?這篇文章說:
A data artist is responsible for delivering fresh insights from data to help an organization meet its goals. This is the person who takes the output from decision-support systems and turns it into consumable theories, postulates and hypotheses that can be tested and applied to the business.
跟前面那個譬喻比起來,這段定義的文字反而有點 anticlimax ,因為這不就跟 Data Scientist 沒什麼兩樣了嗎? Google 一下就可以發現 IBM 對 Data Scientist 的描述跟上面差不多:
What sets the data scientist apart is strong business acumen, coupled with the ability to communicate findings to both business and IT leaders in a way that can influence how an organization approaches a business challenge. 
所以上面提到的 Data Artist 看來只是作者自己發明的新名詞,並非一個新的 profession。(失望中)

我在兩年前寫的《Are You a Data Scientist?》敘述了 Data Scientist 必備的一些技能,除了 Data Munging 、 Data Modeling 這兩項傳統上認為是比較偏向 Science ,另一項 Data Visualization 就顯得「軟性」些,應該可以算是 Art 了吧。只是當時我對此似懂非懂,沒有一套理論。最近入手一本《Show Me the Numbers: Designing Tables and Graphs to Enlighten, Second Edition》(Stephen Few, Analytics Press, 2012),驚為天人,原來不是會用 Microsoft Excel 就代表會製作圖表。

2013年10月5日 星期六

數字不會說話;人,才會說話

昨天在家裡訂的《國語日報》上看到一則關於國道計程收費的新聞,內容基本上跟中央通訊社網站發布的【國道計程 75%車日省45元】這一則相同(其他新聞媒體也有類似的敘述):
(中央社記者汪淑芬台北2日電)交通部國道計程費率最終版今天定案。高速公路局估計,計程上路後,與現在計次相比,約3/4車輛平均每天可省新台幣45元。‧‧‧‧‧‧
我想交通部公布這個省錢數字的用意,是要讓大家相信新的計費方式很優惠,以便獲得大眾的支持。我剛看到這新聞的時候,也的確有這種省錢的感覺,只是我的感性不到幾秒鐘就被理性壓制住了。

新聞說3/4的車輛可以省錢,那麼我的車究竟屬不屬於這3/4?假設我真是這幸運的3/4裡的一員,我一個月跑高速公路頂多兩次,也會平均每天省45元嗎?(當然不會)

2013年8月21日 星期三

有效還是沒效?

電視的藥品廣告經常在最後加上一句「有效!」的台詞(而且還要用台語發音)。現代的藥品在上市前都要經過實驗和審核的過程,所以應該都是有效的,那些吃了沒效的狀況多半是沒有對症下藥。行銷人其實也會用「藥」,這些「藥」往往含有DM、型錄、簡訊、EDM、或廣告的成分,景氣好或買氣高的時期可能用得較少,遇到景氣變差、消費低迷、業績下滑、會員流失這些重症時就用得很兇。只不過行銷人常用的這些「藥」不像真正的藥品有公正單位的審查驗證,所以它們到底有效還是沒效?

2013年8月8日 星期四

高成本的低成本行銷溝通管道

左圖是我Yahoo!信箱的垃圾郵件桶(Spam)的內容,用滑鼠點選放大後可以看到不少國內知名企業寄給我的郵件被Yahoo!自動歸類為垃圾郵件。如果我沒有特別打開Spam信箱來檢查,我就不會看到他們給我的行銷訊息。

以往免費Email信箱的業者對付垃圾郵件的機制比較簡單,例如檢查標題或內文裡是否出現垃圾郵件經常使用的keyword。但是道高一尺、魔高一丈,如果這些keyword改用不一樣的拼法(例如把英文小寫的L改成阿拉伯數字的1),可能就成為漏網之魚。不過現在像Yahoo!或GMail等業者使用的過濾機制早就超越這種簡單的rule-based方式(當然是拜分析之賜),所以上圖出現的國內知名企業寄給我的Email雖然被Yahoo!當成我的垃圾郵件,別的顧客卻仍有可能在他們的Yahoo! Inbox看到這些行銷訊息。

2013年6月29日 星期六

From A (Analytics) to A+ (Aligned Actions)

德國柯隆大教堂的兩座尖塔像不像A+ ?
之前幫一家金融機構建了一個所謂的預測模型,用來評估靜止戶起死回生(reactivate,中文怎麼翻比較傳神?)的傾向高低。剛好我也名列他們的靜止戶,還好模型做出來我的傾向分數在前20%,要不然就有點糗了。

不過根據這家公司對我的說明,他們定期都會產出靜止戶的名單,交給客服人員撥打聯繫。他們查了我的資料,發現也都在聯繫的名單內,奇怪的是為什麼我從來沒有接過這樣的電話?

原來我在聯繫名單的電話號碼是我十多年前在飛利浦的公司電話,難怪他們的客服人員一直找不到我(所以我有理由當了這麼多年的靜止戶,嘿嘿)。問題是我雖然很久沒有跟這家金融機構有過金錢上的交易,我在近年來其實註冊加入了他們的網站會員,除了留下Email,我還登記了手機號碼。我的信箱三不五時都會出現他們發的電子報,卻從未接過客服人員的電話,到底是為什麼?

2013年5月30日 星期四

一切都是區隔

也許您已經發現,我很少在這個部落格談到技術面的事。一般講資料分析或Data Mining的書不是都用許多篇幅介紹Data Transformation、Clustering、Decision Tree、Regression、Association這些技術嗎?為什麼我幾乎不曾在這裡提到Lift、Odds Ratio、Confidence、R-square這些資料分析常見的名詞呢?其實這只是我為這個部落格作區隔(Segmentation)的結果,希望它跟其他以技術為主的部落格可以有所差異,訴求的讀者對象也不同。而Segmentation也是這一篇的主軸(包括旁邊這張照片,看得出來嗎?)。

首先介紹Konstantinos Tsiptsis和Antonios Chorianopoulos兩位所寫的Data Mining Techniques in CRM: Inside Customer Segmentation (Wiley 2010)。其實這本書有許多章節是在講技術(Techniques),跟我的部落格走向不太一樣。但是它提供了不少Segmentation專案的案例,包括銀行、電信、零售三種產業,而且它在講每個案例的一開始都會說明這個專案所要解決或達到的業務問題或目的是什麼,甚至還包括後續應用的構想(嚴格說起來,這是目的的一部分),這是這本書跟其他以技術為主的Data Mining書籍最不一樣的地方(換句話說,它成功的把自己跟其他Data Mining書籍區隔開來)。在我看過的Data Mining技術性書籍中,業務問題或目的不是完全被忽略,就是簡單一兩句話帶過。影響所及,是以模型作為思考的起點,或是為了建置模型而建,結果就是模型完成之後難以應用。

2013年4月29日 星期一

等一等,不要急著建模型!

在充分了解企業想透過分析來回答的問題後,也還不到一頭就栽進模型的時候。因為一樣的問題,回答的方式通常不只一種,所以運用資料分析的手法也不會一樣。棘手的是並沒有所謂的標準模式可以放諸四海皆準,我個人認為比較好的方法是先思考企業未來可能會如何應用分析的結果。這好比要在紙上畫一條直線,之前提到的了解問題就是直線的起點,應用分析的結果則像是終點,唯有先確認終點的位置,畫出的直線才不會偏誤。

說起來似乎很抽象,因此我用一個實際(但已被我大幅修飾與偽裝)的案例來說明。

有一家大型的通路事業群,旗下有兩個不同品牌的連鎖通路:一個是走超級市場路線的「好食在」,一個是專賣家電與3C的「好家在」,其中「好食在」成立較久,分店數也較多。這兩個通路品牌各自擁有自己的行銷團隊,行銷檔期也不同,但會員卡是共同的「卡好卡」,會員在兩家通路都可以持卡累積消費點數。由於「好食在」的歷史久、分店多,到「好食在」消費的會員遠多於「好家在」,因此這個事業群新上任的行銷總監希望「好食在」的行銷團隊能把會員導到「好家在」消費。另一方面,「好家在」因為銷售3C與家電,會員的客單價都遠高於超級市場型態的「好食在」,所以這個事業群也想辦法讓「好食在」多吸收一些過去只在「好家在」消費的會員。

2013年4月14日 星期日

笨蛋,問題在問題! Part 3

雖然前面兩篇提到的都是我在工作上遇到的實際狀況,但這不代表只有我自己一個人認為深入了解Business Problem是最優先的步驟。舉例來說,CRISP-DM這個Data Mining流程模式在1990年代誕生的時候,第一個步驟就是Business Understanding:
This initial phase focuses on understanding the project objectives and requirements from a business perspective, then converting this knowledge into a data mining problem definition and a preliminary plan designed to achieve the objectives.
到了2012年,Jean Paul Isson和Jesse S. Harriott寫的《Win With Advanced Business Analytics》這本書,也是把Business Challenges放在他們提出的BASP(Business Analytics Sucess Pillars)架構的第一位:
... a crucial step of any business analytics implementation requires clear understanding of organizational objectives, or "business challenges," to ensure that any solution is aligned with, and addresses, the company's biggest or most pressing needs.
那麼為什麼人們還是常常輕忽了這個重要的步驟,直接就討論要建置什麼模型呢?我觀察到一個現象,也許跟這種狀況有關。

2013年3月30日 星期六

笨蛋,問題在問題! Part 2

我自己親身經歷過幾個案例,讓我歸納出所謂「不知道問題是什麼」其實可以從想做分析的企業(Client)和提供分析服務的廠商(Vendor)這兩種角度來看。企業會想要請外面的廠商提供Analytics的服務,通常就是因為本身對Analytics不是非常了解或是內部沒有專精這方面的人才,也往往因為不了解,所以誤以為Analytics服務跟套裝軟體一樣,只要買進來就可以直接套用。尤其是在台灣提供分析服務的廠商大部分本身也是資訊軟體廠商,更可能讓企業加深了這樣的誤解。

也由於台灣的分析服務廠商多半是資訊業者,旗下的顧問不見得每個都在Client的產業待過,雖然具有高深的統計分析能力,卻不一定了解這些產業在行銷或業務上的實際問題。所以Client的運氣有點重要,如果遇到缺乏產業經驗的顧問,往往就只是提供制式的模型建議,沒有辦法引導Client提出問題,當然就很難針對這些問題提出量身訂製的解決方式。

2013年3月24日 星期日

笨蛋,問題在問題! Part 1

先澄清:我無意罵誰笨蛋,只是套用美國前總統柯林頓當年的競選口號「The economy, stupid!」。這個口號後來被他的競選策士James Carville改為「It's the economy, stupid!」,翻譯後就變成「笨蛋,問題在經濟!」

用英文來說,我這一篇的標題應該叫「It's the business problem, stupid!」。我要說的重點是,不管你把資料分析工作稱作Data Mining、還是最近比較流行的Business Analytics或Customer Analytics,第一個步驟永遠是去了解公司藉此想要解決的業務問題是什麼,而不是先討論建什麼模型!

2013年2月2日 星期六

零售經濟學(二)

我在「零售經濟學(一)」裡提到了Tim Hartford寫的《Undercover Economist 》,它的中譯版在作者簡介裡提到這本書「與《蘋果橘子經濟學》雙雙被視為近年來最重要的財經著作」。(2006年,我在誠品用台幣280元的低價買到了《蘋果橘子經濟學》的原作《Freakonomist 》,所以不知道中文版翻得如何。但是這本書真的挺有趣的,如果你對於利用資料分析來推論現實生活中的現象有興趣,不妨買一本來看看。)

如果我沒記錯,《Freakonomist》的很多結論是作者透過分析大量、長期的實際資料所得到的。相較之下,《Undercover Economist》偏向利用經濟的理論來說明我們看到的一些現象。對我來說,資料呈現的分析結果比較有說服力,所以難免會懷疑Tim Hartford的理論是否「正確」。

例如他提到認同有機食品的顧客可能比較不在意價格,因此有些超級市場會把有機食品跟一般食品的價差訂得遠高於兩者在成本上的差異,也就是用了這種稱為Self-targeting的方式讓客人「自投羅網」。但是Hartford的理論到底是否為真?也許可以利用賣場的資料庫,把常買有機食品的顧客跟其他顧客區隔開來,分析他們在購買其他商品上的行為,否則他們有可能只是一群崇尚自然有機、卻不得不接受高訂價的消費「受害」者。

農曆新年過後,我就會身兼二職,除了繼續為現在的保險業客戶服務,也開始會協助一家知名連鎖賣場的顧客分析工作,希望可以在那邊驗證一下Hartford的理論。

2013年1月24日 星期四

零售經濟學(一)

偶然翻到好幾年前買的舊書《誰賺走了你的咖啡錢》(英文版原名為Undercover Economist),看到第二章的標題「超市不想讓你知道的秘密」,因為過年後就要去接一個零售業的案子,所以就再讀了起來。

但我很快就回想起之前為什麼沒有把這本書看完(書籤還夾在書的中間):真的很難懂!雖然封底上的介紹文字說《經濟學人》和《芝加哥太陽報》都稱讚這是一本不錯的經濟入門書,我對第二章反覆出現的「價格鎖定」卻百思不得其解。想到多年前也看不懂類似的《反常識經濟學》(英文原名很聳動:More Sex Is Safer Sex)時,一氣之下買了原文版來看,才發現中文版的翻譯真是%#@X*,所以這次我也決定弄原文版的Undercover Economist來看。

果其不然,英文版還是比較容易看懂。原來「價格鎖定」並不是我想像的把價格固定住的意思(你是不是跟我想的一樣?),而是「Price-targeting」的翻譯。根據前後文的關係和我對行銷的理解,應該是指「利用價格來瞄準目標顧客」的作法。反覆對照中譯本和原文版後,儘管我不認為它像《反常識經濟學》翻的那麼糟,還是有很大的改善空間。例如在提到經濟學所謂的「效率」時,《誰賺走了你的咖啡錢》的文字是:

2013年1月12日 星期六

遠見乎?短視乎?

《天下雜誌》在去年4月中出刊的495期做了一個Big Data的特別企劃,性質相似的《遠見雜誌》也在今年開年的319期推出了同樣主題的特別企劃。比起《天下雜誌》來,《遠見》這次的份量更多,內容也略勝一籌。

儘管我認為Big Data現在仍處在hype的階段,我還是非常樂見國內的雜誌願意用這麼多篇幅介紹這個2012年突然變夯的名詞(畢竟這可能關係到我未來的飯碗啊!)。由於這次《遠見》刊出的內容很多,我也還沒全都看完,所以在此我只提出一點點看法。

特別企劃的第一篇文章就提到趨勢科技董事長張明正先生,而且引用他的話說「先有了雲端,才有大數據」。雲端這個名詞確實比大數據(Big Data)這個名詞早出現,但大數據這個東西其實早就有了,兩者也沒有因果關係。不過我們不是在研究Big Data的歷史,就尊重張董事長的意見。我真正有意見的,是他的以下看法:

2013年1月6日 星期日

是聰明還是笨?

最近台電員工為了爭取年終福利,不惜揚言「讓台灣變黑暗」,台灣電力工會並在記者會中指出,政府要台電推動的智慧型電網政策估計花費新台幣1390億元是個「錢坑法案」

我非電力專家,無法評論台電工會所言是否正確。不過所謂的智慧型電網(Smart Grid)因為是Big Data的潛在應用之一,所以符合這個部落格的主題。首先我要引用經濟部在「智慧電網推動小組」第一次會議對媒體發佈的訊息,全文請見中央通訊社網站
經濟部表示,智慧電網是透過資訊、通信與自動化科技,建置具智慧化發電、輸電、配電及用戶整合性電力網路。......藉由上述示範計畫,台電預計明、後年規劃不同套時間電價制度(即尖、離峰用電有價差),將鎖定智慧電表用戶進行試驗,由用戶選擇使用哪套時間電價,希望能在2015年先建立1套家戶時間電價制度。......時間電價是否落實可能會影響智慧電表推動速度,需先建立使用時間電價的誘因,一旦用戶覺得有利時才會選擇。......當尖、離峰價差越大,時間電價效果越顯著,預計未來兩者價差約2至3倍。