2013年11月26日 星期二

Data Art

前兩天在一個部落格看到 Data Artist 這個名詞,作者把 Data Artist 描述成運用資料和分析工具作為顏料和畫筆的藝術家,這樣的比喻著實讓我眼睛一亮,但是有沒有比較明確的定義呢?這篇文章說:
A data artist is responsible for delivering fresh insights from data to help an organization meet its goals. This is the person who takes the output from decision-support systems and turns it into consumable theories, postulates and hypotheses that can be tested and applied to the business.
跟前面那個譬喻比起來,這段定義的文字反而有點 anticlimax ,因為這不就跟 Data Scientist 沒什麼兩樣了嗎? Google 一下就可以發現 IBM 對 Data Scientist 的描述跟上面差不多:
What sets the data scientist apart is strong business acumen, coupled with the ability to communicate findings to both business and IT leaders in a way that can influence how an organization approaches a business challenge. 
所以上面提到的 Data Artist 看來只是作者自己發明的新名詞,並非一個新的 profession。(失望中)

我在兩年前寫的《Are You a Data Scientist?》敘述了 Data Scientist 必備的一些技能,除了 Data Munging 、 Data Modeling 這兩項傳統上認為是比較偏向 Science ,另一項 Data Visualization 就顯得「軟性」些,應該可以算是 Art 了吧。只是當時我對此似懂非懂,沒有一套理論。最近入手一本《Show Me the Numbers: Designing Tables and Graphs to Enlighten, Second Edition》(Stephen Few, Analytics Press, 2012),驚為天人,原來不是會用 Microsoft Excel 就代表會製作圖表。

隨著版本的更新,Excel的圖表功能越來越「炫」(我們公司的電腦已經換到Office 2013了)。然而這些很炫的功能卻往往讓使用者更注意圖表的美觀,反而忽視了製作圖表的原意:
"to provide the reader with important, meaningful, and useful insight"
即使是大家常用的圓餅圖、堆疊圖、3D長條圖,在Stephen Few的眼中來看,都是沒有必要的花俏。不過他並不是主觀的認為這些類型的圖表不當,而是透過生理和演化的科學觀點,說明如何運用一些要素,讓圖表有效的說出資料背後的故事,而不是教讀者如何美化圖表。

這本書的印刷相當精美,乍看之下不像是給 Data Scientist 看的,而比較像是 Data Artist 要用到的書(可惜 Data Artist 就是 Data Scientist)。儘管我認為每一位在工作上要經常製作圖表的人都應該要看這本書,45大洋這個訂價大概就讓不少人望之卻步吧(我花了台幣一千二在 Amazon.com 買到,含運費)。因為我在這方面也仍在學習,所以不在這裡就此高談闊論,有興趣的人還是直接看書比較好。幸虧 Stephen Few 過去演講的材料可以在網路上找到,所以不想花大錢買這本書的人還是可以下載來看看

