Sunday, December 16, 2007

年終檢討: Data mining doesn't cure stupidity

Chris Anderson 在「長尾(The Long Tail)」這本書的導論裡,開宗明義直指長安地說- the tracking of top-seller lists is a national obsession,又說 hits have become the lens through which we observe our own culture

這幾句話,確實把今日消費導向的大眾文化詮釋的相當精準,不論眾人對於長尾的評價與(再)詮釋如何,追求 List and Ranking 確實是我們所處社會的普遍現象。尤其到了年底,出自各個產業、各式媒體,花樣繁雜的各式排行、檢討紛紛出爐,完全是眼花撩亂,目不暇接。當資料氾濫,多到令人眼疼,不禁讓人懷疑,連年終檢討這件事,也有 blockbuster 和「小尾巴」之分。

所幸 Gary Price 領軍的 Resource Shelf 將各媒體做的年終檢討,統統打包在一篇 Year End Wrap-Ups 裡,讓追求趨勢的讀者可以做到 (當然是 nearly 啦)one stop shopping 。

這個名單裡有時代雜誌(Time Magazine)評比的各項「最佳十大」,還有告示牌(Billboard)的各種音樂排行榜,也有尼爾森(Nielson)對 2007 年各項趨勢做的年終報告,當然也少不了 Google 的 2007 搜尋趨勢,名單不短,有興趣的人不妨到 Resource Shelf 自己感受一下。

看了大環境的趨勢動態,接著看看轟轟烈烈的江湖風雲中,各自領一方風騷的言論領袖們的真知灼言。另外一個有名的新聞聚合網站 Mashable 整理了今年科技界的最佳發言(Best Technology Quote of 2007),說明詳盡有趣,比起 ResouceShelf 乾巴巴的條列式清單,可讀性高很多。

Mashable 眾編輯,認為今年度最精彩的發言,是 Steve Ballmer (微軟的 CEO)對於社群網路( social network) 的評論,在公開批評 social network 無非是青少年中的短暫流行(fad)後不到一個月,微軟投資 Facebook 兩億四千萬美金。

看完意見領袖們的發言,百花齊放的 Blogshpere 更該給予更多的關注,但是最佳文章的遴選,實在是不可能的任務。全球七千萬個部落格,一年中產出的文章數量實在太多,沒有人能夠盡讀,不管個人 Google Reader 裡的分享項目再多,也沒法子把 2007 年的 Blogosphere 的多采多姿描繪於萬一。

愚者千慮,個人認為,今年度最有意義文章,首選應是 Data Strategy Data Mining doesn't cure stupidity,這篇文章不長,第一段就簡要地闡明腦筋清楚比技術更重要的真諦:
Data mining, when done correctly, can improve understanding and provide insight, but data mining just doesn’t work under stupid assumptions. Check out the following paragraph in a Wall Street Journal blog. Apparently some FBI agents assume hummus sales to be predictive of terrorist activity.
這段文字裡的 Data mining 換成任何名詞,都說得通,不管排行榜再多,檢討再繁,腦袋清楚才是最重要的。時值歲末,展望來年,這才是最要緊的心得,切記,切記。

1 comment:

  1. but data mining just doesn’t work under stupid assumptions.

    這一句實在讓人拍手叫好! 而且data mining顯然換成其他的字眼也行得通.

    "腦袋清楚才是最重要的", 感謝大哥再次提醒!

    ReplyDelete

如果我的心是一朵蓮花

~ 林徽因 · 馬雁散文集 · 蓮燈 ~ 馬雁 在她的散文《高貴一種,有詩為證》裡,提到「十多年前,還不知道林女士的八卦及成就前,在期刊上讀到別人引用的《蓮燈》」 覺得非常喜歡,比之卞之琳、徐志摩,別說是毫不遜色,簡直是勝出一籌。前面的韻腳和平仄的處理顯然高於戴...