Posts

Showing posts from 2009

[詩戀] 成為詩人之偶然

偶然翻到兩個月前的聯副電子報,覺得孟樊寫的這篇如歌的行板 --戲擬瘂弦很有意思,遂抄錄於後:

偶然之粗暴
偶然之否定
偶然一口維士比和一小株梅花
正正經經在家看飯島愛作愛之偶然
以及村上春樹並非爵士此一認識之偶然
選戰,垃圾、大聲公,記者與SNG之偶然
戒嚴之偶然
打高爾夫之偶然
騎單車撞死之偶然
每天跑銀行之三點半吃沙西米

風一般吹起來的模仿秀之偶然。打開天窗說亮話
之偶然。雞尾酒療法之偶然。暗殺之偶然。陳水扁之偶然
戴艾瑪仕穿LV之偶然。寶璣錶之偶然
五克拉裸鑽暗藏之偶然
誠品、MP3、泡馬子之偶然
宅男腐女懶洋洋之偶然

而既被目為一座寶島總得繼續挺立下去的
世界老這樣總這樣:──
老母雞在海峽的對岸
小地瓜在地瓜的田裡

[Video] Santa Claus Is Coming To Town

當電腦當機時...

Image

Worst Day?

Image
I can't help but .....



via Tumblr

Live for Today

Image

明日的 OS?

今日凌晨(台北時間),整個資訊業界最關注的議題,便是 Chrome OS 的發表會,這樣的盛會,當然是大大小小的新、舊媒體追蹤關注的報導題材,今晨起床,打開 Google Reader ,鋪天蓋地迎面而來的都是 Chrome OS 的評論與報導。我快速的瀏覽了這些文章的內容,覺得有幾篇對看熱鬧等級的鄉民比較有幫助,但這裡面我覺得還是石墨工房傅大的深情報導看了最有感覺:。

明天的作業系統:Chrome OS (石墨工房)First Glimpse at Google Chrome OS (Lifehacker)Google Chrome OS: 5 Ways It’s Completely Different (Mashable)全球主流博客对 Chrome OS 的看法 (谷奧 @guao)Chrome OS 终于露出真容,我们有了答案了吗?
下面的影片是發表會中場休息時放的 Chrome OS 概念影片

心情!

Image

這這這,教我怎麼工作?

Comment Parler Des Livres Que l'on n'a Pas lus?

Image

My Favorite Part of the Day

Image

Blog to Express

Image
image source loveyourchaos

Vint Cerf in #IL2009 opening keynote

Vint Cerf , the man who is most called as father of the Internet, interviewed by Paul Holdengraber in Internet Librarian 2009 opening keynote.

Hey Jude

Image

Bourbaki Archives

Ars Mathematica 知道 Bourbaki Archive 的消息,一時頗為感慨,“誤入塵網中”的我,早以把大學時代唸的東西還給天地了,但是聽到這個消息還是很高興。

Via Peter Woit I see that there is a project to put the archives of Bourbaki online. These are the internal manuscripts that the group generated while writing their famous series of books.
Bourbabi 是誰?1950年前後,一群法國數學家決定以集合論為基礎,用純演繹的方式,重寫整套數學,他們用共同的筆名 N. Bourbaki發表著作。他們的著作從最抽象的數學體系談起,然後才逐漸待殊化,這 種由廣入狹的次序,把數學組織得既簡潔又亮麗,所以數學家們對此頗為欣賞。這群數學家每年夏天,聚集在一個避暑勝地,每天上午討論怎樣寫書,下午開數學講論會 (colloquium)。 在上午的寫書討論中,必須一致通過才算定稿,完成的著作共有數十冊。

在學術界大受好評之後,這群數學家表示想為中小學寫數學教科書,當時的法國政府表示非常歡迎,美國數學界受了 Bourbaki 這一舉動刺激(其實更多人認為是受了俄國的 Sputnik 衛星事件的刺激),由 Edward G. Begle 所領導的 School Mathematics Study Group( SMSG 中小學數學研究組) 也開發了一套數學教科書,這就是所謂的新數學。但是 Bourbaki 的中小學教科書計劃並沒有如預期獲得成功,而邯鄲學步的新數學,更被美國教育界視為一場災難。事實上,數學家所能欣賞的和企業界所需要的數學有一段距離,和中小學生所能研讀的有更大的一段距離,這場失敗不算意外。

雖然中小學教科書的嘗試不若他們在學術界的嘗試那麼成功,不過他們的主張對學術界的影響是深遠的,他們寫書的方式,更是數學界學子代代相傳的傳奇。


(以上說明改寫自王九逵教授發表於科學月刊第三十一卷第三期的集合論與數學教育 )

Francisco Martin #RecSys09 Industry Keynote Summary

推薦系統界的年度盛事之一 ACM Recommender System 2009 剛剛落幕(October 22-25),Strands 的創辦人 Francisco J Martin 在會中以業界人士身份受邀發表的演說 (Industry Ketnote) : Top 10 Lessons Learned Developing, Deploying, and Operating Real-World Recommender Systems 中有許多值得大家思考的內容,Neal Lathia(MobBlog) 將 Martin 博士的演說,以推特(Twitter)筆法,整理成十則簡明的摘要:
Lesson 1 – Make sure a recommender is really needed! Do you have lots of recommendable items? Many diverse customers?… also think Return-on-Investment… a more sophisticated recommender may not deliver a better ROI.
Lesson 2 – Make sure the recommendations make strategic sense. Is the best recommendation for the customer also the best for the business? What is the difference between a good and useful recommendation? Good recommendations .vs. useful recs; Obvious recommendations may not be useful; risky recs may deliver better long-term value (所有系統都是為企業需求而生,切記切記)
Lesson 3 - Choose the right partner! Select the right rec vendor vs hire some #recsys09 students. If you are a big company the best y…

#RecSys09 話題: what's on recommender researchers' mind?

Image
這幾天推薦系統界的年度盛事之一 ACM Recommender System 2009 正在美國紐約市舉行, 會後必然會有許多學養俱佳的學者和產業分析師和大家分享見聞以及會中眾人關注的話題,想儘快知道 what's up; what's hot 的讀者可以在推特上關注 #RecSys09 這個 hashtag

如果想更快知道究竟今年有哪些熱門話題,就來看看在 University College Dublin 教書的 Barry Smyth 為大家製作的標籤雲,看起來 Netflix 還是大熱門的 buzzword 啊!


Why I Am Such an Infrequent Blogger?

前幾天,Resys 的推動主力網友 @clickstone 兄抱怨小弟不夠勤快,總以 DailyMurmur 打發讀者,實在是冤枉啊,小弟不才不知如何自辯,借 Helen DeWit 宏文說明 Why I Am Such an Infrequent Blogger ,不知 clickstone 兄是否滿意?

“My assumption, always, is that everyone knows everything I know AND MORE. Rephrase. Everyone who is interested in the kinds of thing that interest me knows everything I know AND MORE. If they're not interested they don't know but don't want to. So there's no point in mentioning things that strike me as interesting, unless a) these are events in the last, say, 5 minutes (so those disposed to be interested might not be au fait or b) I'm up for proselytizing (those not disposed to be interested might be with enough encouragement).”
補充:
@clickstone 兄的博客 Beyond Search 非常精彩,對網路產業訊息、推薦系統理論實務有興趣的讀者萬勿錯過,近日 Beyond Search 因“不明”技術原因無法連線,大家可以到豆瓣的鏡像(mirror)閱讀谷兄大作。

你會放棄嗎?

Image
這是人性的試煉,你會怎麼做?

via FRKNCNGZ.BLOG

The Wheels of Life: From Cradle to ...

Image
今日在網路上看到一個標題叫 “The Wheels of Life”的圖片,覺得很有趣,搜尋之後才知道,這張圖在網路已經流傳很久了,我真是後知後覺。

Wheel of life » Vijay For Victory via kwout

後來有人修改了這張圖,變成 A Cyclist's Wheels of Life , 在大眾瘋鐵馬的今日看來,貼切的很。

Beyond TrailCentral: Wheels of life... via kwout

我想研究水滸傳

Image

What the heck?

Image
已經有許多人質疑有沒有為什麼英國人專門作古怪研究的八卦,其實說來簡單,懶惰的媒體為了填補版面,這樣的研究就不會絕跡。只是周五(2009/10/2)聯合報這則《男叫Lee 女名Kelly 上床進度快》就實在是無厘頭至極,究竟這是什麼時候的研究?2007 or 2009 ?

如果你看了新聞想要改名,鄙人勸您還是別費事兒了。(Disclaimer: 鄙人的名字不在十大迷人排行榜之內)

關於 user-based 和 item-based 算法的思考

半夜被地震閙醒,起床上網瞎晃,看到十一假期間xlvector兄仍然勤奮不輟思考 user-based 和 item-based 演算法對於輸出多様化的比較,大為佩服,特記錄于後:(此刻鄙人凖備爬上床睡回龍覺)前一段时间和wendong聊天,他提到userbased算法的结果多样性不如itembased算法。对此,我觉得有几个问题1) 我们知道所谓多样性,是指推荐结果两两都不怎么相似,从而不同的相似度度量其实产生不同的多样性度量。2)常用的相似度有两种,一种是基于content的,一种是基于collaborative filtering的,那么根据我的实验,在这两种相似度的度量下,userbased的结果多样性都好于itembased的算法3)但我觉得还是存在一种相似度,而这个相似度对应的多样性在item-based的方法下比较好不知道大家对这个问题怎么看,在实际系统中userbased和itembased谁能产生多样的结果?Share and Enjoy: Related posts:my solutions of github contest – item based KNNAn improved item-based KNN predictorRecommendation Systems: An Interview with Satnam Alag到目前为止的进度 via xlvector.cn

後記:
請參閱鄭昀今日的《基于Google Reader发展起来的个性化推荐系统之三大问题》,這纔是專業手筆。

Posted via web from imrchen's posterous

關於 Noise 的隨想與牢騷

Image
看到推特(twitter.com)裡一段關於推薦系統的對話很有意思,所以順著這個思路「胡思亂想」了一下,於是順手寫下這些發散的不成系統又有些矛盾的東西:

首先,做系統的人始終要面對一個嚴峻課題,消費者做任何舉動都不需要向系統解釋他(她)的意圖,所以系統從數據裡找出的推論模型,只能有限度的猜測他(她)的下一個行動。人是會變的,許多論文裡總是提到消費者可能因為年齡(人生進入不同階段)而改變喜好的例子,日常生活裡我們也常看到因為消費者因為送禮(比如親戚朋友生日)而改變平常消費習慣的情形,至於因為有新的興趣或業務需求,消費內容與歷史紀錄大相逕庭更是司空見慣的事情。像這樣的消費方式,要怎樣才算(或不算)是噪訊(noise)呢?系統又從何判斷那些數據應該重視,那些應該忽略?
還有我們也常聽說把帳號借給朋友使用的情形,系統要怎樣才能判斷出如此 diversified 的消費習慣不是消費者人格分裂使然? (至於所謂 diversity ,則是推薦系統主動推薦與平日消費習慣不同的品項,期望能造成意外之喜,則是另外一個課題了!)
當然若某種消費內容逐漸增多,演算法必然會有所反應,逐漸調整模型。這應是 @hendgm 所說,若次數多了就不再是噪訊的道理吧。
這篇純粹是灌水的牢騷文,請讀者諸君萬莫深究。

Where do people show their true feelings?

Image
沒有交代數據來源和研究方法的一張圖,不知道是那位大神的大作,人們在網際網路上比在教堂告解時更易真情流露?有點意外,似乎又蠻合理的結果,或許真情流露的前提是「匿名」吧?其實,我覺得製作這張圖的工具 - Graph Jam Build更有意思,有時間應該來玩玩。 via graphjam.com Posted via web from imrchen's posterous

女兒送的生日卡

Image

How-To: Program a person

Image
這張圖片是一篇教小朋友寫程式的文章的插圖,我不確定文章作者想的這套是否管用,不過這張插圖寓意甚深,值得好好玩味啊! via blog.makezine.com Posted via web from imrchen's posterous

What kind of geek are you?

Image

Crazy of War

Image

Yesterday

Image

[詩戀] 詩的瑪尼亞石堆

Image

SNS 是教師的幫手嗎?

一份由FacultyFocus 所做的調查報告中說,接受調查的1,900大學教授約有半數從來沒用過 Twitter,這些不使用 Twitter 的受訪者表示他們認為這個社群工具對於他們的教育工作沒有幫助。少部份目前沒有使用推特的受訪者,說有一半的機會,他們會試著把推特當作一個學習工具。The Chronicle 在報導這個問題的時候,問讀者中的教育工作者,有多少人和學生間使用推特溝通?從 FacultyFocus 的調查看來,已經這麼做的師生應該是少數,而推特 140 個字元的限制(或說特色),使得教育工作者對於溝通的成效不是那麼放心。筆者好奇的是,不管是那一種型態的社群網路,當師生同在一個 SNS 裡,而且 connected 的情況下,究竟對於授課、解惑的互動,究竟會產生怎樣的影響?已經有不少教育工作者,使用 blog 和 wiki 來輔助教學,社群網路服務對於教育從業人員有什麼幫助呢? 不同的社群網路服務有其不同的特色, Twitter 以訊息的傳播與複製見長,Facebook 則從人脈網路的連結出發,不同的連結方式,會有什麼影響?As a teaching tool, PowerPoint can be awful. Is Twitter any better? One promotes passivity; the other, connectedness and interactivity (unless you follow people like us, who are about as responsive as a dining room table). The Chronicle of Higher Education raises an interesting question: should professors be tweeting with their students? Or is it a poor substitute for face-to-face interaction? Of course, some say brevity is the soul of wit, and 140 characters is very, very brief. — via freakonomics.blogs.nytimes.com Pos…

心情

Image

The Evolution of Retweeting

Twitter 在本質上是個發佈與訂閱(publish and subscribe)模式的訊息傳播渠道與社群,隨著社群的擴大與用戶的互相影響與學習,傳播的方式與影響益發豐富多彩,ReTweet 就是一個非常有趣的題目。
若對 Rwtweet 這個現象有興趣,Technology Review 的這篇 The Evolution of Retweeting 是個很好的起點,Dan Zarrella 做了許多和 ReTweet 現象有關的有趣分析,也值得看看(花了許久時間寫的東西在存檔時竟然格式和資料都掉了,大為掃興,所以草草寫幾句,重新發過,剛剛丟掉的東就算了,唉)。

Twitter has incorporated other user-generated linguistic tools, such as using a hash symbol in front of a word to make it easily searchable (like "#conference09").Another common technique is typing @ in front of a username to reply directly (but publically) to the user, which Twitter also formalized after users adopted it. These linguistic tools have even trickled into other social media environments, including YouTube, Flickr, Facebook, and blogs. ......Currently, there is no set format for retweeting, which loosely consists of reposting someone's tweet and giving due credit. ............. But the retweeting format is much more inconsistent and complex than the targeted reply and hashtag con…

豆辦解決圖書版本問題的方法

不論是實體的零售店面,或是電子商務網站,都會遇到一個很複雜也很惱人的產品管理問題:item authority。

這個現象解釋起來很簡單,很多產品有不同的包裝版本(想像一下書籍的普及版、精裝本、典藏版, 等等),甚至同樣的版本,也可能在資料庫裡有兩筆以上資料(仍然以書籍做例子,想像一下同一本書的一刷、二刷),我們如何知道這些不同的商品其實都是同一個產品?Greg Linden 也曾經以 YouTube 為例,撰文 YouTube cries out for item authority 說明 item authority問題對服務提供者造成的困擾以及挑戰。

這對推薦系統的設計者,是個很「有趣」,也很艱鉅的挑戰!海峽兩岸間最大的書籍收藏網站-豆辦,當然也遇到這個問題,豆辦日誌昨日(2009/08/24)宣佈《豆瓣读书即将解决版本问题》,他們的解決方案,可以稱為用戶「自己動手,豐衣足食」吧:
豆瓣图书会将同一作品的不同版本归纳起来,展示在一个单独页面里。这个页面可以由书虫们来添加和编辑。如果你确切地知道06年上海译文出版社的《在路上》是01年漓江出版社的《在路上》的另一个版本,你可以添加;如果发现某个版本是指鹿为马,你可以报错。贡献者的信息会在版本页面被永久标记。

随着豆瓣数据库里的版本数据的完善,豆瓣猜的智商也将大大提高,再也不会推荐同一作品不同版本的书给你了;有些已经绝版不再出售的图书页面(比如 86年版的《傲慢与偏见》),会有最近新版的价格帮助购买(比如06年的《傲慢与偏见》有售);对于多达十几种版本的图书,版本页面还会显示各自的收藏人数和评分,帮助大家比较版本的好坏。

前路茫茫,點根蠟燭...

Image

推薦系統不是只能賣書

網友 xlvector (他是 Netflix Prize 中達成 10% 的兩個團隊之一 Ensemble 成員) 在 Resys 討論群組 提到一篇微軟研究院發表的研究報告 DebugAdvisor: A Recommender System for Debug,這篇報告的主題是如何使用推薦系統技術幫助程式設計師執行除錯工作,DebugAdviser 則是他們的成果。

因為我找到的 PDF 連結是壞的,還沒有機會看到全文,所以只能從摘要想像大概。不過,這的確是個有趣的想法,推薦系統不僅在 attention economy 大環境裡協助企業主攫取客戶注意力,還能協助程式設計師更好的完成他的工作(assignment),看來 "We're limited only by our imagination" 這句話真是一點都沒錯。

DebugAdvisor: A Recommender System for Debugging
In large software development projects, when a programmer is assigned a bug to fix, she typically spends a lot of time searching (in an ad-hoc manner) for instances from the past where similar bugs have been debugged, analyzed and resolved. Systematic search tools that allow the programmer to express the context of the current bug, and search through diverse data repositories associated with large projects can greatly improve the productivity of debugging. This paper presents the design, implementation and experience from such a search tool called DebugAdvisor. …

Er....Netflix Prize goes to...?

Image
上個月這個時候,Netflix Prize 主辦單位宣佈餐賽團隊 BellKor's Pragmatic Chaos 提出的演算法比Cinematch 改進百分之十,是第一個跨過門檻的隊伍,其他參賽者有最後30天的時間爭取最後的奪冠機會(In accord with the Rules, teams have thirty (30) days, until July 26, 2009 18:42:37 UTC, to make submissions that will be considered for this Prize. )。

原本以為最終結果應該是 BPC 的囊中物,應該不會有什麼懸念,但就在時間截止之前,另外一個隊伍 Ensemble宣稱他們也跨過門檻(Breaking - Netflix Prize, we’ve got a winner, and it’s Greek! (updated)),甚至一度自行宣佈他們勝過原本的領先者,是最終的贏家(下圖是目前Leaderboard公佈的成績)。不過,一位自稱 An Insider 的網友在這篇文章之後留言,解釋他們可能誤解了規則,BPC 在 Test Set 的成績較優,才是最終的贏家(自稱 Just a guy in garage 的 Gavin Potter 很快的在個人部落格撰文解釋為什麼 BPC 才是贏家)。

Netflix Prize Leaderboardvia kwout

到目前為止, Netflix 仍然沒有正式宣佈誰是最後的贏家,只是宣佈停止收件,並且說有兩個隊伍通過門檻。
As of July 26, 2009 18:42:37 UTC, we have stopped gathering submissions for the Netflix Prize contest. There are submissions from two teams that meet the minimum requirements for the Grand Prize. We are contacting the lead team and we will report, as soon as possible, when and if we have a verified winner fo…

微博版沐心泉遊記 - Day 1

昨天帶家裡的女性同胞到台灣中部賞花、飽食、閒逛、思考(這是往自己臉上貼金的說法,不是說人類一思考,上帝就發笑嗎?),回來的路上,邊回憶兩日點滴,突然有個想法:

試著用近日流行的微博(microblogging)體寫下兩日所感所思,打個比方講,如果昨日我帶著能上網的手機,沿路發推(twitter,其實 plurk, jaiku, facebook 都可以,看你喜歡什麼,反正這只是想像),追蹤訂閱(subscribe)我的資料串流的讀者,看到的大約就是下面的東西吧。我沒有檢查是不是每一則都少於 140 個字元,我想應該不會差太多。


09:10 [出發]
家裡的大小美女昨夜太興奮,早上爬不起來,反而是昨夜小酌一杯的我最早起床,呼喚大家起床梳洗,把行李搬上車,去小七買杯 City Cafe 的熱拿鐵,然後開車上中山高速公路,一路向南,出發!!

10:10 [GPS]
老婆向同事借了一台 GPS 導航機子,但是這台機器表現讓人大失所望,在之後的兩天裡,不僅只有三次定位成功,定位成功後,冰冷的機器聲吐出的路徑建議,竟然是不存在的路名,全車乘客一致通過,把這台機器當作笑話。

11:30 [懷舊午餐]
下了交流道,準備用餐,老婆大人早已在網路上選定位在忠明南路上的三嘴滷,餐點是典型的台式小吃,價格不貴,口味亦佳;裝潢採懷舊風,用餐桌椅係舊日小學用的課桌椅,店裏面陳列了裁縫車、老唱片等等懷舊物件,最令我印象深刻的是洗手間入口前擺的一台良伴50

11:40 [佐餐的懷舊歌曲]
三嘴滷店內放的音樂都是 40 年前民歌時期當紅的歌曲,葉佳修銀霞潘安邦蔡琴...,我們夫婦兩興高采烈的向兩個女兒介紹這些歌有多紅,『這首歌把拔國中的時候很紅喔』,『這首歌的歌詞我會背』,換來的是女兒的冷眼...

13:00 [縣道 129]
因為 GPS 不管用,只好翻出地圖,找出從台中南區接上縣道 129新社鄉的路線, 於是一邊看著曖昧不明的路標,一邊對照著地圖上模糊不清的字跡,一路上且暫(停)且走,終於走過中興嶺,找到今日行程的第一個目標:白冷圳

15:34 [沈默的白冷圳]
據我們請教附近店家,因為缺乏管理,水管旁的階梯不能攀爬,只有事先申請的戶外教學,才能取得鑰匙,我們姑且聽之,看了兩眼往山頂去的水管,就轉進旁邊安妮公主花園,準備喝個下午茶,

15:50 [花園裡的草泥馬]
網路上安妮公主花園以的知名度不小,簡單的說,是…

[詩戀] 父親的草原母親的歌 - 從歌聲裡尋找蒙古

父親的草原母親的歌席慕蓉女士在專注於她的蒙古尋根志業後的詩作,去年此時初睹這首詩,就抄錄在[詩戀]單元裡。蒙古籍作曲家烏蘭托嘎把這首詩配上曲,但那時候只找到線上 MP3 (audio only),最近在 Youtube 上發現歌手騰格爾和布仁巴雅爾演唱,兩人的詮釋完全不同,但是一樣好聽。

有位網友在Youtube 上的評論區這麼評價兩位的詮釋:『腾格尔的故乡在伊克昭盟鄂托克旗,这里由于沙漠侵蚀,大部分已经沙化,草原几乎成了过去。腾格尔的歌粗旷伤感,是对已故草原的眷 恋以及对草原沙化的无奈。布仁的家乡在呼伦贝尔,这里水草丰满, 森林茂密,牧人过着悠闲的放牧生活,布仁的歌声中透露的则是对家乡美丽大自然的无限憧憬和遐想。 』

不過,不管別人怎麼說,只有自己的感覺才是真的,請親自感受這兩位藝術家的演出吧!!


騰格爾的演唱


布仁巴雅爾的演唱

[詩戀] Lose a bloody man?

英國女詩人 Wendy Cope (1945 - ) 在 1986 年發表一首小詩:LOSS,短短四句,有人以為是情人離去後借酒澆愁,也有人以為是暗喻情慾之思,見仁見智唯有讀者自知其中味。
The day he moved out was terrible
That evening she went through hell
His absence wasn't a problem
But the corkscrew had gone as wellWendy Cope 的詩很有生活味,還有一首 Bloody Man 談男女情事也很有意思:
Bloody men are like bloody buses---
You wait for about a year
And as soon as one approaches your stop
Two or three others appear.

You look at them flashing their indicators,
Offering you a ride.
You're trying to read the destinations,
You haven't much time to decide.

If you make a mistake, there is no turning back.
Jump off, and you'll stand there and gaze
While the cars and the taxis and lorries go by
And the minutes, the hours, the days

細節是魔鬼還是機會

Image
搜尋產業專家Danny Sullivan 在Michael Jackson 驟逝之後,細心觀察網際網路的動態以及重要的搜尋引擎在面對這個事件的表現,發現 Google 曾經犯了一個很離譜的錯誤,搜尋 michael jackson dead ,竟然會得到 MJ 死於 2007 享年65 歲的結果 (這個發現又得歸功於於無處不在的推友)。

Google Thinks Michael Jackson Died At Age 65 In 2007 via kwout
這個錯誤當然很快就被發現而且更正了,Danny Sullivan 解釋發生這錯誤顯然是因為谷歌在使用 Wikipedia 資料時,錯用了另外一位 Michael Jackson 的資料。Matthew Hurst 認為這是一個典型的在執行細節上失誤的範例,並且仔細的分析執行文字探勘(text mining)工作時每一個步驟的細節,還語重心長的說 Attention to detail will always be a killer feature!

The Long Tail of Text Mining via kwout 最後,筆者忍不住要加上一段有點 cynical 的按語:身為微軟員工的 Matthew Hurst 在分析谷歌這次失誤的時候,是怎樣的心情咧!?

Daily Murmur 2009/06/28

Image