Posts

Showing posts from December, 2008

Netflix Progress Prize for 2008 宣布了

Netflix Prize 官方網站在12月10日宣布,今年(2008)的年度成就獎頒給 BellKor in BigChaos.

It is our great honor to announce the winner of the Netflix Progress Prize for 2008 as team BellKor in BigChaos for their verified just-in-time submission on Sept 30 at 21:17:40 UTC achieving a 9.44% improvement over Cinematch. We congratulate the team of Yehuda Koren, Robert Bell and Chris Volinsky of AT&T Research Labs combined with Andreas Töscher and Michael Jahrer of Commendo Research for their superb work integrating many significant techniques to achieve this result.

In accord with the Rules the team has prepared a system description consisting of two papers, which we both make public below. We will be awarding the Prize in a presentation at the Netflix offices in Los Gatos on December 17, 2008 at 4pm. Andreas Töscher and Michael Jahrer will present a public talk at that time about their Prize algorithm. We will post a video of that presentation via the Forum.
BellKor 團隊在網站上提供該團隊所發表與本次競賽有關的論文,供有興趣的讀者下載參考:


The …

Reading List: Diversity in Recommenders

Daniel Lemire 在上個月整理他認為與推薦系統的多元推薦輸出(diversity of recommendation lists)有關的文獻,有些讀者在留言裡也提出他們的建議。初步過濾之後,我把自己感興趣的文章,用 CiteULikeRefworks 的輸出功能,製作IEEE 格式書目如後,作為備忘查考之用:

[1] C. Clarke, M. Kolla, G. Cormack, O. Vechtomova, A. Ashkan, S. Büttcher and I. Mackinnon, "Novelty and diversity in information retrieval evaluation," in SIGIR '08: Proceedings of the 31st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 2008, pp. 659-666. [2] D. Fleder and K. Hosanagar, "Blockbuster Culture's Next Rise or Fall: The Impact of Recommender Systems on Sales Diversity," SSRN eLibrary, 2008. [3] D. Fleder and K. Hosanagar, "Recommender systems and their impact on sales diversity," in EC '07: Proceedings of the 8th ACM Conference on Electronic Commerce, 2007, pp. 192-199. [4] L. Iaquinta, M. de Gemmis, P. Lops, G. Semeraro, M. Filannino and P. Molino, "Introducing Serendipity in a Content-Based Recommender System,&quo…

[Updated] 使用決策樹作股票預測

Data Mining Research 最近發表了一系列使用決策樹作股票預測的文章,目前(2008/11/12)已經發表到第五篇《風險評估》,我會依照發表進度更新本文。除了本系列專文之外,Data Mining Research 還發表不少與資料挖掘研究趨勢以及技術探討的文章,讀者有興可到這個部落格挖挖舊文章說不定會有些意外收獲哦。

Stock Prediction using Decision TreeDecision Tree for Stock Prediction: Stock FilteringDecision Tree for Stock Prediction: Data PreprocessingStock Prediction using Decision Tree: Classification Tree (2008/10/27)Artificial Intelligence Applied to Stock Picking (2008/11/06)
Stock Prediction using Decision Tree: Risk Management (2008/11/10)Readability of Decision Trees (2008/11/26)Stock Picking Using Data Mining: Parameter Tuning (2008/12/13)

(First Published on 2008/10/14 : Last Updated on 2008/12/13)

[書摘]:『帝國』的佳釀

Image
我從不知道喬治亞生產白蘭地,不過卡普欽斯基(Ryszard Kapuscinski)的帝國:俄羅斯五十年告訴我們一件顛撲不破的真理:釀酒,如同每項藝術一樣,你必須有品味,其餘的則會隨之而來。


I. 初遇 - 南方 一九六七 - 喬治亞
並非每個人都知道白蘭地之怎麼來的,想要製作白蘭地,你需要四樣東西:葡萄酒、陽光、橡樹和時間;如同每項藝術一樣,在這些之外,你還必須有品味,其餘的則會隨之而來。

秋天葡萄收成期後,就開始製造葡萄酒,把酒倒進橡木的桶子裡,白蘭地所有的秘密都藏在橡樹的年輪當中。橡樹成長,把陽光收集到自己樹幹裡頭,就像琥珀沉澱在海底一樣。陽光慢慢沉澱進橡樹年輪,這段漫長的過程,持續好幾十年。年輕橡木製造出來的桶子是生產不出好得白蘭地。當橡樹成長,樹幹轉為銀色,表示橡樹逐漸壯大;木質收集了力量、顏色和芳香。不是每棵橡樹都會養出好的白蘭地,最棒的白蘭地是由長在乾燥的土地、寧靜的地方的單生橡樹林所養成的。.......

然後桶匠開始製作桶子,....................

朝桶子裡倒進葡萄酒,或五百、或一千公升不定,然後把桶子擺在木馬架上,順其自然。人不需要再多做什麼:必須等待,時機正確,水到就會渠成。酒現在進入了橡木,然後木頭釋放出一切,釋放出陽光;釋放出香味;釋放出顏色,木頭擠出它本身的汁液;開始運作。

所以需要寧靜。

.... 第一杯白蘭地在三年後出現,.........。..................................。但事實上,白蘭地的年齡還要更了不起一點,我們得把製成木桶的橡樹年齡也加上去,這次的橡木是在為法國大革命期間封存的酒努力

一個人可以從味道分辨出白蘭地是年輕或年老的,年輕的白蘭地尖銳、快速、衝動,味道會酸;反過來說,老成的親切,溫柔,稍後才開始發光。老白蘭地中又許多溫暖、學多陽光,會平靜的進入一個人的腦袋,好不誇張。

而且會盡它應盡之道。

[書摘]:蘇煒談疏離

Image
蘇煒參與了一次傳統的耶魯布魯克學院的 dinner talk 後,有感而發:


「有閒」的「遠」與「有為」的「近」

-- 現代生活裡談「疏離」久矣。人們感嘆科技信息時代的人際疏離、人情淡薄、世風日下,簡直已快成一種「政治正確」式的老生常談,似乎談是一種姿態,不談亦是一種姿態。竊以為在意識形態面放言「批判」的許多高蹈的姿態-比方有滋有味享受著「中產階級」的現世功利而聲淚俱下批判「中產階級生活方式」之類-也僅是姿態而已,其實是「有閒」的味道很多而「有為」的質感很少的。

雖然談疏離似乎是一種流行,蘇煒並不悲觀....

所謂「中產階級」的「有閒」並不可怕,「有為」才是其中最重要、具備正面建構價值的東西;當今信息、科技時代(你叫後工業、後資本時代也行)造成的社會疏離與人際隔膜是事實,但在一種大的建制中,再人文教育「有為」的掌控安排之中,有意加強人與人之間的個人接觸,創造一種良性的社會氛圍,建構一個「主流社會」或所謂「中產階級生活形態」的正米特質,就不但是具體的,也是可行的。如果「立場」也即「姿態」的話,....