Wednesday, December 5, 2007

從 Google Reader 的訂閱推薦談起

時值歲末,Google 旗下的服務異動很多,好像急著在年底前倒出一籮筐「好東西」,作為給用戶的 Christmas (新年)禮物。 GMail 啟用第二版介面才沒兩天,就又增加 Group Chat 、彩色標籤和 AIM 的整合。和郵件服務有點「兄弟臉」的 Google Reader 也沒閒著,先是提供拖拉(drag-and-drop)方式管理訂閱清單的功能,這兩天
宣布開始提供推薦閱讀 (Feed Recommendation)功能。

在部落格圈子(Blogospphere)裡,對於訂閱推薦的反應很是熱鬧,新聞型的網站是報導加轉載,一天要看上很多次報導;評論型的博客們,則各自發表了試用的心得,從經營模式的針貶到推薦精準度的抱怨,遍地開花,倒也有趣。

因為前陣子「閉關」的緣故,刻意讓自己少念些來自網路上的資訊,所以向來關注「推薦機制」議題的我,這回原本並不怎麼關心這個話題的。但是在試了幾個推薦訂閱之後,一些有趣的巧合,讓我對這個議題產生一些想法,開始留意起更多有關資料。

關於推薦訂閱這件事,我的觀察分為兩個角度,第一是 (Online)RSS Reader 的競爭環境,和不同經營模式對於市場佔有率的影響;第二個則是從推薦機制的技術角度來看,與過去所念的文獻相印證。

Google Reader 進入線上 RSS 閱讀市場之後,憑著高明的技術,很快搶下一片天空,
原本市場中的活躍份子,如今只剩 Bloglines 的市佔率還算「可觀」,其餘的競爭者已經被擠壓到一軍陣容之外了。倒是大陸地區因為大環境的關係,本地市場出現了像「抓蝦」、「鮮果」這樣令人驚豔的狠角色,令人期待。

在這樣的大環境下,不少 RSS 閱讀器廠商,都以開發更多社群網路的可能性作為強化競爭優勢的手段。就以促進推薦訂閱這件事來作比較,鮮果鮮果榜BloglinesBloglines Top 100 ,就是這種思維的產物;而 Google 在面對這個挑戰時,採取的態度與 Google News 相若,強調以「資料+演算法」的機制,產生推薦名單。

Google News 的開發團隊,在今年五月舉辦的 WWW 2007 會議中,發表了 Google News 推薦新聞機制演算法的論文 ─ Google news personalization: scalable online collaborative filtering。換言之,Google News 不再滿足於2001年時設定的新聞聚合(automated news aggregater)服務的目標,也加入更多的機制,期望提高這個服務的使用率。

Google Reader 也加入推薦閱讀功能,恰如 Attention Economy: All You Need To Know 所闡述的 ,choicerelevancy 是留住用戶的手、眼和心的不二法門。



雖然有人(原本不是很認真看這個話題,當時沒有作書籤,現在一時找不到出處,等找到再補上)抱怨 Google Reader 的推薦名單,精確度和推薦數目都不理想,認為 Google 作得太草率。以我個人的經驗來看,推薦品質雖然不算完美,倒也沒有太糟糕,也許Google Reader 團隊所使用的演算法還沒有成熟。但我想強調的重點是, Google 「讓資料說話」和「閱讀器功能優先」的信念,和其他業者以社群機制作為留客關鍵手段的想法是有很大不同的

另外一件值得重視的事情是源自巧合,我從 Google Reader 的推薦名單裡找到兩個我很喜歡的部落格 - SyntheseDaniel Lemire's Blog 。這兩個部落格的作者都是資訊科學界中人,書寫的題材恰好也是我關注的議題,所以我非常滿意這兩個推薦項目,其他的推薦項目,雖然不見得合我口味,但在這兩個極度滿意的「掩護」下,讓我沒有太多抱怨(grin)。

讓事情變得更有趣的是,這兩個部落格最近的兩篇文章,都和近日手中的工作或者接下來的工作有關,這樣的巧合,是所有的推薦機制都作不出來的。

Daniel 剛剛寫了搜尋引擎 Quintura 的介紹,這個被 AltSearchEngine 稱為 the alternative search engine of the year 的搜尋界新秀,正是我打算分析、介紹的關注對象之一,原本想年底忙完現在手上的專案,再找些相關資料來消化的。面對這個巧合,頓時有點「眼前有景道不得,崔顥題詩在上頭」的感慨。這是巧合之一。

Synthese 則提到 IngentaConnect (一個提供學術出版品和圖書館服務的廠商)宣布將和 Baynote (提供推薦系統技術的廠商)合作,以 Collaborative Filetering(關於 CF 的介紹,請參考拙作)技術為基礎的建立推薦機制,向閱讀學術期刊的讀者們提供期刊文章的推薦服務。以下是新聞稿部分內容,概略的介紹了這個服務的運作原理 (how it works)。
… context and behaviour are combined to determine the user’s intent, which is then analysed for relevance to that of the site’s other users; patterns that emerge from this analysis are used to recommend additional content which is more likely to be of interest and relevance to the user than regular, contextual recommendations. Sophisticated behavioural analysis monitors not simply clicks and page views, but also the length of time that a user spends on the page and the type of activities that they carry out there.
Synthesis 的作者對於這個合作是有疑慮的,他認為 IngentaConnect 的介紹太籠統含糊,而 Baynote 的產品介紹,則是 too simple to be true。果然是深諳推薦系統箇中三昧的圈內人,只是有些書生氣(我喜歡),對於行銷宣傳目的的新聞稿,也可以有那麼多牢騷,還指出某些推薦系統成敗的要素,果然是讀書人啊。

不論 Baynote 到底是會不會抓老鼠的貓,但是從 Google News 、Google Reader 到 IngentaConnect ,推薦機制不約而同變成各項服務(service offerings)內容的核心機制之一,證明了幾件事:

  • 首先,在競爭激烈的線上世界,內容的 choice 和 relevancy 是抓住客戶的關鍵指標,而推薦機制(recommendations)正是這促進這兩個指標的具體實踐。但是目標雖同,不同的決策者,執行的策略未必相同(本文第一項的分析正說明這個事實)
  • 其次,推薦技術的成熟度,有很大的進展,所以越來越多的業者,可以將推薦機制加入產品中
  • 推薦系統處理的資料品項,越來越豐富,從以零售(retail business)產業的產品(比如說書、CD、DVD),如今內容(content)產業的產品,也將變進入推薦機制的主流
  • 產品資料的複雜度,與日俱增,下一代的推薦系統,必須提升對產品特性資料的掌握度,比如 Google News 的產品─新聞,具有高度的時間相關性,每則新聞的生命週期,可能短到以天為單位,這與傳統 e-business 販售產品的特性有很大差異。另外一個例子,Netflix Prize 的參賽者,曾經有過是否可以援用 IMDB 資料庫內容的爭議。由此可見,產品特性掌握越到位,才有機會建立一個完整的推薦系統。

No comments:

Post a Comment

如果我的心是一朵蓮花

~ 林徽因 · 馬雁散文集 · 蓮燈 ~ 馬雁 在她的散文《高貴一種,有詩為證》裡,提到「十多年前,還不知道林女士的八卦及成就前,在期刊上讀到別人引用的《蓮燈》」 覺得非常喜歡,比之卞之琳、徐志摩,別說是毫不遜色,簡直是勝出一籌。前面的韻腳和平仄的處理顯然高於戴...