Sunday, December 16, 2007

「人民」是個偽概念

有個朋友看了我的網路書櫃,問我選擇書籍的標準。我想了想,除了賴以維生(混口飯吃)的專業書籍之外,無非就是圍繞著「懷舊」和「好奇」兩個主題吧。

這兩個主題,既矛盾又協調,主宰了我的前半生,想來下半輩子仍會繼續與這兩個主題糾纏下去。

追探父祖輩成長時所發生的一切,和從啟蒙至今這個世界所發生的一切(從不識之無到青春期,所見所感畢竟只在五里方圓),是我這幾年特別著意的主題。當我在圖書館發現兩本分別談兩岸的八十年代的書,趕緊把這兩本「」回自家書房。

同時看查建英八十年代訪談錄和時報出版的狂飆八○,是個有趣的經驗,看同個種族的人們在兩個不同的社會條件下,追求更多的心靈釋放與更多「可能性」的過程,是很震撼也很「享受」的閱讀經驗(驚豔)。一邊是自小生於斯、學於斯的環境,但是從來就不覺得自己很瞭解這個社會;另外一邊則是自小充滿好奇,及長卻必須擔憂後半輩子的飯碗要被這邊碾碎,心驚的是,我對這一邊瞭解則更少了。

當我在八十年代訪談錄看到阿城(就是說「什麼事情一到專業地步,花樣就來了」的那個阿城)接受受查建英訪問講的一段話,我不禁笑了(捻花微笑的境界太高,下面這段話的詮釋權留給讀者吧)。
我記得陳映真問我作為一個知識份子,怎麼看人民,也就是工人農民?這正是我在七十年代在鄉下想過的問題,所以隨口就說,我就是人民,我就是農民啊。 .... (省略)..... 寫作的人,將自己菁英化,無可無不可,但人民是什麼呢?在我看來,人民就是所有的人啊,等於沒說啊。不過在菁英看來,也許人民應該是除自己之外的所有人吧,所以才有「你怎麼看人民」的問題

所有的人,都是暫時處在有權或沒權的位置,隨時會變化。一個小科員,在單位裡沒權,可是回到家裡有父權,可以決定或干涉一下兒女的命運。你今天看這個人可憐,屬於弱勢群體,可是你給他點權力試試,他馬上也會有模有樣地刁難欺負別人。這是人性,也是動物性,從靈長類的社會性動物就是這樣。「人民」是一個偽「概念」,所以在它前面加上任何美好的修飾,都顯出矯情

Saturday, December 8, 2007

電腦的重量

這幾年,網路上流傳關於某個電視購物頻道推銷的笑話,第一句就是『我們的筆記型電腦40G的硬碟,裝了30G的東西,重量一點都不會變喔...』,在 LOL ( Laugh Out Loud ) 之前,諸君可要搞清楚,購物台可是做過功課的,請看:

Business @ The Speed of Thought
The great thing about a computer notebook is that no matter how much you stuff into it, it doesn't get bigger or heavier.

Bill Gates, Business @ The Speed of Thought

Wednesday, December 5, 2007

從 Google Reader 的訂閱推薦談起

時值歲末,Google 旗下的服務異動很多,好像急著在年底前倒出一籮筐「好東西」,作為給用戶的 Christmas (新年)禮物。 GMail 啟用第二版介面才沒兩天,就又增加 Group Chat 、彩色標籤和 AIM 的整合。和郵件服務有點「兄弟臉」的 Google Reader 也沒閒著,先是提供拖拉(drag-and-drop)方式管理訂閱清單的功能,這兩天
宣布開始提供推薦閱讀 (Feed Recommendation)功能。

在部落格圈子(Blogospphere)裡,對於訂閱推薦的反應很是熱鬧,新聞型的網站是報導加轉載,一天要看上很多次報導;評論型的博客們,則各自發表了試用的心得,從經營模式的針貶到推薦精準度的抱怨,遍地開花,倒也有趣。

因為前陣子「閉關」的緣故,刻意讓自己少念些來自網路上的資訊,所以向來關注「推薦機制」議題的我,這回原本並不怎麼關心這個話題的。但是在試了幾個推薦訂閱之後,一些有趣的巧合,讓我對這個議題產生一些想法,開始留意起更多有關資料。

關於推薦訂閱這件事,我的觀察分為兩個角度,第一是 (Online)RSS Reader 的競爭環境,和不同經營模式對於市場佔有率的影響;第二個則是從推薦機制的技術角度來看,與過去所念的文獻相印證。

Google Reader 進入線上 RSS 閱讀市場之後,憑著高明的技術,很快搶下一片天空,
原本市場中的活躍份子,如今只剩 Bloglines 的市佔率還算「可觀」,其餘的競爭者已經被擠壓到一軍陣容之外了。倒是大陸地區因為大環境的關係,本地市場出現了像「抓蝦」、「鮮果」這樣令人驚豔的狠角色,令人期待。

在這樣的大環境下,不少 RSS 閱讀器廠商,都以開發更多社群網路的可能性作為強化競爭優勢的手段。就以促進推薦訂閱這件事來作比較,鮮果鮮果榜BloglinesBloglines Top 100 ,就是這種思維的產物;而 Google 在面對這個挑戰時,採取的態度與 Google News 相若,強調以「資料+演算法」的機制,產生推薦名單。

Google News 的開發團隊,在今年五月舉辦的 WWW 2007 會議中,發表了 Google News 推薦新聞機制演算法的論文 ─ Google news personalization: scalable online collaborative filtering。換言之,Google News 不再滿足於2001年時設定的新聞聚合(automated news aggregater)服務的目標,也加入更多的機制,期望提高這個服務的使用率。

Google Reader 也加入推薦閱讀功能,恰如 Attention Economy: All You Need To Know 所闡述的 ,choicerelevancy 是留住用戶的手、眼和心的不二法門。



雖然有人(原本不是很認真看這個話題,當時沒有作書籤,現在一時找不到出處,等找到再補上)抱怨 Google Reader 的推薦名單,精確度和推薦數目都不理想,認為 Google 作得太草率。以我個人的經驗來看,推薦品質雖然不算完美,倒也沒有太糟糕,也許Google Reader 團隊所使用的演算法還沒有成熟。但我想強調的重點是, Google 「讓資料說話」和「閱讀器功能優先」的信念,和其他業者以社群機制作為留客關鍵手段的想法是有很大不同的

另外一件值得重視的事情是源自巧合,我從 Google Reader 的推薦名單裡找到兩個我很喜歡的部落格 - SyntheseDaniel Lemire's Blog 。這兩個部落格的作者都是資訊科學界中人,書寫的題材恰好也是我關注的議題,所以我非常滿意這兩個推薦項目,其他的推薦項目,雖然不見得合我口味,但在這兩個極度滿意的「掩護」下,讓我沒有太多抱怨(grin)。

讓事情變得更有趣的是,這兩個部落格最近的兩篇文章,都和近日手中的工作或者接下來的工作有關,這樣的巧合,是所有的推薦機制都作不出來的。

Daniel 剛剛寫了搜尋引擎 Quintura 的介紹,這個被 AltSearchEngine 稱為 the alternative search engine of the year 的搜尋界新秀,正是我打算分析、介紹的關注對象之一,原本想年底忙完現在手上的專案,再找些相關資料來消化的。面對這個巧合,頓時有點「眼前有景道不得,崔顥題詩在上頭」的感慨。這是巧合之一。

Synthese 則提到 IngentaConnect (一個提供學術出版品和圖書館服務的廠商)宣布將和 Baynote (提供推薦系統技術的廠商)合作,以 Collaborative Filetering(關於 CF 的介紹,請參考拙作)技術為基礎的建立推薦機制,向閱讀學術期刊的讀者們提供期刊文章的推薦服務。以下是新聞稿部分內容,概略的介紹了這個服務的運作原理 (how it works)。
… context and behaviour are combined to determine the user’s intent, which is then analysed for relevance to that of the site’s other users; patterns that emerge from this analysis are used to recommend additional content which is more likely to be of interest and relevance to the user than regular, contextual recommendations. Sophisticated behavioural analysis monitors not simply clicks and page views, but also the length of time that a user spends on the page and the type of activities that they carry out there.
Synthesis 的作者對於這個合作是有疑慮的,他認為 IngentaConnect 的介紹太籠統含糊,而 Baynote 的產品介紹,則是 too simple to be true。果然是深諳推薦系統箇中三昧的圈內人,只是有些書生氣(我喜歡),對於行銷宣傳目的的新聞稿,也可以有那麼多牢騷,還指出某些推薦系統成敗的要素,果然是讀書人啊。

不論 Baynote 到底是會不會抓老鼠的貓,但是從 Google News 、Google Reader 到 IngentaConnect ,推薦機制不約而同變成各項服務(service offerings)內容的核心機制之一,證明了幾件事:

  • 首先,在競爭激烈的線上世界,內容的 choice 和 relevancy 是抓住客戶的關鍵指標,而推薦機制(recommendations)正是這促進這兩個指標的具體實踐。但是目標雖同,不同的決策者,執行的策略未必相同(本文第一項的分析正說明這個事實)
  • 其次,推薦技術的成熟度,有很大的進展,所以越來越多的業者,可以將推薦機制加入產品中
  • 推薦系統處理的資料品項,越來越豐富,從以零售(retail business)產業的產品(比如說書、CD、DVD),如今內容(content)產業的產品,也將變進入推薦機制的主流
  • 產品資料的複雜度,與日俱增,下一代的推薦系統,必須提升對產品特性資料的掌握度,比如 Google News 的產品─新聞,具有高度的時間相關性,每則新聞的生命週期,可能短到以天為單位,這與傳統 e-business 販售產品的特性有很大差異。另外一個例子,Netflix Prize 的參賽者,曾經有過是否可以援用 IMDB 資料庫內容的爭議。由此可見,產品特性掌握越到位,才有機會建立一個完整的推薦系統。

Back to blogging, I hope

因為種種原因小聲地問:一定要有合理解釋嗎?),很長一段沒有寫東西,這個星期才又試著開始動筆,但是總覺得找不到原先那種感覺,不管是思路還是文字,都有點彆扭,就是覺得不對勁。

也許就像先前所說的,雖然現在正朝著新的平衡穩定的狀態過渡,但是還沒找到那個讓我舒服的「點」吧。

今天整理 RSS Reader 裡的舊文,發現一篇很有趣的文章,參照此刻心境,實在是忍不想大笑,心中激盪,就像古人說「當浮一大白」或是「撫掌再嘆」差可比擬。
I have about a 1000 posts queued up in my brain, but these things take forever to write, and now that I'm working again, I don't have forever to waste. So, in the spirit of "Good enough" is the enemy of "At all", I'm going to start blogging again, but with an absolute limit of 30 minutes per post. If after 30 minutes I'm not happy with what I've written, I'll delete the post and move on for the day.
上面這段文字,出自 Paul BuchheitGMail 的主要開發者)個人部落格,這段文字就像我此時面對 blogging 這件事的心情,大約這就是「人同此心,心同此理」的道理,這種心情是跨越地理疆界,聖賢智愚之別的。

只是以我的才情,腦子裡恐怕找不出上千個點子(雖然不多,打個折還是勉強可以湊出幾個題目的) ;以我的工作速度,也不敢自矜以 30 分鐘為界的嚴苛自我要求。 sigh。

Tuesday, December 4, 2007

[Copy-and-Pasteable Citation] in CiteULike

自從開始用 CiteULike 整理論文資料後,對於各項功能都很滿意,尤其是 tag-based 的歸檔整理方式和允許公開分享資料的社群功能(雖然它的社群功能是很基本的),是我最中意 CiteULike 的兩個特色(當然它還有其他特色,只是我最重這兩點)。

但是我一直苦惱於 CiteULike 在寫文章時的引用管理功能的薄弱,想到寫文章時要以純手工方式編寫參考資料的吃力繁雜,格式與排序要一絲不苟,內文引用書目編號要細心校對,不能錯漏失誤,有不一致的情形。文章內容若有修改,這樣的手工作業,又要來上一回,每每想到,就不寒而慄。

以前在使用 Refworks 時,便對以勾選方式編製清單的便利趕到稱奇,Refworks 還提供排序、(不同期刊)格式轉換、Office 程式 Plugin ,與此相較,CiteULike 這方面實在是差得太遠。每次想到這一點,總猶豫著是否要放棄使用 CiteULike ,換一個工具,索性換回 Refworks 算了。

今天在檢視論文資料時,才發現 CiteULike 的 Citation 功能,沒有原先自己想的那麼不堪,真正該責備的,是我這個不用心的使用者才對。

在點選每則書目的詳細資料之後,在資料編修畫面,有個標題為 Copy-and-Pasteable Citation 虛線方框, 在方框的裡的右側,有個下拉式選單,以滑鼠選擇引用格式(Citation Format)後,方框裡出現這則書目的相應引用內容,使用者可以用剪貼(copy and paste)方式,將這段文字貼入文書處理程式裡,作進一步編輯處理的動作。



雖然這個方式只能處理單筆資料,不能作整批資料的排序,比起 Refworks 所提供的 Write-n-Cite 的便利,更是差了一大截。但是比起我原先我想像的「零分」的程度,倒是好上許多。

也許再等上一段時間, CiteULike 會帶給我更多的驚喜也不一定。

Monday, December 3, 2007

不推薦的名單

很長一段時間沒有寫新的東西了,原本擺在草稿文字匣裡的東西,現在無論怎麼努力,都沒法找回原先動筆前的想法和脈絡(或許該說找不到原先的衝動吧),只能繼續擱著,很鴕鳥的告訴自己,總有一天,我會把它們完成。

作息上的改變,有時候並不是完全自願的,但是往另外一個平衡過渡的過程(見 I'm not in any mood to...),比原先想的要長,工作負荷的加重和作息時間的變動,並不怎麼難克服,真正難以克服的是性格裡難以克服的惰性(慣性)。

當新的工作方式與作息漸漸有了固定的模式,掌握了工作的要點和訣竅,開始有從容的感覺,這時想要恢復原先每天動手寫札記的習慣(慣性),個性裡的疏懶因子,卻讓漸漸習於「新」秩序的自己,怎麼也懶得再次往另外一個「新的秩序」移動。

記得高中物理曾經學過「靜者橫靜動者恆動」的說法,或許這是最近一個月來沒法子完成一篇東西的原因(正確的說法應該是藉口)。

讀書寫字不用功是自己的業,沒什麼好推託。倒是這陣子,沒能即時回覆來信與我討論推薦系統的朋友,實在是該打,在此向被我怠慢的朋友鄭重道歉(James , 對不起)。

原本想對推薦系統的未來研究方向作個階段性的總結整理,看來這陣子是不可能完成了,也許(真的很鴕鳥),再過一陣子,我會重新耙梳整理,完成這個想法。

其實,我倒是沒有停止關注網路產業的動向,尤其 recommendation 和 attention economy 的想法掛勾結合之後, 推薦系統的未來更足玩味。

這裡有個小例子,11月上旬, beyond.Search 介紹了一個很有趣的網站 LibraryThing ,這個網站的經營模式和 anobii 類似,提供網路書櫃功能,讓用戶建立自己的書籍收藏資料,同時開放用戶建立社群,交流心得或是交換書籍。

但是 LibraryThing 提供的書籍推薦功能,令人印象深刻,除了目前已經非常普遍的喜好書籍推薦之外,還有「不推薦」 ─ UnSuggester :Bad Suggestion 的功能。只要輸入一本你擁有或是讀過的書籍,LibraryThing 就會產生一份不建議的閱讀清單。從技術上的角度來看,這是 scoring method 的應用變化而已,但是噱頭十足,很有意思。

beyond.Search寫的 个性化站点:LibraryThing.com 提供了這個站點的背景介紹,文章很值得一看,而 LibraryThing 自己對於 UnSuggester 的說明,則是這樣的:
Unsuggester takes "people who like this also like that" and turns it on its head. It analyzes the twenty million books LibraryThing members have recorded as owned or read, and comes back with books least likely to share a library with the book you suggest. The unsuggestions come from LibraryThing data, not from Amazon. LibraryThing also produces great suggestions.
想見識 Bad Suggestion 的真面目,未必要註冊,可以直接看看 the da vinci codethe long tail 這兩本書的例子。

Friday, November 2, 2007

I'm not in any mood to ...

最近學校裡有個專案發生重大變化,事態頗為棘手,影響甚為深廣,所以不得不暫時改變原本的工作和讀書計畫,挺身而出,作個半自願的「救火隊」。事出突然,驟然冒出來的瑣事多又雜,雖然不至於應付無方,但是著實影響作息和心情。

現在的心情可以用一句話來概括 ─ I'm not in any mood to ... (動詞隨便填)...

原本寫作的計畫也隨之停擺,怎麼也靜不下心來,把已經寫了一半的稿子補完。推薦系統的未來研究方向,就擱在草稿匣裡個把禮拜,怎麼也寫不完。我想,既然無心,索性擺久一點,等事態平靜點,心情平和點再說吧。

開始寫部落格之後,總覺得生活好像被一條無形的線繫著,有股莫名的力量拉著自己去作「某些」事情,對於所謂的更新,似虧欠又似不甘,委實難言得很。當生活失去原本的平衡,往另外一個平衡過渡(就像此刻的處境),這種感覺格外的強烈。

或許,今天在 AltSearchEngines 看到的 Blogging is a girl's best friend ,可以為這種心態作個註腳,但是我更中意 Isabella Bannerman 的這幅


如果我的心是一朵蓮花

~ 林徽因 · 馬雁散文集 · 蓮燈 ~ 馬雁 在她的散文《高貴一種,有詩為證》裡,提到「十多年前,還不知道林女士的八卦及成就前,在期刊上讀到別人引用的《蓮燈》」 覺得非常喜歡,比之卞之琳、徐志摩,別說是毫不遜色,簡直是勝出一籌。前面的韻腳和平仄的處理顯然高於戴...