Monday, April 30, 2007

Chance Discovery - 你認真了

去年,系上請了一位日本籍教授來學校演講,談的主題叫做 Chance Discovery,演講者花了許多力氣,解釋什麼叫做 chance ,discovery 的意義又是什麼。

Chance Discovery is the discovery of chance, rather than discovery by chance.

A “chance” here means a new event/situation that can be conceived either as an opportunity or as a risk in the future.

The “discovery” of chances is of crucial importance since it may have a significant impact on human decision making. Desirable effects of opportunities should be actively promoted, whereas preventive measures should be taken in the case of discovered risks.

In other words, Chance Discovery aims to provide means for inventing or surviving the future, rather than simply predicting the future.

.. Chance Discovery is a research to study how to discover rare or novel events causing potentially significant situation. Although the event itself could not be significant.


無奈資質駑鈍如我,花了八十分鐘,仍然搞不清楚 chance discovery 的中心宗旨。事後,還透過 Google Scholar 找了幾篇論文,想要透過「原典」一窺究竟,但是仍然一無所獲。甚至,我還和指導教授聊過,我對 Chance Discovery 懷抱的奇怪憧憬,雖然我實在不明白這個觀念要如何和我已經掌握的知識連結。

直到今天,看到一篇 Blog Post - Chance Discovery - is there a there there 才明白這不是我的問題,在這個領域學養經驗遠勝於我的實務界中人,對於這個概念,也是有許多點點點的話要說。

首先這個作者虧了這群作者(chance discovery 是日本人搞出來的)的英文是confusing and contradictory,然後非常認真的分析了這個領域幾個重要的論述和演算法,每一段分析都用「懷疑」的口氣結尾,然後下結論說要有個口袋很深的老闆,才能試試這個玩意兒。總之,老外酸起人來,一本正經的讓人忍俊不住,酸歸酸,看完了這篇文章,我還是抓不住 (can't catch) 它(chance discovery)。

上禮拜,實驗室裡的同學告訴我,像這篇文章作者的行為,用 PTT 的說法,應該是:『你認真了』。

(為了平衡報導, Chance Discovery 的網站在此)

只因為年輕啊

學生時代,蠻喜歡張曉風的文章,後來有段日子覺得她的文章閨秀氣太重,雖然對她的敬重不減,但是書單裡多了歡董橋、逯耀東、簡媜、蔡珠兒、舒國治等等,更喜歡知性重一點、史觀濃一點的東西,就很少看她的東西了。

這兩天得閒抽空(歐陽修有三上之說)重新翻了翻天下散文選,正巧翻到一篇「只因為年輕啊」,很久以前就讀過這篇文章,重讀斯文,仍然覺得有幾個段落的情感和用字對我此刻的心境仍然過濃,有點不自然,但是看到一段文字,剎時攫住了我的目光,久久不能翻頁。

「讀你的作品,發現你的情感很細緻,
但是關懷就容易受傷,對不對﹖那怎麼辦呢﹖」

我看了她一眼,多年輕的額,多年輕的頰啊!
有些問題,如果要問就該去問歲月,
問我,我能回答什麼呢﹖
但她的明眸定定的望著我,
我忽然笑起來,幾乎有點捉狹的口氣。

「受傷,這種事是有的,
但是你要保持一個完完整整不受傷的自己做什麼用呢﹖
你非要把你自己保衛得好好的不可嗎﹖」


Read complete article

Saturday, April 28, 2007

雛鳳清於老鳳聲

週末讀報時間,看到昨天(2007/4/27)國語日報第四版年輕學生的發表園地,有一篇風格獨特的文章。這篇文章的作者只有國中二年級,但是她描寫奶奶廚藝的文字,風格老辣,實在不像是不滿十八歲年輕人的文字。這麼年輕的冷面笑匠,有前途。摘錄一段如下:

每一道菜完全忠實的表現了奶奶的個性。她節儉─連續四天都能看見同一盤魚擺在桌上;她平淡─一道酸辣湯可以達到不酸、不辣,甚至沒有味道的境界。她勤勞─同一道菜可以不厭其煩的加熱再加熱,直到完全碳化。她不忘本─每天的菜都有固定的形式,不會有絲毫變化。

讀報心得:
  • 還是那句老話,國語日報,真的是目前最好看的報紙了
  • 李義山詩曰:『雛鳳清於老鳳聲』,此之謂也
(原詩是「 十歲裁詩走馬成,冷灰殘燭動離情。 桐花萬里丹山路,雛鳳清於老鳳聲」)

Thursday, April 26, 2007

Mapping the blogosphere

[Note : this is the sequel to the post published this Monday(2007/04/23) ]

I mentioned in Monday's post that blogosphere has became the biggest social network ever seen. Photo and story courtesy of Discover Magazine available in Discover's web site. Some of blog posts point to the article. If you're new to this topic, the Blogosphere Mapping Gallery may be of interest. Eventually, the map was built to visualize the interactions and relations between assorted of webs and blogs. It's a typical application of visualization.

I couldn't manage to find the description of clustering algorithm used by the creator of the map.I'll keep on following this topic in the upcoming weeks.

The creator of the map,Mathew Hurst, the co-creator of Blogpulse, said the most interesting post to date is "DailyKos Featured in Discover Magazine". Studying the differences in the structures of the blogosphere has suggested that bloggers in the political arena have denser linking behaviours. Connectivity is fundamental to politics. Consequently, it is not surprising to see a natural interest in understanding the nature of discourse.

(這幾天都在忙這些有的沒的,該看的書也沒有看,罪惡感越來越重,不過憑良心講,Visualization 是真的很有趣)

Monday, April 23, 2007

The biggest social network you'll never see

The blogosphere is the biggest social network you'll never see. Recent studies suggested there're nearly 60 millions blogs existing in the blogosphere, and about 175,000 more crop up daily (that's about 2 every second).Here comes a fasnating map of interaction between bloggers from Discover Magazine. It's an extension of the work detailed in Matthew Hurst's Data Mining Blog. Social media expert Matthew Hurst recently collected link data for six weeks and produced this plot of the most active and interconnected parts of the blogosphere.

My question: who've done the estimation of the number of the blogs ?

[Rumor] Google Phone Manager Wanted

談到寬頻、網路、電信、 Convergence 的話題,有個頂有名的部落格,Om Malik's Blog 。這個網站更新,出新文章的速度,實在是快的嚇人,以我的閱讀速度,是絕對跟不上的。所以,我只是偶而想到的時候,才會上站瞄一瞄新聞總表,撿標題有趣的文章看看摘要。

想起這個網站,是因為前一陣子,實驗室有個兄弟,問我對 Google Phone 的看法,那時我實在沒有什麼想法,離開業界好長一陣子,對於天天追逐(chasing)最新消息,然後在喝咖啡的時候和同行擺龍門陣,臧否天下人物的舉動,已經有點陌生了,在那天之前,我是真的沒有想過這件事(Google Phone)的。

在我們這個圈子,對於 Google 的感覺是很複雜的,近日許多媒體以 Who's Afraid of Google 大做文章,不是沒有源由的。或許改天,我也寫寫我自己心目中的谷歌吧。

在我動筆之前,先給個八卦,算是代替這個問題的答覆。Om Malik's Blog 在4月20日,發了一則文章 Wanted: Google Phone Manager,文章的開頭,用下面這段話,給 Google Phone 這件事下了一個強有力的註腳。

The decibel level around Google phone has gone up considerably in recent weeks. Google CEO Eric Schmidt called mobile the biggest growth area for the company at the Web 2.0 expo. True to his word, Google has been looking to hire to fill out its mobile business,...

作者還從 Google 的求才廣告,推衍出一套他自己的看法,有興趣的人自己去看看吧。

延伸閱讀
Is Google too Powerful?
Wanted: Google Phone Manager?
Manufacturing New Product Introduction Program Manager - Mountain View

[KDnuggets] Data Mining Methods Poll

KDnuggets 是 Data Mining 領域具獨特地位的網站,它的 editor 和 publisher 是 Gregory Piatetsky-Shapiro, Ph.D.,他是目前 ACM SIGKDD 主席,也是 IEEE International Conference on Data Mining (ICDM) Steering Committee 的一員。我剛開始接觸 Data Mining 這個領域時,從 Google 找到的 Data Mining Resource 網站,都將這個網站列為首要資料來源之一。個人覺得它的重要性,在於它的全面,這個網站不僅有 Tutorials、Papers,還有產品介紹,工作機會等等,除此外,KDnuggets 還發行一份電子報,介紹網站的最新動態。

這個網站,每年舉辦一次投票,選出過去一年運用最普遍的 Data Mining methods ,連續兩年的第一名都是決策樹,第二、三名則分別是 Regression 和 Clustering,只是兩年的順序不同(最近一次(Mar 2007)的結果,可以看這裡,2006年4月舉辦的投票結果,請點擊這個網址)。

至於這個投票的價值,每個人的解讀不同,我不作評論。Gregory Piatetsky-Shapiro 本人的說法 則是

I have been running annual polls on Data Mining Software Usage, which, while not perfect, offer some measure of tool popularity. Here are some recent KDnuggets polls on Data Mining Tools:

看看今年的結果吧, ....

Data mining/analytic methods you used frequently in the past 12 months: [203 voters]
Decision Trees/Rules (127)
62.6%
Regression (104)
51.2%
Clustering (102)
50.2%
Statistics (descriptive) (94)
46.3%
Visualization (66)
32.5%
Association rules (53)
26.1%
Sequence/Time series analysis (35)
17.2%
Neural Nets (35)
17.2%
SVM (32)
15.8%
Bayesian (32)
15.8%
Boosting (30)
14.8%
Nearest Neighbor (26)
12.8%
Hybrid methods (24)
11.8%
Other (23)
11.3%
Genetic algorithms (23)
11.3%
Bagging (22)
10.8%

Saturday, April 21, 2007

十四年後,三分之一大學需退場?

今日(2007/04/21)閱報,國語日報第二版「文教新聞」頭條報導:

預計十四年後,也就是民國一百一十年時,大學新生招收人數將降到二十一萬,到時候約有三分之一的大學招不到學生,約有六十二所大專院校面臨招生不足或關閉的危機,呼籲教育部提早因應。

巧得是,昨天(2007/04/20)國語日報的頭條,談大學之前的學校退場機制,國立高雄師範大學舉辦的十二年國教教育論壇裡,會中有人建議,辦學不佳學校的退場機制,可以修法將校地依照都市計畫變更地目,部分改建為公共設施,部分交給董事會,這個意見獲得與會的教育部次長贊同

讀報心得:

  • 國語日報真的不錯看,比「質報」、「統媒」和「綠色民意」都好看,新聞無刺激性因子,刊載的文章品質也不錯。
  • 不管誰退場,何時退場,百分之百的大學考試錄取率是不會改變,不會走回頭路了
  • 從關燈一小時和校園安全演習的事件來看,期待「政務官有遠見,事務官會辦事」,似乎陳義過高,想太多了,縱然有了退場機制,又怎樣 :x

Friday, April 20, 2007

小眾的樂趣

一個大陸的博客 Herock 說 :『咖啡和 Blog 的共同點就是 ─ 都是小眾的樂趣,並不適合聚眾享用^-^

或許這句話該修正為:咖啡和博客 ( blogger 和正在念博士的人),都是小眾的玩物,不適合聚眾享用...

再復迷網站

很久以前就聽過劉再復的名字,那時只聽過他的文學批評的學術成就和1989年後的種種,對於他的作品沒有任何印象。在那個剛脫下「文藝青年」身份,努力想要在職場證明自己的年紀,很快就把他,還有其他老朋友,放在腦後。

直到再次執起他的書,在腦中重新組織對他的認識,是兩個月前在圖書館裡尋寶,發現了他的『共悟人間:父女兩地書』,借回家後,就放在床頭供了起來。借期截止的前兩三天,收到圖書館的催繳函,才趕忙執起書本,認真念了幾篇文字,才發現自己錯過了什麼,遺憾的將書本還了回去。所以當再次在書架上,發現了他寫作的『漂流手記』,才特意駐足翻閱。看了書裡對孤獨的看法,索性把自己的讀書札記就也叫做漂流手記。

其實,我喜愛『父女兩地書』遠甚『漂流手記』,因為從文章裡不僅看到父、女二人不凡的識見、才情,也可以看到親情的流露,這種感情,只有在自己也為人父之後,才能從行間挖掘出來。若是我再年輕一些,斷然是不會有這種感慨的。

不過,初看到劉再復對心靈孤本的演繹,一時心動,就把這本讀書札記也叫做漂流手記( 其實我一直把這個部落格當作讀書札記 e 化的版本,唉,動輒開口就是 e 化,又是一個被資訊科技糊弄的現代人的毛病哪)。

現代的網路人或是讀書人,在讀書的時候,比前人有一點不同,就是上網找資料,既然與劉先生有緣,才有了這個部落格,自然的反應就是搜尋他的一切(又是Google),上下翻捲了幾頁之後,發現了再復迷網站(再复迷网站)

看著瀏覽器標題列上的簡體字 ,突然搞不清楚,究竟是再復迷設立的網站,還是再復在網中迷失了。或許我也迷失了....

Thursday, April 19, 2007

決策者的孤寂

一篇很好的文章,前肯德基CEO的離職告白

這兩天為部落格找設定改裝的資料,隨意搜尋、衝浪之餘,正好發現這篇文章,不知道原先是在哪兒發表的(補註:後來發現是天下雜誌的專訪),裡面有好多東西,讓我很有感覺,尤其是主人翁談她在肯德基時的挫折那一段,對心情的描寫,實在是心有戚戚啊。作為一個商業組織的領導者,最大的挑戰不僅在於開疆闢土、縱橫捭闔的個人戰鬥力考驗,更難面對的是作決策時,心中的孤寂和脆弱


故事開始 - 心靈的孤本

自從發現學校的圖書館的館藏比想像中豐富,常拋下本行的書籍報告,樂得在書架走道間恣意走動隨手翻閱,常只憑著書名是否對眼,就手抱一堆天文地理各不相干的書籍到櫃臺將書領回家。如果看走了眼,找個時間在學校催繳之前,還回去就是了。

那天,偶然間,在學校的圖書館發現了劉再復的散文-漂流手記。然後信手翻翻,隨便瞄一瞄,打算一如既往憑著第一印象決定是否要將書籍抱回去。書頁翻開,是第12頁,文章的名字是孤獨的領悟。眼簾打開,被眼前的文字震懾得說不出話來。作者一句句對於孤獨的告白,就是放在心裡幾十年,不能言宣的心聲。

『儘管被真誠的朋友包圍著,儘管妻子就在身旁,但總是感到孤獨。』

『人的生命現象真是奇特,任何安慰,任何溫情,任何美麗的故事都無法抹掉籠罩於心中的孤獨感。而且愈想抹掉它,它就愈顯得沉重。常常沉重得喘不過氣。』

『孤獨真會使人頹廢。也許頹廢真是對獨孤進行抗爭的形式。』
我對自己說,也許找個地方,把自己在人世間漂流的心情記下來,是個不錯的主意。所以就有了這個不屬於劉再復,只屬於我的漂流手記。作者說,每個人都擁有只屬於自己的心靈的孤本,我無法展示它的全部內涵,只是讀著、想著、寫著,把孤本一頁頁掀開、抖落...

如果我的心是一朵蓮花

~ 林徽因 · 馬雁散文集 · 蓮燈 ~ 馬雁 在她的散文《高貴一種,有詩為證》裡,提到「十多年前,還不知道林女士的八卦及成就前,在期刊上讀到別人引用的《蓮燈》」 覺得非常喜歡,比之卞之琳、徐志摩,別說是毫不遜色,簡直是勝出一籌。前面的韻腳和平仄的處理顯然高於戴...