Saturday, June 30, 2007

Over the Rainbow

照片是在桃園機場第一行廈入境大廳停車場照的,那天從淡水開車到機場接從大陸旅遊回國的家母,一路上下著大雨,就像有人在車頂往車前擋風玻璃不停的倒水一般,雨刷怎麼也趕不上雨水往下衝擊的速度,這下可真的明白「大雨傾盆」這句成語的靈感來源了。

提心吊膽的到了桃園,快到機場前,雨停了。到了入境大廳,又發現從香港回來的飛機,也因為天候往後遞延了,這一拖最少是一個半小時。氣結之餘,索性打主意到停車場取下筆記型電腦,在大廳裡看看電子書打發時間。結果在停車場裡發現天邊掛著一條彩虹,真的好久好久沒有看到彩虹了,趕緊用身邊帶著的手機拍下這張難得的照片。

Somewhere over the rainbow
Way up high
There's a land that I heard of
Once in a lullaby
彩虹彼端,究竟是怎樣的景象?天是藍的,所有的美夢都會實現,所有的麻煩都會融化...

我家的小公主,或許要說,絕對不能少了 Tiramisu...

Wednesday, June 27, 2007

Reorganizing My Blogs

現在開始,我的部落格分成兩個主題館, Ramblings on Life and Lab 將以各主題的閱讀心得、評論為止,包括資料挖掘、教育、資訊科技、管理等各個領域的文章;而欄杆拍遍包含比較零碎的隨筆、佳句摘錄,以及和 Blogger 有關的技術類文章。

(所以從現在開始,分類 blogger 的文章,將移至欄杆拍遍)

URL:
  • Roger's Blog Ramblings on Life and Lab - http://blurkerlab.blogspot.com
  • 欄杆拍遍,無人會登臨意 - http://imrchen.blogspot.com

歷史的教訓

王丹獄中回憶錄的圖像王丹獄中回憶錄,第四章鐵窗墨香,有這麼一段話。

我向家裡要的書側重於英語方面,這說起來還是受中共黨史的影響呢!我母親是搞中國共產黨歷史研究的,因此從小我就看到很多所謂「革命歷史教育書籍」,其中有不少「革命先烈」們如何在國民黨的牢房中自學成材的故事,這給我留下了深刻的印象。像外語這樣需要集中時間學習的知識,更適合在監獄裡自修,所以我也想利用這段時間把外語好好學一學,出去以後說不定還沒有時間了呢!想一想也好笑,那些在獄中學習外語的人及其後代現在又把我們關在獄中學習外語。這種重複對歷史來說也許是種喜劇,但對民族來說無疑是種耐人尋味的悲劇

人類從歷史學到的唯一教訓 - 歷史是會重複的

Saturday, June 23, 2007

就事論事看基測

(2007/07/02 補充)

今年基測之後,已經連續寫了三篇東西,原本不想再針對這個主題寫什麼了,今天拜讀Taiwan 2.0 的文章「國中基測還有救嗎?」,對蔡先生的觀點覺得深以為然,也覺得自己原先的想法還可以再做些補充。不過最近幾天忙著趕學校專案的系統分析報告,恐怕沒有時間作更進一步的分析,所以先作個補充註記。

相關的連結:

(2007/06/23 原稿)
基測量尺 計分不公的新聞出現後,果然出現對於公布時機政治動機的臆測,雖然在意料之中,但是對於這樣的狀況,還是很失望。在這個政治狂熱的國度,要理性討論問題真的有那麼難嗎?

在沒有閱讀完畢林女士的研究報告之前,筆者個人不敢妄言研究結果的正確性和心測中心的「答辯」究竟有沒有道理,但是從常識的角度,和作學問的基本要求來看,我只在乎資訊的透明和程序正義。

資訊不透明

今年(2007)第一次基測結束後,媒體出現『參加次兩次基測,平均分數相差不到一分』的報導,類似的新聞也可以在前年(2005年)六月的新聞中找到,所以我們應該可以推論,不鼓勵參加第二次基測是教育部和心測中心對於這個議題的基本立場。

但是在尋找佐證資料的過程中,筆者發現心測中心的研究員曾在不同的場合(座談會、報紙訪問等)發表矛盾的意見。尤有甚者,心測中心和教育部並沒有交代「前後相差不到一分」的統計結果是怎麼做出來的。

奇怪的決策時機

剛開始追蹤基測新聞的時候,因為資訊的稀有和不透明,我是質疑「前後只差一分」究竟是誰作的統計,怎麼作出來的(找資料的過程和筆者的心得,請參考拙作第二次基測究竟要不要考第二次基測)。但6月下旬量尺不公的新聞發表後,問題變得更複雜了。

我們看到,國內媒體披露心測中心將基測資料以國家機密為由,不願對大眾釋出的離譜情況。然後我們又看到心測中心指責林博士不懂統計,所以才會做出那種結論。我個人的看法是,如果媒體報導屬實,心測中心的反應實在是沒風度不專業

首先,參照筆者自己在找相關資料所遇到的困難,教育部和心測中心對資訊透明度的立場和處理方式,是極不恰當,應該被譴責,而且必須立即修正的。

其次,林女士既然公開自己的所做的研究,這個研究方法與結果究竟是否合理,本就是應該被檢驗的命題。從新聞中我們看到,林女士本人歡迎公開的檢驗,我覺得這是相當正面的態度,心測中心面對這個問題的第一個反應,竟然是質疑持不同意見的人的基本學力素養,既顯示出心測中心的老大心態,也讓人質疑他們是否慌張失措。

而教育部針對這個事件的反應,也實在不能不令人懷疑。根據 6月22日中時電子報,教育部中教司長宣布基測轉型(可參閱yam天空的文教新聞專輯基測將轉型 家長更憂心的系列新聞報導)為「入學門檻」,不再是入學唯一標準。新聞稿中有一段話,相當耐人尋味。
國中基測最先的設計就是「入學門檻」,高中職五專招生,除了基測量尺分數,還尊重各校招生自主權,擁有參採考生其他表現的空間。不料基測實施後,量尺分數變成登記分發入學的單一依據,讓心測中心負擔沈重。

從以上的文字裡,我實在忍不住大膽假設,教育部對於量尺這件事,實在是很心虛的。至於為什麼會心虛,是因為教育部內也認同林博士的研究價值與結論,或者教育部的專家們發現了更完整翔實、更有道理的學理根據,我們不得而知,但是這整件事的過程,讓我們對於教育部的決策品質,更加沒有信心


回溯這些年來的教育政策的變動和相關的辯論,無論是教育政策的規劃者、執行者、批評者,對於教育政策的討論(甚至辯論),都是憑著常識、猜測和各自的立場,在瞎攪和、打爛仗。

我在6月1日的文章裡提到,兩次基測之間究竟有沒有成績的差異,我們聽不到一個統一的說法,而且我們也看不到相關的資料和研究報告。尤有甚者,2009年還會不會有基測,我們也聽到政 務委員有不同的說法。擬定政策的人,講不出政策的依據和理念;為政策辯護的人,講不出政策好在哪裡;已經實行的政策,我們看不到檢討的動作和報告。

回顧這件事的發展,現在我只想說,這實在是離譜

懲罰粗心的考生??

我個人的信念很簡單,沒有公開、透明的資訊,沒有公開而理性的檢驗與辯論,不可能也不應該對林博士或心測中心的主張,輕易的作對與錯、0與1模式的判斷。但是教育部與心測中心在資訊透明與程序正義上的錯誤,是應該首先被提出來,且立即修正的。

至於林博士的研究報告,是不是完美無暇,完成站在正義的一邊,也是值得斟酌的。比如說,新聞稿中說林博士認為有些考生只因粗心而答錯,也扣那麼多分,是不公平的。不知道這是不是林博士的本意,但是個人覺得這個訴求實在沒有道理。

林妙香質疑量尺計分的公正性,首先是各考科只答錯一題的扣分太多。她說,有些考科答錯一題的扣分高達五、六分,這是不合理的。她解釋,只答錯一題的考生,如果答錯的都是最難的一題,扣那麼多分還有道理。但從她的研究中發現,只答錯一題的考生,平均分布在每一個試題,有些考生只因粗心而答錯,也扣那麼多分,這是不公平的。

考試的公平性,必須立基於每一份試卷都以同一個標準評分,評分的依據必須是可取得且可重複驗證的資訊,在為基測考卷評分的時候,答錯題目的原因顯然是無法取得的資訊。以「不應懲罰粗心」為理由,質疑評分基準不公,顯然犯了邏輯上的錯誤。

從以上的分析來看,林博士的研究過程與推論邏輯,絕對不是完全沒有瑕疵的。所以個人的想法很單純,公開的、理性的、完整的檢驗與辯論,是解決這個問題的唯一方法。

不幸的,透明完整的資訊、公開理性的辯論、全面慎重的檢討,正是過去這些年來我們在擬定、執行教育政策時所最需要,但也是我們最欠缺的基本要素。

先報名再說

據筆者熟識的國中教師們透露,通常學校對於二次基測的態度,都是叫學生「先報名再說」,無論有沒有這篇新聞,學校「絕對」不會不鼓勵考第二次基測。所以專家們和現實總是有點距離的 (大笑三聲):D

Wednesday, June 20, 2007

究竟要不要考第二次基測

每年國中基測結束後,國內新聞媒體照例都要發表些應景文章,在這其中,教育部和師大心測中心連著兩年強調根據統計,考生參加兩次基測之間的分數差距不超過一分,因此不鼓勵學生考第二次基測,是所謂官方意見的基調

我在6月1日,針對這個統計數字的說法,寫下我的意見,對於這個沒有憑據,不知道如何驗證的數字,我的基本想法是懷疑,寫論文要把參考文獻說清楚講明白,為什麼心測中心基本學力測驗推動工作委員會的網站,都找不到相關的統計報告。

今天(2007/06/20)聯合晚報的頭條新聞─「不考二次基測 吃悶虧」公布了中研院統計科學研究所研員究林妙香博士所作的研究,她的研究結果認為,參加二次基測考生平均進步0.1~8.7分,在競爭激烈的基北區考生,只考一次基測就參加登記分發,名次最多往後掉4000名。不考二次基測簡直是「大吃悶虧」

在沒有看到研究報告之前,我們沒有辦法確認究竟哪一方的說法比較接近事實。以我先前找到的資料為例,即便是心測中心的研究員,在對外談到對於兩次基測間分數差距,都有不同的結論(參考拙文第二次基測)。更何況不同的研究單位,以不同的切入方式作的研究。雖然就目前所能掌握的資料來看,還不能斷定究竟研究的正確性和考靠度;但是我個人非常認同同林博士所強調的程序正義主張,至少,這是理性討論的基礎。
林妙香本人也在研究中呼籲基測中心的資訊應更透明化,符合三個程序正義,一是正確的學理應用,二是內部計分流程應與公布於大眾的「計分遊戲規則」相符相合;三是擇優政策隱含的名次排擠效應的資訊,應該透明化。
就我個人找資料的經驗,相關資料的缺乏,是繼續追蹤瞭解這個問題的最大障礙,為什一個關心教育政策的公民,很難找到教育政策的研究報告,這是我心頭最大的質疑:
從十年前所謂教改開始,我們可以發現一個現象,無論是教育政策的規劃者、執行者、批評者,對於教育政策的討論(甚至辯論),都是憑著常識、猜測和各自的立場,在瞎攪和、打爛仗(恕我用這麼激烈的字眼)。

兩 次基測之間究竟有沒有成績的差異,我們聽不到一個統一的說法,而且我們也看不到相關的資料和研究報告。尤有甚者,2009年還會不會有基測,我們也聽到政 務委員有不同的說法。擬定政策的人,講不出政策的依據和理念;為政策辯護的人,講不出政策好在哪裡;已經實行的政策,我們看不到檢討的動作和報告。
這個議題,很快就在媒體的大量資訊中「滅頂」,離開大眾的眼光。但是這則新聞所揭露的問題,無疑還會影響我們的下一代很久很久。

Friday, June 8, 2007

Association Rules born during a lunch break

News.com 在 2004年有一篇報導誇大的敘述方式,說 Data Mining 源頭起自一個午餐約會,


故事是這樣開始的...

九零年代初期,一個連鎖百貨業者 Marks Spencer 的高階主管向 IBM 的資料處理專家 Dr. Rakesh Argrwal 說明他們的窘境,百貨公司收集了許多客戶的資料,但是他們不知道怎樣應用這些資料。Dr. Argawal 帶領他的團隊,研究這個課題,在 1993 年,Dr.Argawal 和他的同事 Dr.Tomasz Imielinski 和Dr. Arun Swami 共同發表了一篇在資料挖掘(Data Mining)領域具有里程碑意義的論文 - Mining Association Rules between Sets of Items in Large Databases

這篇文章提出一個交易購物分析的方法(Methodology),分析購買品項間的關係,據以歸納出購買行為的關連。這樣的分析方法,被稱為關連法則(Association Rules),是資料挖掘領域裡最常被使用的方法之一。

最有名的關連法則應用範例,大概是「尿布與啤酒」的傳奇了。這則故事,在網路上可以找到許多不同的版本,主人翁的名字在不同版本中有不同面貌,但是這個故事的主要精神,從交易資料中發現購買品項間的關係,進而提升交易金額的精神,則 retold and retold from classroom to classroom。

根據 CiteSeer 的統計,這篇文章是 Data Mining 領域被引用次數最多的論文,在所有文章中排名13, 第15名的論文則是這篇論文的後續研究 - Fast Algorithms for Mining Association Rules 。Wikipedia 將這篇論文,列入資料庫研究領域影響力最深遠的論文之一。

這篇論文的可貴,在於他的「開創」特質,尋找 association 的分析架構,影響了後續非常多的研究,而 Argawal 的團隊在這個研究的基礎上,也作了許多的改善和後續研究,將這個研究方向擴展的更深、更廣。

根據我之前作的文獻整理,學術界一般公認 1989 年舉辦的 IJCAI workshop on Knowledge Discovery in Databases 是第一個以 Data Mining & KDD 為主題的學術活動,在我寫的 Birth of Data Mining 中有說明。所以若說 Data Mining 源自這個午餐約會,是稍嫌誇大了點。

不過, association rules born during a lunch break 倒是恰到好處,名實相符 :)

Monday, June 4, 2007

Netflix recommender prize

如何提升現有客戶對企業營收的貢獻度,是所有行銷人員的最大挑戰之一。尤其是線上零售商(online retailer),必須盡一切力量,將客戶盡可能留在自己的網站,促使客戶購買更多產品,畢竟在線上世界每個商家的距離只是 one click away 而已。

所以企業主如何將手中擁有的客戶資料,轉換成有用的資訊,是需要行銷和資訊科技兩個專業共同合作的重大課題,這個研究課題就是所謂的推薦系統 (recommender)。

網路上,最常被人稱道、引用的 recommender 範例,首推網路書店 Amazon.com 和線上光碟租售服務的 Netflix 。 對於 IT 建設投資一向大手筆的 Amazon ,還為該公司自行開發的演算法申請專利,IEEE Internet Computing 雜誌在 2003 年,刊出了一篇由 Amazon員工撰寫的文章,簡介Item-to-Item Collaborative Filtering 演算法和設計背景。

Netflix 公司在去年十月宣布舉行一個 recommender競賽,廣邀天下英雄,以現在 Netflix 正上線使用中的推薦系統為競爭標的,目標是改善推薦系統的準確度,參賽者必須至少要比現行系統準確10%才能獲得 1百萬美元的獎金。根據紐約時報的報導,目前共有來自150個國家的18,000個團隊參加這場競賽。報導中中指出,現在的領先者來自匈牙利(Hungary)。

這個競賽是個很有趣的點子,顯而易見地,提升 Netflix 在線上世界與學府的知名度只是件小事;更有意義的是,這是一個廣邀世界各地研究者參加的大型腦力激盪,不僅推動了這個領域的研究,Netflix 的研發和行銷單位必然從世界各地來的企畫書學到許多,若干時日後,不知道我們會看到什麼樣的招數在江湖上出現。

不知道有沒有台灣的團隊參加這個競賽

惱人的貼紙

這幾年的大型書局的促銷活動,常為主打書籍的上環上書腰,要不就是在封面貼上促銷主題的貼紙,貼紙上大多都是 xx 讀書節加上促銷折扣的字樣。每回拿了這種臉上毀容的書籍回家,總是覺得一本書被貼上這種礙眼的標記,實在是美玉蒙塵,常忍不住想將書的臉皮上礙眼的貼紙除去,但是每回衝動之後,事後卻是更多的悔恨。

早些年的貼紙品質較差,絕無可能將貼紙撕開,因為膠水已經和底層的紙張融在一起,若要將貼紙從封面上除去,結局只有落得再次毀容,擴大傷痕。

這幾年的貼紙似乎有點進步,但距離「可接受」的標準還遠得很。如果書的封面是表面光滑的銅板紙還好,用心點還是可以把貼紙一點點、一點點摳起來,但還是不免留下指甲痕,讓追求完美的書籍主人心痛得很;如果封面是像《門外漢的京都》那種表面略微粗糙的紙質,若想把貼紙撕下來,鐵定把封面毀得「花容失色」,不忍卒睹了。

這些年書籍行銷產業已經有很大的進步,為什麼不在這一點上想個辦法呢 ?

Friday, June 1, 2007

第二次基測

今年度的第一次國中基測剛結束,媒體的文教版和社會版,一如往年,馬上就有分數預估和「要不要」參加第二次基測的「攻略」建議等等的文章。原本認為這些都是每年照例的應景文章,無非就是些老生常談而已,比如可以補償意外或是臨場失常,或是多一個月時間可以準備,成績應當會有所提升;也有人從心理的疲乏著手,覺得不必讓考生這麼辛苦,再來一次,結果未必會更好等等。

不過,在國語日報看到一篇關於過去統計資料的報導後,突然覺得這是個有趣、值得琢磨的問題。因為自己的迷糊,竟然把報紙丟到回收紙箱裡,再也找不回來。所以透過網路,想找到文章的原始依據,順道看看還有沒有更深入的資料和探討。

讀了些網路上找到的資料之後,越看越覺得這個問題的深度,遠超過自己原先的考慮。

再給自己一次機會

既然是要不要的命題,當然有正反兩種意見。贊同的大致以「再給自己一次機會,為什麼不好好把握」為主軸,有些名為新聞,骨子裡實則為補習班張目的置入性行銷,當然也充分表達了他們的立場。

我覺得真正有意思的,是在網路城邦找到一篇文章,是一位家長的現身說法,還提出了武陵高中的統計資料,作為佐證。我不知道武陵是否有公開這樣的資料,所以我對這位家長的背景有點好奇。

Dear bju,

非常贊成您的說法,我女兒第一次考了268,原本想90%可以上武陵 (學校老師們,報上社論,也都認為今年錄取分數會降低,加上她國英都滿分,要比分數應也佔優勢),因此她不願再考第二次,我們也就尊重她的選擇!哪知,第 二次會考得如此簡單,說會等化計算,似乎也並沒如此!放榜結果,是上了桃中,雖第二次基測PR值公佈後,已有心理準備,但真的是好失望,也很難過!!

第一次17635%
第二次32365%
總計499

宜蘭縣立文化國中,則在學校的網站,公布了一份『從學測及寫作命題趨勢分析談教師效能教學』歷程記錄,主講人是台灣師大心測中心張道行研究員,在會議過程中有一段關於第二次基測的問答:

(3)第二次基測會比較簡單還是比較難?
答:不一定,但是第二次基測的平均分數通常比第一次高,推測原因是第二次基測的準備時間較長,唸得比較熟。
(4)要不要鼓勵學生考第二次?
答:視學生經濟狀況及鬥志而定。
(5)PR值與量尺分數有何不同?
答:第二次PR值沒有意義,僅供參考(由於部份考生未參加第二次基測);考生個人可以「總分」來比較是否進步。

這份資料,比較值得關注的是這份資料的權威性,因為第三點的回答,究竟是不是心測中心的研究成果,是一個關鍵問題。

兩次成績差距不大

雖然不小心丟了國語日報的原始資料,在聯合新聞網的校園博覽會裡,找到『準備二次基測》四種狀況可考慮』,我相信這篇文章裡所提到的師大心測中心的統計,應該是我原先看到報導的根據。

國中基測諮詢委員、北縣教育局長劉和然說,四種學生可審慎考量,第一種是因緊張或高溫表現失常者,「如果跟平常成績差不多的同學相比,基測分數明顯偏低, 就算失常。」第二種是首次基測時感冒、身體不適者,第三種是下學期以來每次模擬考都持續進步者,第四種是考生本身極有意願者,「而不是因家長有強烈意願再 考一次!」

...... (省略)

劉和然也表示,根據師大心測中心所做的統計,將所有參加二次基測的考生前後成績加以比較,發現平均分數相差不到一分,「不鼓勵學生考兩次。」


除了今年(2007)聯合新聞網的新聞外,我還發現 2005/06/24 的東森新聞報,也有類似的報導,只是劉和然先生當時的身份是教育部國中基測指導委員、台北縣義學國中校長

這個在 2005 和 2007 年都被引用的數字,究竟是哪裡來的,我們能不能一窺究竟。這個說法,和文化國中舉行的研討會的討論,有很大的差異,到什麼才是我們能相信的說法。

要不要參加第二次基測,是家長和考生的共同抉擇,每個人走的路和後果,都是自己和家庭要共同承擔的,作為外人,當然沒有發言權。關於第二次基測,補習班怎麼說,是商人的觀點,也不是我關心的重點。國家教育政策的統計數字,怎麼會有不同的版本,才是我關注的重點

統計資料難得

套一句一個老朋友的口頭禪,依小弟愚見,這個「「平均分數相差不到一分」的研究,延伸下去,有很多後續的題目可作。從考試的效度、統計方法、考生心理、試題設計出發,就有很大的討論空間;兩次基測之間,家長、學校的配合;若是不考第二次基測,應該有孩子怎樣的輔導和幫助,讓他們更順暢的走入下一個學校。

不過,在心測中心基本學力測驗推動工作委員會的網站,都找不到相關的研究報告和統計資料,這是相當令人遺憾的事。

從十年前所謂教改開始,我們可以發現一個現象,無論是教育政策的規劃者、執行者、批評者,對於教育政策的討論(甚至辯論),都是憑著常識、猜測和各自的立場,在瞎攪和、打爛仗(恕我用這麼激烈的字眼)。

兩次基測之間究竟有沒有成績的差異,我們聽不到一個統一的說法,而且我們也看不到相關的資料和研究報告。尤有甚者,2009年還會不會有基測,我們也聽到政務委員有不同的說法。擬定政策的人,講不出政策的依據和理念;為政策辯護的人,講不出政策好在哪裡;已經實行的政策,我們看不到檢討的動作和報告。

誰來告訴我,作為關心教育政策的公民,要到哪裡去找這些不應該是秘密的統計數字。如果我們要有一個更好的台灣,更好的教育政策,給孩子更理想的成長環境,除了打嘴砲,我們有更多該作的事啊...

做一個更好的馬克杯

做一個更好的人,可以過上更好的生活,所以「我」要做一個更好的馬克杯!! Image Source: I NEED COFFEE: Life is Coffee Comics #23