Tuesday, May 20, 2008

[微言大義] Models .vs. Patterns

閱讀英文技術文件或是學術文章時,理清專有名詞定義,固然是閱讀攻關的第一個障礙;但是越常見的詞彙,越是常識(common sense)性的字眼,給讀者帶來的困擾可能更大(其實這個問題不是特定語言的問題,只要閱讀非母語文件都會碰到這個問題)。

尤其是成對出現用以對比、強調、區隔的字彙,常常埋著理解的最大陷阱,通常這類字彙在原本語言中都有不只一種意義,但是恰巧其中一種意義翻譯成中文之後,兩個字眼的意義是相同的。

比如說 modelpattern 在某些情況下都可能翻譯作「模式」, classification 和 categorization 都是「分類」,我們明知道兩個字的意含不盡相同,但是翻譯成中文之後,兩個字眼變成同一件事,我們失去了「理解」與「區別」的線索。

我們當然知道 model 和 pattern 不是同一件事,但是我們講不清楚哪裡不同,這才是最大的難題。初入門 Data Mining 這門學問的學子,一定知道資料探勘的精髓是從大量數據中挖掘 hidden pattern,我們不會說挖掘 hidden model。但是如果這句話從中文翻回英文,你猜會是怎樣的句子?

下面是查閱手邊書籍和網路上的字典的結果,這裡沒有列出字典裡 model 和 pattern 所有的定義,只列出統計和資料挖掘類文件所使用的定義:

Model
  • A schematic description of a system, theory, or phenomenon that accounts for its known or inferred properties and may be used for further study of its characteristics.
  • A hypothetical description of a complex entity or process.
  • A model is usually represented by a mathematical function which describes and distinguishes data classes or concepts.
  • A model is a high level, global description of a data set.

Pattern

  • A perceptual structure; A composite of traits or features characteristics of an individual or a group.
  • Pattern recognition is the process of assigning one of a finite set of labels to an observation.
  • A pattern is a local feature of the data, perhaps holding for only a few records or a few variables (or both).

Global 與 Local 的對比說法出自 Principles of Data Mining,常閱讀 Data Mining 相關論文的讀者,可能對這樣的比喻可以心領神會,但是事情沒有這麼簡單, Principles of Data Mining 這本書可是用了超過四十頁(pp. 165-207)的篇幅解釋這兩者的差異呢。

不過,在大多數情況下,在恰當的時機「不求甚解」,不是什麼壞事。Model 和 Pattern 的區隔,不會妨礙我們讀懂一篇論文,面對這個問題,還是放輕鬆點吧 ;-)。總之,該念的書一定要念,千萬不要偷懶;其次,盡量提昇英文閱讀的理解能力,這是解決問題的不二法門。

( 本來只是想抄抄筆記而已,但是越想越多,越寫越遠,快要駕馭不了了,所以趕快煞車,就此打住。我想如果真的要細究下去, inference 是深入瞭解 model 這個字眼的關鍵字吧,不過再往下去真的要我的能力範圍了,所以... , grin ... )

 

Share this post :

No comments:

Post a Comment

如果我的心是一朵蓮花

~ 林徽因 · 馬雁散文集 · 蓮燈 ~ 馬雁 在她的散文《高貴一種,有詩為證》裡,提到「十多年前,還不知道林女士的八卦及成就前,在期刊上讀到別人引用的《蓮燈》」 覺得非常喜歡,比之卞之琳、徐志摩,別說是毫不遜色,簡直是勝出一籌。前面的韻腳和平仄的處理顯然高於戴...