閱讀英文技術文件或是學術文章時,理清專有名詞定義,固然是閱讀攻關的第一個障礙;但是越常見的詞彙,越是常識(common sense)性的字眼,給讀者帶來的困擾可能更大(其實這個問題不是特定語言的問題,只要閱讀非母語文件都會碰到這個問題)。
尤其是成對出現用以對比、強調、區隔的字彙,常常埋著理解的最大陷阱,通常這類字彙在原本語言中都有不只一種意義,但是恰巧其中一種意義翻譯成中文之後,兩個字眼的意義是相同的。
比如說 model 和 pattern 在某些情況下都可能翻譯作「模式」, classification 和 categorization 都是「分類」,我們明知道兩個字的意含不盡相同,但是翻譯成中文之後,兩個字眼變成同一件事,我們失去了「理解」與「區別」的線索。
我們當然知道 model 和 pattern 不是同一件事,但是我們講不清楚哪裡不同,這才是最大的難題。初入門 Data Mining 這門學問的學子,一定知道資料探勘的精髓是從大量數據中挖掘 hidden pattern,我們不會說挖掘 hidden model。但是如果這句話從中文翻回英文,你猜會是怎樣的句子?
下面是查閱手邊書籍和網路上的字典的結果,這裡沒有列出字典裡 model 和 pattern 所有的定義,只列出統計和資料挖掘類文件所使用的定義:
- A schematic description of a system, theory, or phenomenon that accounts for its known or inferred properties and may be used for further study of its characteristics.
- A hypothetical description of a complex entity or process.
- A model is usually represented by a mathematical function which describes and distinguishes data classes or concepts.
- A model is a high level, global description of a data set.
Pattern
- A perceptual structure; A composite of traits or features characteristics of an individual or a group.
- Pattern recognition is the process of assigning one of a finite set of labels to an observation.
- A pattern is a local feature of the data, perhaps holding for only a few records or a few variables (or both).
Global 與 Local 的對比說法出自 Principles of Data Mining,常閱讀 Data Mining 相關論文的讀者,可能對這樣的比喻可以心領神會,但是事情沒有這麼簡單, Principles of Data Mining 這本書可是用了超過四十頁(pp. 165-207)的篇幅解釋這兩者的差異呢。
不過,在大多數情況下,在恰當的時機「不求甚解」,不是什麼壞事。Model 和 Pattern 的區隔,不會妨礙我們讀懂一篇論文,面對這個問題,還是放輕鬆點吧 ;-)。總之,該念的書一定要念,千萬不要偷懶;其次,盡量提昇英文閱讀的理解能力,這是解決問題的不二法門。
( 本來只是想抄抄筆記而已,但是越想越多,越寫越遠,快要駕馭不了了,所以趕快煞車,就此打住。我想如果真的要細究下去, inference 是深入瞭解 model 這個字眼的關鍵字吧,不過再往下去真的要我的能力範圍了,所以... , grin ... )
Share this post : |
No comments:
Post a Comment