稱霸語言與電腦科學的當代學術大師:喬姆斯基的普遍語法理論

美國政治名嘴喬姆斯基 (Noam Chomsky) 還是引領語言學與電腦科學界的大師?人類學習語言時是天生有一個內在機制幫助我們快速上手、還是後天的刺激呢?

《讓電腦讀懂你的話:形式語言》系列將為大家初探語言學,與後續引響電腦科學的重要理論──喬姆斯基的普遍-生成文法。


所以… 語言到底怎麼來的?

為什麼要先為大家介紹「什麼是語言」與「語言有哪幾種」呢?

因為要瞭解語言是怎麼來的、探索人類的認知系統;要瞭解「機器能判定的語言」、要瞭解圖靈機,我們不能不懂語言學的基本概念。

我們是怎麼學習語言的?是天生機制還是後天反應刺激?

為何我們能夠自然地學會語言,說出無數合乎文法的語句?在各種紛歧語言的樣貌下,是否存在某種規則?

那要如何讓電腦也運用一個語言的符號體系來溝通呢?

 

喬姆斯基—20世紀最知名與最具影響力的學者之一

這邊開始,我們要來介紹一位大神——諾姆・喬姆斯基 (Noam Chomsky) 。

如果有人問:誰是當代最有影響力的學術大師?毫無疑問,喬姆斯基一定是最常被提起的名字。

他的頭銜包括了:麻省理工學院榮譽退休教授、現代語言學之父、美國哲學家、認知學家、邏輯學家、政治評論家…。

同時,他也是戰鬥力旺盛的左派政治運動者,出版了近百本書,是當代最常被引述的學者。(據麻省理工學院統計,喬姆斯基是 1980 – 1992 年間被引用次數最多的在世學者)

他的語言學理論,徹底顛覆了人們對語言和思維的看法。

一個偉大的理論,總能因為抓住問題的核心本質、而不受時代和學科領域的限制,喬姆斯基的理論橫跨哲學、數學、認知科學、電腦科學、心理學…。

他並不是電腦科學領域的人,然而現在我們使用的、能和電腦溝通的程式語言,都是來自於喬姆斯基在 1956 年提出的喬姆斯基譜系。

學習編譯器 (compiler, 將高階語言轉成低階語言) 的相關知識時,也必然要學習喬姆斯基譜系。

喬姆斯基在 1957 年時出版了顛覆性的《句法結構》一書。書中的理性主義方法論,對於當時在心理學和語言學領域都極為盛行的「行為主義」無異於打了狠狠的一巴掌。

 

行為主義 BEHAVIORIST

行為主義在 1940 – 1950 年代時大為興盛,其中一個有名的實驗就是「巴夫洛夫的狗」(Pavlov’s Dog)。

俄羅斯醫生與心理學家巴夫洛夫在餵狗的時候都會響鈴,讓狗習慣後,當鈴聲響起時就算沒有食物,狗也會分泌唾液。

古典制約、條件反射的經典案例

行為主義學者認為,人類的「知識」、或者說「行為」,都是因接受到刺激 (Stimuli) 而產生反應 (Response)。而所發出的反應會得到回饋 (Reinforcement)、又再度加強反應的循環。

所以人類的知識,單純只是在不同環境條件下、根據不同的刺激所產生的「刺激─反應─回饋」模式而已。

把行為主義套用在語言學,代表我們在作為幼童時期,多次錯誤嘗試之後,才學會一個語言。也就是說,語言只是一種習慣性的反應。

1950 年末期,行為主義在語言學領域大為興盛、語言學家們正興致勃勃解答了人類語言行為的一大難題時,一個不到 30 歲的年輕人——喬姆斯基,出版了一本叫《句法結構》(Syntactic Structure) 的書,引起了學界的大風暴。

1957 年出版的《句法結構》(Syntactic Structure)

普遍語法—人類天生內建語言學習的「知識系統」

喬姆斯基駁斥將行為主義運用在語言學領域——若要推論:環境中,我們出現的行為是因為接受刺激,那首先你要定義好什麼是「刺激」、與相對應會出現的「行為」啊?

比如我們看到一隻小貓,然後說:「貓咪好可愛!」但也可能會說:「爪子好尖銳」、「這種橘色真少見」、「我家有隻狗最怕這種貓了」、「哎地板好髒」… 人類會說出的話,有無限多種。

首先刺激的定義模糊、人類會做出的相應反應也模糊,到最後根本沒辦法單純藉著行為主義的「刺激反應論」,來預測人類和分析的行為。

況且,兒童在學習語言的時候,比起學習數學、化學等學科還更快,通常都是自然而然就學會了母語。

喬姆斯基批評行為主義學派過度強調外部環境的作用、忽略人類自身的認知能力。將動物研究中的行為原則,應用到實驗室之外的人類身上、來理解人類複雜的行為,是毫無意義的。

他認為——成年人的大部分智力活動都是「先天的」。儘管兒童並不是一生下來就會說某種語言,所有兒童都天生具有很強的語言學習能力,這種能力使他們得以在最初幾年中很快吸收幾種語言。

而人類的認知本能,是由許多心智器官模組,如聽覺、視覺等功能所組成的。

人類天生就帶有內建的「語言知識系統」,這套系統就像人類身體中的許多器官一樣,即為「心智器官」(mental organ)。

支持喬姆斯基理論的知名學者,還包括了語言學家 Stephen Krashen;他認為人類的大腦中有某個特定的區塊是專門用來「取得」語言的。

根據這些觀點,喬姆斯基提出自己的全新理論「普遍語法」(Universal Grammar)。

普遍語法並不是針對表面我們正在講的語言、或語法規則(比如英文文法時態等等),而是人類潛意識裡的思維結構和語言功能。

既然每個人天生就擁有這個「語言知識系統」,語言間的規則一樣、但因為輸入的參數不同,而學會不同的語言。

故兒童學習語言的過程,就是在輸入該語言的參數。生成學派的目標,就是尋找各種語言的原則(普遍共性)和確定參數。

此系統運作方式的簡單說明如下:

喬姆斯基認為兒童天生具備的「語言系統」能用於短語 (The nice dogs)和轉換短語(Cats are liked by the nice dogs)的規則。也就是兒童天生就有遵循該語言規則的語言能力。

該系統可以將詞填入語言插槽中——像是 nice (填入形容詞欄)、dogs(填入名詞欄)。

聽完喬姆斯基的理論後,你認同或不認同呢?究竟我們的腦袋中,是真的存在普遍語法的規則嗎?

到底有沒有普遍語法存在的證明呢?答案是:有的。

 

人腦存在普遍語法的可能—布羅卡區

事實上早在 1861 年,人類便已經發現大腦的語言中樞——布羅卡區(Broca’s area)的存在。

1861 年,法國外科醫生布羅卡 (Broca) 診斷了一位無法說話的病患。

布羅卡發現他的喉頭肌肉和發音器官都能正常運作,而且該病患也相當聰明,無心智缺陷、能藉助符號來進行交際。

在患者死後,布羅卡對屍體進行解剖,發現該病患在大腦左半球的第三個前額溝回有受傷。

 

布羅卡區損傷,會造成布羅卡失語症(Broca’s aphasia),又稱表達型失語症。患者會無法製造符合文法的流暢句子,會出現間斷的句子、像是電報式的話語。

以下是一位布羅卡失語症患者表達自己要去看牙醫的案例:

是…阿…星期一…阿…父親和Peter H…,
及父親….阿…醫院…及阿…星期三…星期三九點…以及
,喔…星期二…十點,
阿,醫生…兩個…醫生…及阿…牙齒…對的。

但患者能明確知道自己說話不流暢,且對於語言的聽、讀、寫也還是正常的。

也就是說,布羅卡區是大腦中負責產生協調的發音程序,並提供語言的語法結構。

(來源:icewerewolf

2003 年時,德國神經學家 Musso 的研究證實,人腦中先天存在一定的「普遍語法知識」使得人類大腦的神經系統在學習不同語言時,也能作出相對應的反應。

Musso 研究了 16 名母語為德語的受試人,在看到日語或義大利語後腦部的活動。這些人以前從來沒有接觸過這些語言。

在實驗前受試者記住了一些義大利語或日語詞彙。然後他們又學了六個日語或義大利語的語法規則;其中三個規則是真的、三個是假的,但受試者並不知道。

接下來受試者躺在一個磁共振掃描儀上以便觀察其腦部活動。

科學家們發現當受試者判斷依照真正的語法規則造成的句子時,受試者的大腦的布羅卡區馬上開始活動,而判斷由假的語法造成的句子,這一區域沒有顯著的活動。

這一實驗表明,大腦的布羅卡區只辨認符合普遍語法 (universial grammer)的規則,而對於不符合普遍語法的規則卻沒有反應。

除了心理學、神經認知科學之外,你知道喬姆斯基的語言理論還是對電腦科學有著超巨大的後續影響嗎?(敝人覺得堪稱和馮紐曼相提並論了)

喬姆斯基作為哲學家、語言學家與邏輯學家,本人並不涉及電腦科學領域;但他定義了四型文法,並用數學化的方式表達了每一型語言的表達能力。

後續被應用在電腦科學領域上,對高階程式語言的發明有著極為巨大的貢獻。

 

今日的電腦程式都在用喬姆斯基語法—高階語言與編譯器

還記得我們在 看ARM如何搶走英特爾的x86市場 一文中,曾向大家介紹過:

電腦唯一能讀懂的語言就是二進位制的「機器語言」 (Machine Language),由0與1組成,比如 00101001010101100111… 別說你會撰寫到發瘋,連看懂都有困難。

ARM-x86處理器架構之爭-05

因此後來又發展出了「組合語言」 (Assembly Language),改用較短的字串取代機器語言的0與1,讓人類比較好看的懂。

ARM-x86處理器架構之爭-04

組合語言每一行直接對應到的幾乎就是一個機器碼,高階語言則無。

ARM-x86處理器架構之爭-03

這個流程簡單來說,就是高階語言 (C/C++) 得透過編譯器 (Complier) 轉成組合語言 (Assembly Language)、再透過組譯程式 (Assembler) 轉譯成機器碼 (Machine Code),機器才能讀得懂。

1950 年代的電腦程式都還是機器語言,也就是所有的指令只能用 0 與 1 的排列組合來表示,這使得寫程式、除錯、修改程式都相當浪費時間。

美國電腦科學家約翰·巴克斯(John Backus)當時在 IBM 工作,後來向老闆提出:應該開發比較接近人類語言的高階語言,更方便編程。

他根據喬姆斯基的語法理論,終於在 1957 開發出全世界第一套高階語言 Fortran,以及將之編譯成機器語言的編譯器。

從此以後,人類可以使用人類和電腦都可以理解的語言、來撰寫電腦程式。

Fortran 公開之後,其它各種不同用途的各種高階語言也陸續問世。巴克斯也因為這個巨大的貢獻,於1977年榮獲電腦科學界的最高榮譽——圖靈獎。

(不然今天的工程師可能就得慘兮兮地用紙帶打孔的方式編寫二進制程式碼了)

 

太厲害了,喬姆斯基!

雖然喬姆斯基的理論在有些地方聽起來會令人質疑… 既然都是天生就具備相同的機制,那要怎麼解釋為什麼每個人的語言能力會有所不同?

或者既然都是把參數值、放到這個運轉機制裡面,為什麼母語和第二外語的學習速度會有差異。後來喬姆斯基也陸續修了好幾版自己的學說,以上介紹的並不是最終版。

但喬姆斯基提出的生成語法理論,挑戰 1950 年代以來、研究人類行為和語言中佔據主導地位已久的行為主義。

此後更激發了美國心理學從 1950 年代到 70 年代的「認知革命」——以從前的行為研究為主,轉變為認知研究為主,造就當代認知心理學 (Cognitive Psychology) 的興起。

另外,雖然普遍語法是關於兒童習得自然語言的理論,人工語言(世界語、形式語言)不屬於普遍語法的理論研究範疇。

但是任何人工語言,都可以按照符合普遍語法規則的方式進行設計。這也是後續喬姆斯基的理論之所以能被用來開發高階程式語言的原因。

基本上,喬姆斯基的理論至今為止仍毀譽參半,但是至少有兩點是所有人都會承認的:和早期的語言學理論比起來,普遍語法有著根本上的突破;也對後世的理論有著巨大影響。

語法規則後續被應用在電腦科學領域,也永遠改變了電腦、科技、程式的發展。

 

補充:喬姆斯基對使用機器學習演算法來做nlp的看法

2011 年麻省理工學院 (MIT) 舉辦了「大腦、心智與機器(Brians,Minds and Machines)」專題研討會。與會人士包括電腦科學的 Winston 教授與 Chomsky 教授。

期間 Winston 向 Chomsky 發問,如何看待機器學習、機率模型近年來被應用在自然語言處理 (NLP) 與認知科學領域的趨勢。畢竟機率的方法在喬姆斯基的年代並不是主流的研究方法。

Chomsky 回應如下:

(1)確實有許多研究工作在嘗試用統計模型來解決各種各樣的語言學問題。其中有一些取得了成功。但是大多數是失敗的。

(2)那些取得成功的應用,是因為把統計方法跟語言的基本理論(比如普遍語法 -> XD)結合起來使然。比如在連續語篇中如何識別單詞的邊界。

(3)如果不考慮語言的實際結構就應用統計方法,那麼所謂的成功不是正常意義下的成功。就科學研究的歷史經驗來說,這種意義上的成功並非主流。

這就好像研究蜜蜂行為的科學家只是對著蜜蜂錄影,通過記錄蜜蜂的歷史行為資料,來預測蜜蜂未來的行為。可能機器學習方法可以預測得很好,但這算不上科學意義上的成功。

意思就是你們實務上做得很好、預測得很準,但理論上不求甚解 XD 這的確是機器學習方法頗被詬病的一項問題。

另外喬姆斯基認為機器學習等同於一種行為主義 (Behavorism),動物的行為可以被簡化為獎勵與反應的關聯,但事實上機器學習並不是行為主義,現代的機器學習方法並不只找到成對刺激之間的關聯。

只能說,喬姆斯基有一張統計學習不能做到的事情的清單,然而這張清單已經過時 50 年了…

 

題外話… 喬姆斯基在美國上是一位超級政治名嘴

對於美國一般民眾來說,喬姆斯基在語言學上的貢獻,可能還不及他在政治評論上的知名度。

在學術圈內,喬姆斯基是被引用次數最多的在世學者,有著「語言學界的愛因斯坦」之美譽。在學術圈外,他卻是美國政治評論界知名的異議人士、美國激進派政治人物的代表。

在喬姆斯基的嘴裡,似乎永遠吐不出美國政府的一句好話。《現代美國哲學家辭典》 將喬姆斯基稱為「美國外交政策的左派批評者中最有影響的人之一」。

喬姆斯基參與政治活動的主要方式,是為雜誌撰文,寫專著及發表演說;同時也是政策研究學院的高級學者。

在喬姆斯基本人的觀點中,他自稱無政府主義者,挑戰並試圖消除一切不正當的等級制度,尤其認同無政府主義中、以勞工為核心的無政府工團主義。

最為知名的評論,包括了他對於 911 事件的評論。

2001 年 911 事件發生當月,喬姆斯基的《9-11》一書便立刻上市,反指「美國本身便是頭號恐怖主義國家」。

在台灣有由大塊文化出版社的中文版,但目前已絕版。

他表示,儘管賓拉登所做的事慘絕人寰,但相比美國過去半個世紀對其他國家犯下的暴行,仍是微不足道。

從古巴、越南、印尼到尼加拉瓜,從土耳其、伊拉克到科索沃,從東帝汶到哥倫比亞;乃至從聯合國到世貿組織…

美國總是把一些不聽使喚的國家稱為「流氓國家」(rogue state),但是在喬姆斯基的說法中,美國才是真正的「流氓國家」、最大的邪惡中心。

(老實說在國家還在舉國哀悼的氣氛下,發表這種言論真的是很敢… 喬姆斯基說他在麻省理工學院教書時有警察來保護他免得出事 (´_ゝ`) )

 

在經濟議題上,喬姆斯基把支撐美國經濟霸權的新自由主義,定義為「全球資本主義利益」的制度。

他毫不留情地批判,凡是按照西方自由市場經濟的原則來制定發展政策的第三世界國家,絕大多數換來的只是貧窮、落伍和動亂。

在《世界秩序的秘密:喬姆斯基論美國》一書中,揭示了美國的新自由主義是如何將國家與壟斷企業一體化,成為一種壓迫多數人、剝奪多數人利益的暴力機構。甚至,以美國為首的資本主義列強,才是成為國際恐怖主義的主要源頭。

 

再來,在傳播媒體的議題上,他認為:

  • 由於媒體的生存依賴廣告,所以內容要符合主流價值,使得廣告會對內容形成過濾。
  • 而媒體每天要填滿固定的版面和時間,因此需要固定的新聞來源,政府和商業組織恰好填補了這個空白,因此他們可以控制媒體的內容。
  • 政府或商業組織還可以通過民間或法律制度,發起對媒體的譴責,逼迫媒體就範。

到最後,媒體上只會出現——以色列是文明的國家,巴勒斯坦是恐怖組織的溫床;海珊是獨裁者,美國是去解放伊拉克;越戰是美國維護亞洲和平的舉動…。

總結來說,喬姆斯基認為雖然美國沒有傳統意義上的媒體審查,但因資本主義與媒體集團壟斷,還是會對媒體上登播的新聞進行過濾。

「極權主義國家控制人民用棒子,民主主義則是靠謊言」(Propaganda is to democracy what violence is to totalitarianism

— 諾姆・喬姆斯基(Noam Chomsky)

 

話說回來,儘管對美國百般批評,喬姆斯基還是生活在美國。

他的解釋是:「國與國之間的綜合比較沒有什麼意義,我也不會這麼比較。不過美國有些成就,特別是在言論自由方面,幾個世紀來的領先地位,是值得敬仰的。」

在這個政治光譜中找到喬姆斯基了嗎?橫軸是:左派 <-> 右派,縱軸是:集權 <-> 自由。

喬姆斯基是甘地右邊數過來第二顆頭喔!有沒有看到 Noam Chomsky 呢?