經濟學的哥白尼式革命
被要求預測股票市場或宏觀經濟表現,是經濟學家經常遇到的「職業風險」。經濟學家對此往往無可奉告,皆因研究股市或宏觀經濟現象的學者為數甚少。所幸芝加哥大學經濟學教授利維特(Steve Levitt)在其暢銷名著《怪癖經濟學》(Freakonomics)中向大眾展示,經濟學家也會分析如警察數目和墮胎合法化對罪案率的影響、相撲手在賽事中作弊的誘因等,看似不屬於經濟學核心研究的問題。但有賴今年諾貝爾經濟學獎三位得獎者:加州大學伯克萊分校的卡德教授(David Card)、麻省理工學院的安格里斯特教授(Joshua Angrist)、史丹福大學的因本斯教授(Guido Imbens)的奠基工作和努力宣導,此等問題已經成為經濟學研究的主流之一。
也許有人會質疑:上述問題在當前的大數據時代能被輕易解決。以警察數目如何影響罪案率為例,只要先搜集不同城市的罪案率和警察數目,自然能夠梳理兩者之間的關係;但當中的難處在於,每座城市各具特點,對照其中的罪案率好比張冠李戴,無甚參考價值。在今年諾貝爾經濟學獎得主展開其相關研究之前,經濟學研究(以至一般社會科學研究)向來力求張冠得以李戴,於是對照各類因素,包括城市人口、居民的社會經濟狀況等等,並且觀察同一城市罪案率隨着時間推移而產生的變化,再將不同城市對照分析,以檢視罪案率與警察人數如何相關。
不過,張冠畢竟不能李戴。還有另一個難題,就是因果關係中先有雞還是先有蛋之謎,令傳統研究方法的缺陷無所遁形。假如發現警察數目愈多,罪案率愈高,是否表示警察增多導致罪案率上升?還是因為在罪案率偏高的城市,政府往往多聘警察?同一道理,假如在某地出現醫生數目增加,病人數目也跟着增加的情況,那是否等於醫生令人生病?較為合理的解釋是,因為病人愈多,對醫生的需求也愈大。
先有雞還是先有蛋?
先有雞抑或先有蛋的難題,不論是政府、企業或個人做決定時都會碰到。以制定入境政策為例,政府需要先了解外來移民對本地勞工薪津的影響。假如發現新移民愈多,本地工資愈高,政府大概會下結論指新移民導致工資上升。但在「雞與雞蛋」的理論框架下,則有可能是因為本地的高工資引來了更多的新移民;在企業層面,航空公司機票愈貴、銷量愈多的現象,不一定等於機票貴導致需求增加。反而是因為航空公司在預期機票需求暢旺的日子(例如聖誕節)會提高票價。如果以父母為子女作升學決定為例,傳統智慧自然認為收生成績愈高的學校愈優秀。但說不定這類學校本身並非出類拔萃,不過由於校譽較佳,較能吸引自發努力的高材生而已。
「雞與雞蛋」正是社會科學研究的重點。有別於自然科學,社會科學的觀測變量通常並非隨機而成。上述提及的外來移民數目、機票價格、升學決定都並非隨機產生,而是個人取捨的結果。這類變量由非隨機性產生,若單把它們與利益變量(本地工資等)直接聯繫起來,其相關性則未能有效反映背後的因果。這類非隨機性變量的正式名稱是「內生變量」,而其導致的問題則稱為「內生性問題」。
內生性問題也對管理學研究造成困擾。舉例來說,企業和政府機構大多關注培訓計劃的成效。而評估成效的常用方法,在於對比學員在參加培訓前後的工資變化。普林斯頓大學經濟學者奧利.阿申菲爾特教授(Orley Ashenfelter)發現,參加培訓的學員,往往在接受培訓前,因為種種原因工資變少,可見參加培訓計劃的學員並不隨機。只看參加計劃前後的工資變化便會出現內生性問題。時運不濟被減了工資的學員,參加培訓之後漲了工資,不是因為培訓有效,只是因為時來運轉。
衡量培訓計劃成效的正確方法應以科學為本,亦即進行實驗。要辨識其中功效,可隨機分配培訓計劃的參加者,然後由研究人員對比參加者與非參加者的收入。阿申菲爾特教授的門生羅伯特.拉隆德教授 (Robert Lalonde)就曾採用此法進行研究,結果發現若沒有考慮工人並非隨機參加培訓,計劃的成效評估難免會大打折扣。
然而,這個方法在執行上有很大困難;在上文的移民政策例子中,政府不可能在各城市隨機分配外來移民。阿申菲爾特教授的另一位學生兼本屆諾貝爾經濟學得獎人卡德教授則有以下灼見:即使並無進行實驗,也會發生有如大自然作出實驗的事件,就如在1980年,古巴領導人卡斯特羅(Fidel Castro)容許其國民移民國外,以致美國佛羅里達州的入境移民數量即時大增,形成隨機變化。卡德教授於是根據這一激增數字,推算出外來移民對當地工資的因果效應。這個方法自此稱為「自然實驗」:正如在一般研究實驗中,自然發生的事件(例如上述卡斯特羅的決策)引致內生變量(外來移民數目),從而產生隨機變化。因此,即使變量本身有內生性,其所產生的變化卻屬外生性,據此可以估算出有關內生變量的因果效應。
運用自然實驗辨識因果效應的方法,在曾受業於阿申菲爾特教授和卡德教授的安格里斯特教授(Joshua David Angrist)手中發揚光大。其研究結果顯示,徵兵抽籤號碼足以影響越戰時期美國人的入伍決定,因而成為自然實驗,讓他從中估算入伍對個人畢生收入的影響。安格里斯特教授和克魯格教授(Alan Krueger;另一位普林斯頓大學經濟學者,若仍在世,筆者認為他可奪本年諾貝爾經濟學桂冠)發現部分人的出生季節,對其接受學校教育年期有所影響。研究人員藉此再估量在學年期對工資的影響。
此外,安格里斯特教授和埃文斯(William Evans)發現,家庭中若頭兩胎均屬同一性別,那麼生第三胎的機會就較高。頭兩胎的性別組合於是成為自然實驗,讓研究人員從中找出多一胎(第三胎)對母親收入的影響。安格里斯特教授還研發出其他巧妙的研究工具,為數眾多,不能盡錄。他的研究成果豁然確斯,工具更因易於上手而成為實證研究的楷模。筆者多年前在麻省理工學院上過他的課,並曾任其教學助理,獲益匪淺。
當然,自然實驗並非真正的隨機對照實驗,仍需進一步釐清其發揮效力的條件,安格里斯特教授和因本斯教授為此已完成基礎工作。除此之外,上述三位獲獎教授都培育出新一代頂尖經濟學者,聚焦研究有關內生性問題。他們對於實證研究的執行方法有舉足輕重的影響,足以構成經濟學上的一場哥白尼式革命。安格里斯特教授在麻省理工的高足迪弗洛教授(Esther Duflo;2019年諾貝爾經濟學獎得主),通過強調因果關係,為發展經濟學帶來革命性的變化,並且將實地實驗普及化,以便加深世人對扶貧之道的了解。
本屆諾貝爾經濟學獎得主的著作所產生的影響,恐怕有待多年之後,大家方能全面體會。在商業策略和管理的範疇中,內生性問題雖仍未獲足夠重視,但大勢已成。此外,內生性問題也在大數據和人工智能時代造成新挑戰。
根據筆者與香港大學的同事羅曄博士和張曉煒博士的研究,機器學習可令內生性問題惡化,導致對於各項政策的評估錯上加錯。內生性問題還會在機器學習中產生自證偏見(self-fulfilling bias),導致不同人對同一事實,各有不同但一致的版本。我們的研究結果也顯示,上述三位得獎經濟學家所研究出的實證研究方法,可納入機器學習的演算法中,從而改善決策。他們的研究為解決內生性問題提供有效工具,堪稱價值永恒,同時有助於大家在紛紜時局中發掘真相。
李晉教授 港大經管學院教授(管理及商業策略、經濟學)
(本文同時於二零二一零年十月二十日載於《信報》「龍虎山下」專欄)