中美大語言模型競逐:全球視角下的機遇與挑戰
隨著大語言模型被應用到越來越多的領域,如何在中美兩國的競爭動態中找到平衡點幷推動合作,將成爲未來幾年的發展關鍵。
自從 ChatGPT 問世以來,大語言模型LLM(Large Language Model)迅速成爲全球科技競賽的焦點。這些模型不僅在對話類比、數據處理、創意任務等方面展現出非凡的能力,更被視爲邁向通用人工智能AGI(Artificial General Intelligence)——即具備人類般認知和推理能力的人工智能—— 的關鍵一步。 這場技術革命激發全球投資熱潮,也將中美兩國在人工智能領域的競爭推向新的高度。根據斯坦福大學發布的《2024人工智能指數報告》,美國在基礎模型研發方面持續大幅領先,而中國無論在AI專利申請和成功獲取專利數量上均位居榜首,反映兩國在技術創新發展中有不同路徑與策略【注 1】。在這一背景下,深入瞭解幷比較中美兩國大語言模型的發展現狀,不僅有助于洞悉這場競爭的格局,還爲未來國際合作提供了新的視角與機會。
大語言模型的多語言表現是衡量其全球競爭力的重要標準。雖然ChatGPT在英文環境中表現出色,但在其他語言環境中的能力仍需進一步驗證【注 2】; 同樣,源自中國團隊或原生于中文的大模型在本土語境中表現優异【注 3】,但在英文測試中可能仍有不足,全面瞭解這些模型在不同語言環境中的表現尤其重要。爲此,我們通過系統性的評估框架,在2024年上半年對16個具代表性的大語言模型進行了中英文表現的比較【注 4】【注 5】。這些模型來自中美兩國的技術巨頭、頂尖大學,以及人工智能領域的新銳初創企業。
在英文環境的測試中,GPT-4 Turbo憑藉其卓越的自然語言能力和學科專長排名第一; 而Gemini Pro和Llama 2則分別位列第二和第三。中國的文心一言4(ERNIE Bot 4)是英文測試中表現最佳的國産模型,綜合排名僅達第五位,略高于Claude 2和GPT-3.5 Turbo,唯未能超越GPT-4【注 5】。 在中文測試中,文心一言4則超越GPT-4 Turbo排名第一,整體表現最佳【注 4】。總體來看,中國的領先模型在中文環境中的表現强勁,但在其他語言環境下仍有較大提升空間。
隨著大語言模型技術不斷成熟,LLM正迅速向多模態與跨領域應用擴展,成爲AI發展的新藍海。多模態能力讓模型不僅能够處理文本,還能理解和生成圖像、音頻和視頻內容,大大拓寬了其應用場景。例如,OpenAI最新推出的GPT-4o能够同時處理文本、語音和視覺信息,爲增强現實、智能監控和自動駕駛等應用提供了新的可能性。
與此同時,LLM的跨領域應用也在不斷加速。微軟與OpenAI合作,把GPT-4深度集成到辦公軟件中,幫助用戶提高工作效率; 百度的文心大模型不僅用于搜索引擎,還被廣泛納入企業客服和智能家居等場景。此外,垂直領域LLM也層出不窮。例如上海人工智能實驗室(上海AI實驗室)與瑞金醫院合作推出“浦醫2.0”(OpenMEDLab2.0)醫療多模態基礎模型群,旨在賦能智能影像診斷、虛擬手術、智慧臨床决策等應用場景建設,爲未來的“AI醫院”提供支持。這些應用案例不僅充分展示LLM的多樣化潜力,也催生市場對高性能、高安全性AI模型的强烈需求。
展望未來,大語言模型的發展將重點圍繞多模態能力的進一步深化、跨領域應用的擴展,以及安全性與倫理責任的提升。目前,美國在基礎技術開發和創新應用上具有明顯優勢,其模型往往在技術前沿上表現出色; 而中國的模型更强調針對本土語言環境的優化和實際應用的適應性。隨著LLM被應用到越來越多領域,如何在兩國的競爭中找到平衡點幷推動合作,將成爲未來幾年的發展關鍵。
中美兩國的競爭和合作不僅影響著各自的科技生態,也對全球AI産業的發展方向産生深遠影響。在此背景下,香港憑藉其獨特的國際化背景,以及金融、科技和區位優勢,有望成爲全球競爭與合作中的重要橋梁。通過推動技術、人才和政策的多方協作,香港將會在國際研究交流、技術轉移和産業合作中發揮重要作用,帶領探索人工智能的無限潜力。
【注 1】:https://aiindex.stanford.edu/wp-content/uploads/2024/05/HAI_AI-Index-Report-2024.pdf
【注 2】:http://arxiv.org/abs/2302.04023
【注 3】:https://cevalbenchmark.com/static/leaderboard_zh.html
【注 4】:https://www.hkubs.hku.hk/aimodelrankings/report
【注 5】:https://www.hkubs.hku.hk/aimodelrankings/report/en
蔣鎮輝教授
港大經管學院創新及資訊管理學教授
李佳欣女士
港大經管學院創新及資訊管理學博士生
(本文同時于二零二四年九月十九日載于《FT中文網》「明德商論」專欄)