中美大语言模型竞逐:全球视角下的机遇与挑战
随著大语言模型被应用到越来越多的领域,如何在中美两国的竞争动态中找到平衡点幷推动合作,将成为未来几年的发展关键。
自从 ChatGPT 问世以来,大语言模型LLM(Large Language Model)迅速成为全球科技竞赛的焦点。这些模型不仅在对话类比、数据处理、创意任务等方面展现出非凡的能力,更被视为迈向通用人工智能AGI(Artificial General Intelligence)——即具备人类般认知和推理能力的人工智能—— 的关键一步。 这场技术革命激发全球投资热潮,也将中美两国在人工智能领域的竞争推向新的高度。根据斯坦福大学发布的《2024人工智能指数报告》,美国在基础模型研发方面持续大幅领先,而中国无论在AI专利申请和成功获取专利数量上均位居榜首,反映两国在技术创新发展中有不同路径与策略【注 1】。在这一背景下,深入了解幷比较中美两国大语言模型的发展现状,不仅有助于洞悉这场竞争的格局,还为未来国际合作提供了新的视角与机会。
大语言模型的多语言表现是衡量其全球竞争力的重要标准。虽然ChatGPT在英文环境中表现出色,但在其他语言环境中的能力仍需进一步验证【注 2】; 同样,源自中国团队或原生于中文的大模型在本土语境中表现优异【注 3】,但在英文测试中可能仍有不足,全面了解这些模型在不同语言环境中的表现尤其重要。为此,我们通过系统性的评估框架,在2024年上半年对16个具代表性的大语言模型进行了中英文表现的比较【注 4】【注 5】。这些模型来自中美两国的技术巨头、顶尖大学,以及人工智能领域的新锐初创企业。
在英文环境的测试中,GPT-4 Turbo凭借其卓越的自然语言能力和学科专长排名第一; 而Gemini Pro和Llama 2则分别位列第二和第三。中国的文心一言4(ERNIE Bot 4)是英文测试中表现最佳的国产模型,综合排名仅达第五位,略高于Claude 2和GPT-3.5 Turbo,唯未能超越GPT-4【注 5】。 在中文测试中,文心一言4则超越GPT-4 Turbo排名第一,整体表现最佳【注 4】。总体来看,中国的领先模型在中文环境中的表现强劲,但在其他语言环境下仍有较大提升空间。
随著大语言模型技术不断成熟,LLM正迅速向多模态与跨领域应用扩展,成为AI发展的新蓝海。多模态能力让模型不仅能够处理文本,还能理解和生成图像、音频和视频内容,大大拓宽了其应用场景。例如,OpenAI最新推出的GPT-4o能够同时处理文本、语音和视觉信息,为增强现实、智能监控和自动驾驶等应用提供了新的可能性。
与此同时,LLM的跨领域应用也在不断加速。微软与OpenAI合作,把GPT-4深度集成到办公软件中,帮助用户提高工作效率; 百度的文心大模型不仅用于搜索引擎,还被广泛纳入企业客服和智能家居等场景。此外,垂直领域LLM也层出不穷。例如上海人工智能实验室(上海AI实验室)与瑞金医院合作推出“浦医2.0”(OpenMEDLab2.0)医疗多模态基础模型群,旨在赋能智能影像诊断、虚拟手术、智慧临床决策等应用场景建设,为未来的“AI医院”提供支持。这些应用案例不仅充分展示LLM的多样化潜力,也催生市场对高性能、高安全性AI模型的强烈需求。
展望未来,大语言模型的发展将重点围绕多模态能力的进一步深化、跨领域应用的扩展,以及安全性与伦理责任的提升。目前,美国在基础技术开发和创新应用上具有明显优势,其模型往往在技术前沿上表现出色; 而中国的模型更强调针对本土语言环境的优化和实际应用的适应性。随著LLM被应用到越来越多领域,如何在两国的竞争中找到平衡点幷推动合作,将成为未来几年的发展关键。
中美两国的竞争和合作不仅影响著各自的科技生态,也对全球AI产业的发展方向产生深远影响。在此背景下,香港凭借其独特的国际化背景,以及金融、科技和区位优势,有望成为全球竞争与合作中的重要桥梁。通过推动技术、人才和政策的多方协作,香港将会在国际研究交流、技术转移和产业合作中发挥重要作用,带领探索人工智能的无限潜力。
【注 1】:https://aiindex.stanford.edu/wp-content/uploads/2024/05/HAI_AI-Index-Report-2024.pdf
【注 2】:http://arxiv.org/abs/2302.04023
【注 3】:https://cevalbenchmark.com/static/leaderboard_zh.html
【注 4】:https://www.hkubs.hku.hk/aimodelrankings/report
【注 5】:https://www.hkubs.hku.hk/aimodelrankings/report/en
蒋镇辉教授
港大经管学院创新及资讯管理学教授
李佳欣女士
港大经管学院创新及资讯管理学博士生
(本文同时于二零二四年九月十九日载于《FT中文网》“明德商论”专栏)