
大国人工智能竞技场上的激战
美国OpenAI 公司自2022 年推出ChatGPT以来,就一直雄踞生成式人工智能(Generative AI )市场领导地位。AI 创新领域早已成为兵家必争之地,美国为了限制中国在此一领域的发展,禁止高端晶片出口中国,并限制中国用户使用ChatGPT,香港用户因而需透过虚拟专用网络( VPN )才能使用。2024 年,中国一间初创公司推出了深度求索(DeepSeek)生成式AI模型,却彻底扭转局势,剑指ChatGPT 的霸主宝座。
2025 年 1 月,DeepSeek 已超越 ChatGPT而成为美国iOS 应用商店下载次数最多的免费应用程式,导致辉达( Nvidia)股价下跌 18%。许多人不禁问:DeepSeek会就此取代ChatGPT 吗?
AI新星 一鸣惊人
DeepSeek与ChatGPT虽非棋艺类AI,但国际象棋大师罗兹曼(Levy Rozman)上月加以测试,两个AI模型在棋盘上博奕,结果DeepSeek使出《孙子兵法》的招数,以权谋反败为胜,击败ChatGPT。
DeepSeek由杭州一家名为“幻方量化”的AI初创企业于2023年成立,本年1月20日发布采用开源模式的新模型 DeepSeek-R1 ,提供流动应用程式及桌面版免费服务,随即在全球 AI 科技圈广受关注。该模型资料库使用截至2024年7月的讯息进行训练,并可根据需要,整合来自网路的更新讯息;
R1具备AI助手功能,包括编写歌词、制定企业发展计划,甚至按冰箱里现有食材写出一份餐单。R1又能以多种语言进行交流,在英语和汉语的水平尤为出色。此一模型在对答中详细展示其思维链(chain of thought),将推理过程透明化,用户可清晰了解AI的思考逻辑,甚至反向学习如何拆解复杂问题,产生实战解难之效。从奥数题到八卦新闻,从量子物理到中国文学,用户得以目睹机器的思路,由此引起的认知冲击,不失为人类向AI学习思考的起步。
白菜成本 超高效益
DeepSeek不但以开源方式分享模型,而被誉为“真正的OpenAI”,其基础模型V3的训练时间只需两个月,费用不过 558 万美元。新浪财经曾报导,DeepSeek购买了1万多块英伟达图像处理器(GPU),随后增至5万块,成本远低于动辄使用超过50万块GPU的OpenAI和谷歌等领先AI实验室。
一直以来,美国在生产高性能晶片的能力以及阻止中国获取相关技术的策略,被视为其在AI竞赛领域的极大优势。DeepSeek 的成功却促使业界反思,改良高端晶片是否提升 AI 模型的唯一要素。DeepSeek 只使用 2000 粒辉达H800晶片,就实现了媲美 ChatGPT 的性能,训练成本仅为其十分之一,显示出优秀的算法设计和资源利用能力。
两大模型 各擅胜场
ChatGPT 与 DeepSeek 的主要分别,在于前者主要针对对话应用程式而设计。ChatGPT专注于狭义人工智能中的特定任务智能,DeepSeek 的目标则是实现通用人工智能。语言支援是另一个重大分别。 DeepSeek是一家中国公司,注重中国语言和文化,这使其成为中国市场的竞争者。反观ChatGPT 支援世界各地多种语言;作为当前的领导者,比 DeepSeek 较具优势,获全球专业人士广泛使用。
OpenAI 围绕着ChatGPT 建立了一个强大的生态系统,包括应用程式介面、外挂程式以及与科技巨头如微软的合作伙伴关系。这个人工智能界家喻户晓的名字,拥有庞大活跃的开发者社区,支撑其不断改进和创新的成果。
与此同时,DeepSeek作为后起之秀也有一定实力,这使其成为ChatGPT不可小觑的对手。ChatGPT 若不进行重大微调,可能无法在专门环境中提供相同程度的准确性。DeepSeek 专为更有效地处理特定资料集或领域而客制化。对于特定行业的数据,例如金融、医疗或法律文件或会更好。DeepSeek 实现通用人工智能的长期目标可能会在未来带来适应性更强的人工智能系统。
迎面逆风 逆流动能
尽管 DeepSeek 技术领先,但其数据来源出现争议,曾被用户发现在回应中,透露可能在训练过程中使用了 ChatGPT 的输出数据,或有违OpenAI 的协议。此外,DeepSeek 在某些内容(如理财问题)所受审查较ChatGPT严格,以致部分用户的体验受限。中国对网路服务规定,人工智能需体现“社会主义核心价值观”,这意味著内地的聊天机器人,在政治敏感话题上往往受到规管。
本年1月,NewsGuard发表审核报告,分析多个聊天机械人有关新闻议题的准确度,DeepSeek仅获 17% 准确率,与一个西方AI模型同列第 10位,排名榜前9位为西方AI模型。报告指出,DeepSeek 的错误率为 83%,较其他AI模型的平均错误率 62% 为高。微软与 OpenAI 就开始调查是否有与DeepSeek关系密切者,以不诚实手段透过 OpenAI的应用程式介面窃取大量数据。尽管 DeepSeek 在 Apple App Store 中迅速成为最受欢迎的流动应用程式,其技术仍未免受到对手质疑,并加重了美国在 AI 领域的竞争压力。
DeepSeek-R1 模型在年初面世,正值是美国加强对中国出口AI技术限制之时。OpenAI等企业已作出警告,中国的AI模型未来可能紧贴甚至超越美国。中国明言到2030年将成为人工智能技术的全球领导者,并计划在未来几年内投入数百亿美元,以支持该行业。目前包括DeepSeek、阿里巴巴以及Moonshot AI在内的至少3家中国实验室,已推出据称可媲美OpenAI o1的模型。
事实上,DeepSeek的成功足证此等企业已经开始克服有关障碍,显示开发团队迅速接近前沿技术水准。R1模型可在个人电脑上操作,大大有助于推动AI应用的普及化。其卓越性能意味著强大的推理系统会迅速传播,并能在本地硬体上运行,而避开任何美国的出口管制。
潜藏风险 不可不察
随着DeepSeek横空而出,人工智能在激发革命性改变之馀,既在法律、会计、医疗、教育、交通等领域提供前所未有的发展机会,也带来了不容忽视的风险。
AI 系统因常从历史数据中学习,而难免受其中的偏见影响。要是未能妥善处理,这些偏见可能导致歧视性结果,尤其是在招聘、贷款、医疗保健、执法方面,必须加以防范和矫正。在骇客猖獗的今天,AI 系统或遭对抗性样本攻击、数据污染或模型盗窃,而被输入恶意数据,以致作出错误或有害的决策,在自动驾驶车辆或金融系统在自动驾驶车辆或金融系统等性命财产攸关的领域,后果不堪设想。
此外,AI 还可以用来创建具有说服力的假内容此外,例如日益流行的深伪(deepfake)或合成媒体更每每助长假资讯传播。政治人物的深伪视频更足以左右选举或触发社会动荡,严重破坏机构的可信性以至和社会的凝聚力。AI的武器化,若在自主无人机或网络战争中应用,将进一步放大其被滥用的潜能,而会对全球安全构成莫大威胁。
无庸置疑,AI的效益与风险同样深远。正因如此,面对这些挑战之际,务须在创新与责任之间取得平衡。只有基于伦理管治、国际社会通力合作与彼此警惕,才有望充分发挥AI的力量,造福社会和经济,同时将其危险性尽量降低。
(本文同时于二零二五年三月十九日载于《信报》“龙虎山下”专栏)