美国AI公司试图破解DeepSeek破坏性创新技术(图)

6Park 生活 1 day, 14 hours



智慧型手机荧幕上出现了应用程式 DeepSeek 和 ChatGPT 的图示。(美联社:2025年1月28日)


美国领先的人工智能(AI)公司开发人员在赞扬迅速崛起而声名大噪的DeepSeek AI模型的同时,也试图找出其漏洞,以反驳“中国后来者以低成本替代方案击败他们耗资数十亿美元的技术”这种观点。


中国初创公司深度求索(DeepSeek)星期一(1月27日)引发了美股市场抛售,其免费AI助手在美国苹果应用商店的下载量超越了OpenAI的ChatGPT。该公司声称,其模型利用性能较低的英伟达(Nvidia)H800处理器芯片做训练,花费不到600万美元。


了解四大领先AI实验室想法的知情人士表示,随着对竞争的担忧在美国股市蔓延,一些AI专家对深度求索的坚强团队和最新研究表示赞赏,但对该发展依旧泰然自若而未感到震惊。


Open AI首席执行官萨姆·奥尔特曼(Sam Altman)在X平台上写道,R1是深度求索最近几周发布的几种模型之一,“是一款令人印象深刻的模型,尤其是考虑到它们能够以这个价格提供。”


英伟达在一份声明中表示,深度求索的成就证明了市场有更多对英伟达芯片的需求。


美国软件制造商雪花(Snowflake)在收到客户咨询激增后,星期一决定将DeepSeek模型添加到其AI模型市场。


雪花产品执行副总裁克里斯蒂安·克莱纳曼(Christian Kleinerman)表示,连其员工也称DeepSeek的模型“令人惊叹”,并且该公司在权衡了托管该中国开发的AI技术可能面临的潜在风险后,最终决定向客户提供这项服务。


与此同时,美国AI开发人员正加紧分析DeepSeek的V3模型。深度求索去年12月伴随该模型发表了一篇研究论文,该论文是其流行应用程序的基础,但那篇论文中并未回答诸如总开发成本等许多问题。


一位知情人士表示,中国目前已将落后美国最先进的AI模型的时间从18个月大幅缩短至6个月;然而,由于DeepSeek的免费发布策略引发了如此多的兴趣和关注,该公司可能很快就会发现自己没有足够的芯片来满足需求。


DeepSeek的进步并非仅依靠600万美元的微薄预算。该研究论文指出,这笔成本特指最终训练运行中的芯片使用,而不是整个开发成本。


两家顶级实验室的高管告诉路透社,训练运行只是总成本的冰山一角,确定如何设计训练运行的成本支出可能会高出很多。


该论文说,V3的训练运行使用了2,048块英伟达的H800芯片,这些芯片的设计旨在符合2022年发布的美国出口管制规定。专家告诉路透社,这些2022年美国出口管制规定几乎没有减缓中国AI的进展。


两家AI实验室的消息人士表示,他们预计早期开发阶段依赖了大量的芯片。其中一位消息人士说,这样的投资可能高达10亿美元。


一些美国AI领袖对深度求索将其模型以开源形式发布的决定表示赞赏,这意味着其他公司或个人可以自由使用或更改这些模型。


“DeepSeek R1是我见过的最令人惊叹和令人印象深刻的突破之一,而且作为开源技术,它是给世界的一份大礼,”风险投资家马克·安德森(Marc Andreessen)星期天在X平台上一篇贴子中表示。


业内观察人士表示,DeepSeek模型获得的赞赏凸显了开源AI技术作为诸如OpenAI的ChatGPT等昂贵且严格控制技术的替代方案的可行性。


分析师估计,美国大型云计算公司今年在AI基础设施上将投入高达2500亿美元。


近年来,华尔街最有价值的公司股价飙升,因为人们预期只有这些公司才能获得开发和扩展新兴AI技术所需的大量资本和计算能力。


本周和下周,许多美国科技巨头将公布季度收益,届时这些假设将受到进一步的审视。


(本文依据了路透社的报道。)

 

相关新闻