大鱼新闻 | 生活 | 美国AI公司试图破解DeepSeek破坏性创新技术(图)

美国AI公司试图破解DeepSeek破坏性创新技术(图)

6Park 生活 1 day, 14 hours

智慧型手机荧幕上出现了应用程式 DeepSeek 和 ChatGPT 的图示。(美联社：2025年1月28日)

美国领先的人工智能(AI)公司开发人员在赞扬迅速崛起而声名大噪的DeepSeek AI模型的同时，也试图找出其漏洞，以反驳“中国后来者以低成本替代方案击败他们耗资数十亿美元的技术”这种观点。

中国初创公司深度求索(DeepSeek)星期一(1月27日)引发了美股市场抛售，其免费AI助手在美国苹果应用商店的下载量超越了OpenAI的ChatGPT。该公司声称，其模型利用性能较低的英伟达(Nvidia)H800处理器芯片做训练，花费不到600万美元。

了解四大领先AI实验室想法的知情人士表示，随着对竞争的担忧在美国股市蔓延，一些AI专家对深度求索的坚强团队和最新研究表示赞赏，但对该发展依旧泰然自若而未感到震惊。

Open AI首席执行官萨姆·奥尔特曼(Sam Altman)在X平台上写道，R1是深度求索最近几周发布的几种模型之一，“是一款令人印象深刻的模型，尤其是考虑到它们能够以这个价格提供。”

英伟达在一份声明中表示，深度求索的成就证明了市场有更多对英伟达芯片的需求。

美国软件制造商雪花(Snowflake)在收到客户咨询激增后，星期一决定将DeepSeek模型添加到其AI模型市场。

雪花产品执行副总裁克里斯蒂安·克莱纳曼(Christian Kleinerman)表示，连其员工也称DeepSeek的模型“令人惊叹”，并且该公司在权衡了托管该中国开发的AI技术可能面临的潜在风险后，最终决定向客户提供这项服务。

与此同时，美国AI开发人员正加紧分析DeepSeek的V3模型。深度求索去年12月伴随该模型发表了一篇研究论文，该论文是其流行应用程序的基础，但那篇论文中并未回答诸如总开发成本等许多问题。

一位知情人士表示，中国目前已将落后美国最先进的AI模型的时间从18个月大幅缩短至6个月；然而，由于DeepSeek的免费发布策略引发了如此多的兴趣和关注，该公司可能很快就会发现自己没有足够的芯片来满足需求。

DeepSeek的进步并非仅依靠600万美元的微薄预算。该研究论文指出，这笔成本特指最终训练运行中的芯片使用，而不是整个开发成本。

两家顶级实验室的高管告诉路透社，训练运行只是总成本的冰山一角，确定如何设计训练运行的成本支出可能会高出很多。

该论文说，V3的训练运行使用了2,048块英伟达的H800芯片，这些芯片的设计旨在符合2022年发布的美国出口管制规定。专家告诉路透社，这些2022年美国出口管制规定几乎没有减缓中国AI的进展。

两家AI实验室的消息人士表示，他们预计早期开发阶段依赖了大量的芯片。其中一位消息人士说，这样的投资可能高达10亿美元。

一些美国AI领袖对深度求索将其模型以开源形式发布的决定表示赞赏，这意味着其他公司或个人可以自由使用或更改这些模型。

“DeepSeek R1是我见过的最令人惊叹和令人印象深刻的突破之一，而且作为开源技术，它是给世界的一份大礼，”风险投资家马克·安德森(Marc Andreessen)星期天在X平台上一篇贴子中表示。

业内观察人士表示，DeepSeek模型获得的赞赏凸显了开源AI技术作为诸如OpenAI的ChatGPT等昂贵且严格控制技术的替代方案的可行性。

分析师估计，美国大型云计算公司今年在AI基础设施上将投入高达2500亿美元。

近年来，华尔街最有价值的公司股价飙升，因为人们预期只有这些公司才能获得开发和扩展新兴AI技术所需的大量资本和计算能力。

本周和下周，许多美国科技巨头将公布季度收益，届时这些假设将受到进一步的审视。

（本文依据了路透社的报道。）