DeepSeek首次考虑从外部融资 梁文锋持谨慎态度(图)
大鱼新闻 科技 1 day, 20 hours

智东西2月19日消息,据The Information今日独家报道,知情人士透露道,自几周前DeepSeek爆火后,对更多AI芯片和服务器来处理快速增长的使用和支持模型开发的需求,促使DeepSeek关联公司深度求索考虑外部筹款。据两名直接了解会谈的人士称,最近几周,包括阿里巴巴集团、国有基金在内的许多财力雄厚的投资者,都表示有兴趣为DeepSeek下一阶段的增长提供资金。一位知情人士称,与DeepSeek联系的国有投资者包括中投公司、国家主权财富基金、国家社会保障基金。
DeepSeek、阿里巴巴、中投公司没有回复The Information电子邮件的置评请求。
深度求索是量化巨头幻方旗下的AI初创公司,以前不差钱,没有筹集外部资金,这也使得其能够避开投资者过快将其产品商业化的压力。但需要为芯片和服务器筹集更多资金可能会改变其立场。
据知情人士透露,除了讨论是否应该筹集资金外,DeepSeek及幻方的高管还在讨论这家初创公司是否应该从“主要专注于研究”转向“建立一个产生可观收入并最终盈利的业务”。
DeepSeek创始人兼CEO梁文锋对筹集外部资本仍然持谨慎态度,还不清楚他将怎么做选择。
与梁文锋共事过的人将他描述为一个书呆子和理想主义的技术专家。他于2015年共同创立了幻方,专注于使用AI模型进行股票交易,当时这在中国是一个新颖的想法。2023年,ChatGPT引爆生成式AI革命后,幻方成立AI子公司深度求索(DeepSeek),目标是实现通用人工智能(AGI)。
在美国政府限制对华供应高端芯片前,幻方已经储备了上万块英伟达A100 GPU。此前DeepSeek对筹集外部资金毫无兴趣。两家中国风险投资公司曾在2023年底和2024年初就可能的投资与DeepSeek联系,DeepSeek团队非常清楚地表明无意筹集任何外部资金。
据The Information报道,与此同时,梁文锋正密切关注美国的AI发展。两名知情人士透露说,去年9月OpenAI推出o1推理模型时,梁文锋飞往美国约见了他认识的研究人员,包括一些OpenAI员工,以了解最新情况。
在去年年底与员工的内部会议上,梁文锋提到DeepSeek落后于OpenAI。但据出席会议的一位前员工称,梁文锋还谈道,DeepSeek可以通过降低成本和提高效率,来为AI行业的进步做出贡献。
去年DeepSeek的老AI模型开始在美国AI研究人员中获得认可。与此同时,在其他科技公司争先恐后发布面向消费者的AI聊天助手时,DeepSeek却迟迟没有行动。
例如去年下半年,当字节豆包迅速流行起来时,梁文锋在一次会议上告诉员工,现在还不是DeepSeek专注于消费者App的时候。两名前员工记得,当时梁文锋说,公司的首要任务应该是研究如何更有效地构建更好的基础模型。
随后DeepSeek获得更多的关注。去年12月下旬,DeepSeek发布了V3,这是一个更新的大语言模型,只用2048块英伟达芯片训练,成本仅为550万美元,只有美国公司所花费的一小部分。1月20日,DeepSeek发布了一个新推理模型DeepSeek-R1,以更低成本实现了媲美OpenAI推理模型的性能,这震惊了硅谷,也引发了美国政府对中国AI进步的担忧。
研究公司QuestMobile称,DeepSeek的第一款移动App突然人气爆棚,在不到1个月的时间里,中国每天活跃用户数达到3000万,是中国有史以来增长最快的。但其基础设施很难扛住爆炸式增长的使用需求,该公司已经限制了其应用程序的使用,试图使流量更易于管理,但它可能需要在基础设施上投入更多资金,以更好地适应用户的活动。
迄今为止,DeepSeek自己的收入还很微薄。其聊天机器人App是免费的,其R1模型的API价格也远低于OpenAI o1推理模型。
Advertisements
相关新闻