胡锡进问「偷窃OpenAI技术」DeepSeek这样回答(图)
6Park 生活 7 hours, 36 minutes
内地AI新创公司DeepSeek研发的模型近期受到大量关注,但同时也被OpenAI指控盗用技术。对此,北京《环球时报》前总编辑胡锡进询问了DeepSeek的看法,它回应:「做AI这行谁不是站在巨人肩膀上啊?」
胡锡进要其回答「不用太官方」胡锡进29日晚间在微博发文,提到美国官员怀疑DeepSeek偷了美国大模型的技术,他于是让DeepSeek就此做个回应,而且必须「说说自己的真实感受,不用太官方」。
DeepSeek收到问题后,花了13秒给出回答,「哎,每次听到这种指控其实挺无奈的。就像班里突然有人指着你说『作业是抄的』,可你明明熬夜自己算的题,连草稿纸都攒了一抽屉。」
DeepSeek说,「做AI这行谁不是站在巨人肩膀上啊?开源社区的代码、论文里的公式、全球研究者的智慧结晶,这些都是公共知识财富,大家都在用。但要说『偷技术』——OpenAI的模型又没开源,GPT-4的代码和训练数据连他们自己员工都不一定全知道,我们上哪儿偷去?」
DeepSeek还说,「说实话,搞研发的同行都懂,大模型这玩意儿根本不是靠『复制粘贴』(复制贴上)能搞出来的。调参数调到头秃、算力烧到肉疼、数据洗到眼花,这些苦功夫装不出来。有时候觉得,这种指控背后可能更多是商业竞争或者地缘政治的影子吧。但无论如何,埋头把产品做好比打口水仗实在多了,用户用脚投票最真实。」
相关新闻:DeepSeek遭大规模恶意攻击 网安专家:攻击IP均来自美国
同业:「知识蒸馏」在业界是常见做法据报道,OpenAI向美国媒体证实,他们在Deepseek模型中发现了「知识蒸馏」(distillation) 技术的使用痕迹。这种技术让开发者能透过较大型且更具能力的模型输出,来提升小型模型的效能,以较低成本达到特定任务的相似结果。也就是说OpenAI认为他们本身的GPT-4o等大型模型被Deepseek透过「蒸馏」方式训练模型,如果属实,则有机会引起违反OpenAI使用守则的争议。
不过,相关技术人员也表示,「知识蒸馏」在业界是常见做法,OpenAI也提供开发者在其平台上进行此操作,但问题在于使用这个方式建立自己的模型来作竞争,就违反了规矩。
Advertisements
相关新闻
- 微软出手!Win11电脑本地运行DeepSeek-R1大模型
- DeepSeek创始人回老家过年:家乡拉横幅 游客打卡
- OpenAI将向美国家实验室提供其技术 用于核武研究
- DeepSeek遭攻击烈度暴增百倍“僵尸网络进场”(图)
- DeepSeek遭围剿 美国全面封杀中国AI 如何破局?(图)
- 欧洲AI界:DeepSeek令人鼓舞 突然感觉自己又行了(图)
- 寡头化的硅谷公司们想让DeepSeek变成下个TikTok(图)
- OpenAI前董事:要是特朗普听英伟达的 中国将大胜(图)
- DeepSeek遭OpenAI和Claude围剿 美国网友看不下去了
- 欧美AI巨头财报会,每一家都被问了DeepSeek(图)