DeepSeek 悄悄放出“王炸”?代码里藏着一个神秘新AI,名字叫 MODEL1

作者: 智享AI发布日期: 2026/1/21阅读时间: 3分钟
DeepSeek 悄悄放出“王炸”?代码里藏着一个神秘新AI,名字叫 MODEL1 封面图

国产 AI 公司 DeepSeek 最近在 GitHub 上搞了个大动作。他们在更新代码时,不小心暴露了一个神秘的新模型,它的名字叫做“MODEL1”。这个“MODEL1”可不是简单的小升级,它和 DeepSeek 现在的 V3.2 模型是并列出现的,就像是 V3.2 的“兄弟”或者“下一代”。

这可不是瞎猜。在 DeepSeek 的代码里,工程师们把“MODEL1”和 V3.2 版本一起写进了好几百个文件里。这说明,“MODEL1”很可能是一个全新的 AI 模型系列,而不是 V3.2 的小修小补。

更重要的是,从技术细节上看,这个“MODEL1”跟之前的模型有很大不同。比如,它在处理“KV 缓存”的方式上、如何让 AI 更聪明地“稀疏”处理信息,以及对一种叫做 FP8 的数据格式的支持上,都采用了新的设计。这通常意味着,它在计算速度和节省显存(就是电脑的内存)方面,会有质的飞跃。

为什么 DeepSeek 要憋个大的?之前就有传言说,DeepSeek 打算在 2026 年的农历新年(也就是明年)推出一个叫做 DeepSeek V4 的“旗舰”模型,特别擅长写代码。而且,DeepSeek 最近还发布了两篇很厉害的论文,讲的是怎么让 AI “记性”更好(AI 记忆模块 Engram)和优化 AI 的“连接方式”(优化残差连接 mHC)。

所以,大家现在都在猜测,这个代码里露馅的“MODEL1”,很可能就是 DeepSeek 把这些最新的研究成果变成现实的第一个产品。如果真是这样,那么这个“MODEL1”将是 DeepSeek 在 AI 领域又一次重要的突破,尤其是在代码生成方面,可能会给我们带来惊喜。

aidesigntechupdateproduct
精选评论
评论加载中…
发表讨论 »