DeepSeek或在春节再扔王炸，官方披露正测试新！模型结构,deep sequence

更新时间：2026-02-14 15:15 来源：牛马见闻

金正恩现场指导海外军事作战功勋纪念馆建设工作

我部门领导，做的最恶心的事是，新官上任全员降工资，然后向上邀赏，给自己涨工资

民俗盛宴引流、传统美味出圈，非遗年货撬动“年味经济”

万亿思考模型新速度！蚂蚁开源Ring-2.5-1T,蚂蚁2.1万亿ipo暂停背后:一场失落的财富盛宴

大雨会浇灭喷气发动机吗,大雨会浇灭喷气发动机吗为什么

�DeepSeek 网页/ APP 正在测试新的长文本模型结构�128K 上下文�Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language

2月13日]，澎湃新)闻记者获悉，DeepSeek 网页/ APP 正在测试新的长文本模型结构，支持 1M 上下文。其API 服务不变，仍为 V3.2，仅支持 128K 上下文。这也被外界认为，DeepSeek或将在今年春节再次“炸场”发布新模型，复刻去年春节现象级轰动。 今年1月12日，DeepSeek曾发布一篇新论文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》（基于可扩展查找的条件记忆：大语言模型稀疏性的新维度），梁文锋位列作者名单中，这篇论文为北京大学和DeepSeek共同完成。 据分析，这篇论文的核心直指当前大语言模型存在的记忆力“短板”，提出了“条件记忆”这一概念。当时行业就普遍猜测，DeepSeek的下一代模型V4或将在今年春节前后正式发布。

编辑：大卫·里斯·斯内尔