深潮 TechFlow 消息,3 月 14 日,据《白鲸实验室》爆料,DeepSeek V4 和姚顺雨领衔操刀的混元新模型,均预计将于 4 月发布。
爆料称,作为梁文锋打磨已久的多模态大模型,DeepSeek-V4 除了在 Coding 能力上跃升之外,还将在 LTM(long term memory 长期记忆)上取得突破。
日前,OpenRouter 新上线了两个神秘模型:Healer Alpha 与 Hunter Alpha,被猜测是 DeepSeek V4 的,国内 IP 可以直接访问这两个大模型。
根据模型的自我介绍,Hunter Alpha 为 1 万亿参数和 100 万 token 上下文的大模型,专为智能体工作流、长周期复杂任务和深度工具调用设计。
Healer Alpha 为全模态交互模型,上下文窗口为 26 万 tokens,能够原生感知视觉和音频输入,跨模态进行推理,并以精确和可靠的方式执行复杂的多步任务。
截至发稿,尚无官方认领这两个大模型。
另据《白鲸实验室》爆料,腾讯首席 AI 科学家姚顺雨也将于 4 月发布混元新模型(30B 参数级别)。这也是其自去年 12 月加入腾讯后,要发布的第一款重磅产品,备受期待。
