天眼日报

科技|2026年02月13日|约 36 分钟阅读

来源：1338 条推文 + 500 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-02-13

AI 速读25 条精选

🤖 AI 大模型

MiniMax 发布 M2.5 开源模型，即将开源权重，SWE-Bench Verified 80.2%，Agent 总分提升 42.8%

MiniMax 官方宣布 M2.5 模型权重即将开源（REALLY, REALLY, SOON），此前 MiniMax-M2.5 被评为开源 SOTA 候选，支持 Pokémon + Minecraft 游戏构建。在 SWE-Bench（index split）排名第 1，SWE-Bench Verified 达 80.2%，Terminal Bench 2 排名第 2，Multi-SWE-Bench 第一，BrowseComp 76.3%，BFCL 76.8%，编程能力媲美 Claude Opus 4.6，支持全栈 Vibe Coding 和智能体任务，激活参数 10B，推理 100TPS，复杂任务执行速度提升 37%，每小时 1 美元支持 100 tps。实测 4000 万 token，指令遵循 80%部分正确率、65.9%完全正确，长文本召回 96.7%，Agent 总分 599 较 M2.1 提升 42.8%，输出速度稳定 100 token/s，Lightning 变体支持 196608 token 上下文。

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情

天眼日报

🤖 AI 大模型

MiniMax 发布 M2.5 开源模型，即将开源权重，SWE-Bench Verified 80.2%，Agent 总分提升 42.8%

ModelScope 开源 Ring-2.5-1T：首个混合线性 1T 思考模型

阿里通义实验室发布 Qwen-Image-2.0 开源图像生成模型及 Zvec 向量数据库

OpenBMB 发布 MiniCPM-SALA 9B 开源模型，支持 1M token 上下文

BIOS 生物医学 AI 科学家登顶 BixBench 基准

Claude Code CLI 2.1.41 更新修复多项问题

智谱 GLM5 模型压缩至 241GB，256GB 内存即可本地运行

月之暗面 Kimi K2.5 性能媲美 Claude Opus 4.6，称霸 OpenRouter 付费调用榜

谷歌 Gemini 3 DeepThink 重大升级，姚顺宇参与多项基准创纪录

OpenClaw 2026.2.12 发布，支持 GLM-5 和 MiniMax M2.5

OpenAI 发布 GPT-5.3-Codex-Spark 超低延迟编程模型

DeepSeek 处理 529 页科学书籍仅需 19 秒

Spotify 顶级开发者 12 月起零手动代码，使用 Claude Code 和 Honk 系统

OpenAI 计划在 ChatGPT 下架 GPT-4o

智谱 AI GLM-5 在代理编码开源榜单领先

Anthropic 完成 300 亿美元 G 轮融资，投后估值 3800 亿美元

Google Gemini 团队发布官方技能库

海致科技港股 IPO，总市值超 300 亿港元

AdaptEvolve：通过自适应模型选择提升演化 AI 代理效率

HyPO：缓解参考偏好优化中的不匹配问题

RouterXBench：协作 LLM 系统中路由器的公平全面评估

Native Reasoning Training：LLM 在不可验证数据上原生推理训练

Krause Synchronization Transformers：受有界置信共识动态启发的注意力机制

苹果 Xcode 26.3 扩展支持编程智能体，接入 Claude Agent 和 Codex

Gemini 模型常将当前事件视为假设情景

免费先跟踪重点，再决定是否升级

获取下一次重大事件提醒