02月12日 · 科技日报

天眼日报

科技|2026年02月12日|50 分钟阅读
来源:2257 条推文 + 365 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-02-11 — 2026-02-12
分享
科技 日报封面
AI 速读27 条精选

🤖 AI 大模型

智谱 AI 发布 GLM-5 开源模型,744B 参数领先编程和代理任务

智谱 AI(Zai_org)推出 GLM-5 开源模型,总参数 744B(40B 活跃),较 GLM-4.5 升级显著,预训练 28.5T tokens,集成 DeepSeek 稀疏注意力,支持 200k 上下文、128k 输出。基准测试卓越:Artificial Analysis Intelligence Index 50 分领跑开源、Agentic Index 63 分、GDPval-AA ELO 1412;SWE-bench Verified 77.8 分、Terminal Bench 2.0 56.2 分、Vending-Bench 2 第 4 超越 Claude Sonnet 4.5、KingBench Agent 榜首、私有编码第 3;在 7/8 基准超 Gemini 3 Pro、6/8 超 GPT-5.2,AA-Omniscience 幻觉率最低。编程能力 SOTA,模拟粒子效果、水滴碎屑烟雾、鞭炮爆炸电影级;Agent 测试收入 738.69 元超前代,长上下文召回 98%。编程与智能体能力提升超 20%,BrowseComp 等 Agent 评测开源第一。lmsysorg 宣布今日发布,美东晚 7 点 SGLang 在 Modal 实时部署,vLLM 日零 FP8 支持,HuggingFace 开源权重,Coding Plan Max 用户即日可用,Okara 平台即将上线,zai 平台开放长上下文代理任务。

MiniMax 发布 M2.5 模型,训练计算持续提升支持复杂生成

MiniMax 宣布 M2.5 模型即将/已正式发布,与 GLM-5 同期引发热议,训练计算投入持续增加,性能越强。结合 Claude Code 生成图像出色,已在平台上线,支持天气卡片等复杂生成:精细动画包括云层流动、温度变化;支持 Agent Desktop 私有知识库和专家分身。计划尽快发布赶春节,中国模型集体升级挑战 Opus 4.5,价格仅 1/10。

DeepSeek 新模型/V4 预热,App 知识至 2025 年 5 月 SVG 生成提升

DeepSeek 移动 App 内测新模型,知识截止 2025 年 5 月,上下文 100 万 token,推理速度快,疑似 V4 预热;预览版 SVG 生成优于 V3.1/V3.2,支持无限上下文。中国春节集体升级 GLM-5、MiniMax-M2.5、DeepSeek-V4,使用 Nvidia 芯片训练,性能竞争 Anthropic Opus 4.5,价格仅 1/10。

Anthropic 承诺承担数据中心电价上涨和电网升级全成本

Anthropic 宣布覆盖数据中心电价上涨 100%全部成本,支付电网升级费用,推动新电力上线,投资减缓电网压力系统,确保用户不承担额外费用。计划在纽约和德克萨斯建 500 亿美元数据中心。

OpenAI Codex App 首周下载超 100 万,用户增长 60%

sama 透露 OpenAI Codex App 首周下载量超过 100 万,整体用户上周增长 60%。免费/Go 用户推广结束后仍保留,限额可能调整;在编码评测中领先,sama 称团队运营高效快速获胜,感谢开发者激励。

字节跳动 Seedance 2.0 灰度测试,5 分钟生成 1 分钟 4K 电影级视频

字节跳动 Seedance 2.0 开启灰度测试,引发传媒股暴涨如掌阅科技三连板;示例显示 5 分钟生成 4 个 15 秒 4K 镜头电影级视频,支持复杂提示词。

karpathy 用 243 行纯 Python 实现完整 GPT 训练和推理

karpathy 发布全新艺术项目,仅用 243 行无依赖纯 Python 代码实现完整 GPT 架构、训练和推理,包括微型 autograd 引擎和 Adam 优化器。剥离所有效率优化,展示 LLM 核心算法本质。

xAI Grok Code 预计 2-3 月内达 SOTA 编码水平

Elon Musk 在 xAI 全员会议透露,Grok Code 将在 2-3 个月内成为最强编码模型,前代 Grok Code Fast 1 已获 SWE-Bench Verified 70.8%,登顶 OpenRouter 榜单。

蚁群开源 LLaDA2.1 扩散语言模型,推理速度 892 tokens/s

Ant Open Source 发布 LLaDA2.1 Flash,100B 参数 MoE 模型,峰值速度 892 tokens/s,超 Qwen3-30B-A3B 2.5 倍。采用“草稿-编辑”机制,支持 Speedy Mode 快速生成与 Quality Mode 高质量输出。HuggingFace 提供 mini 和 flash 版本。

Google DeepMind Gemini Live 开发实时语音 AI 代理游戏 Deep Sea Stories

Google DeepMind 与 swmansion 合作,使用 Gemini Live 开发实时语音 AI 代理游戏 Deep Sea Stories。用户通过互动解决谜题,支持代码获取与直播技术深潜,定于 2 月 12 日 19:00 CET。

Claude 免费计划新增文件创建、连接器和技能功能

Anthropic 将 Claude 热门功能开放免费计划,包括文件创建、连接器和技能,无需订阅即可使用。

Claude Code 在 Slack 新增 Plan Mode

Claude Code 在 Slack 添加 Plan Mode,复杂任务前询问澄清问题并展示实施计划。

Scaling01 Opus 4.6 登顶 CAIS 排行榜

Opus 4.6 在 CAIS Leaderboard 上取得第一名,展示最新 LLM 基准测试领先地位。

OpenAI 解散使命对齐团队,领导转任首席未来学家

OpenAI 解散专注“安全”和“可信赖”AI 开发的使命对齐团队,团队领导转任首席未来学家,成员重新分配。

ModelScope 开源 Ming-flash-omni-2.0,统一视觉语音图像编辑

基于 Ling-2.0 MoE(100B 总参数/6B 活跃),3.1Hz 实时推理,像素级视觉精度,支持方言切换和情感控制。GitHub 开源。

Claude Code 桌面版支持本地插件和技能市场

Claude Code 新增本地插件支持,从市场安装自定义斜杠命令、技能和 MCP 服务器。插件自动同步桌面与 CLI,支持 Python 运行和可视化。

Claude Code 浏览器版开源项目 The Vibe Companion

GitHub_Daily 分享 The Vibe Companion 开源项目,通过逆向 Claude Code WebSocket 协议构建可视化 Web 界面,支持多会话并行、工具调用流可视化。一行命令本地启动,无需 API Key。

Z.ai 平台发布 GLM5 大模型,支持 RISC-V 和 POSIX 兼容

Z.ai 平台发布 GLM5 大模型,Hacker News 上获 154 分、134 条评论。支持 64 位 RISC-V 平台,增强 POSIX.1-2024 和 C23 兼容性。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。