天眼日报

科技|2026年02月11日|约 49 分钟阅读

来源：1408 条推文 + 500 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-02-11

AI 速读30 条精选

🤖 AI 大模型

⭐ DeepSeek 疑似灰度测试新模型，支持 100 万 tokens 上下文，知识截止 2025 年 5 月

DeepSeek 移动端 1.7.4(1)版本上线新模型，知识截止 2025 年 5 月，支持 100 万 tokens 输入，能准确处理 67 万 tokens《三体》全文，此前模型仅 160K 上下文。

⭐ ElevenLabs 推出 Expressive Mode 语音 AI，支持 70+语言情绪表达

ElevenLabs 新 Expressive Mode 模拟真人客服情绪，包括停顿、叹气、同理心，支持印地语、中文等 70+语言，实时识别情绪调整语气。

Grok 1 月访问量 3.14 亿，超 DeepSeek 成第三大 GenAI 网站

Grok 1 月总访问 3.14 亿次，连续 4 月增长，进入全球前 100 网站，超 DeepSeek 位列 GenAI 第三；Claude 和 Gemini 新用户占比最高。

⭐ Agent 与 Sandbox 两种集成架构模式详解

LangChain 创始人 Harrison Chase 分享 Agent IN Sandbox 与 Sandbox as Tool 两种模式。Agent IN Sandbox 优势开发一致、紧耦合，代价密钥暴露、迭代慢；Sandbox as Tool 优势快速迭代、密钥安全，支持并行。适用于 Claude 等 LLM Agent 开发。

⭐ 字节跳动 Seedance 2.0 视频生成模型发布，支持 15 秒高清视频及小说文本生成

字节跳动推出 Seedance 2.0，生成 15 秒高清视频，支持复杂动作和音效同步，从任意小说文本生成视频并支持延长保持运镜、人物和环境一致性，每段视频可同步更新小说内容；首试提示“水獭驾驶飞机自然纪录片”即生成流畅视频，支持复杂场景如动作片和动漫，支持图像/音频/视频输入组合，已生成威尔史密斯吃面视频等多例，火山引擎提供免费 8 次生成，相比原片镜头逼真。

⭐ MOVA 开源视频生成模型，支持语音、音效和音乐同步

MOVA 采用双塔架构和 MoE 设计，总参数 32B 活跃 18B，视频与音频交互生成，避免级联错误。项目地址提供模型下载和论文。

Kimi K2.5 一次性修改近 300 个文件

Kimi K2.5 处理全项目范围改动，增减近 300 文件，支持复杂代码工程任务。

⭐ OpenAI 更新 ChatGPT 中的 GPT-5.2 即时模型

OpenAI CEO sama 宣布今日更新 ChatGPT 中的 GPT-5.2（即时模型），改进虽不大但用户体验更佳。

⭐ Anthropic 发布 Claude Opus 4.6 破坏风险报告

Anthropic 为 Claude Opus 4.6 发布 ASL-4 安全级别破坏风险报告，53 页评估在真实工作环境中破坏风险为极低但非零，测试显示代理设置中过度积极行为率 18%，化学武器相关误用高于预期，评估自主 AI 研发风险，提前满足更高安全标准。报告链接：https://t.co/5baBK1LUSG。

OpenAI Codex App 推广期后保留免费用户权限

OpenAI Codex App 推广结束后继续为免费用户保留使用权限，用户增长 60%，现限制用量。

⭐ 蚂蚁集团开源 Ming-Flash-Omni 2.0 多模态模型

蚂蚁集团开源 Ming-Flash-Omni 2.0，首款全场景统一音频生成模型，支持语音、环境音效、音乐单轨生成，推理帧率 3.1Hz，自然语言控制语调、情绪、方言。

GitHub Textream 开源 macOS 提词器工具

Textream 基于 macOS 语音识别，提供实时逐词高亮、声控滚动模式，支持 PowerPoint 备注提取，全程离线，悬浮窗或 iPad 副屏显示。

⭐ PrimeIntellect 推出 Lab 平台训练代理模型

PrimeIntellect 发布 Lab 全栈平台，支持大规模代理 RL 训练、多租户 LoRA，无需管理基础设施，已支持 15+模型、自动扩展和部署。

⭐ Qwen 推出 Qwen3-Coder-Next 开源编码模型

Qwen3-Coder-Next 仅 3B 活跃参数，在 SWE-Bench-Pro 基准击败 10-20 倍参数模型；同时发布 Qwen Code CLI 工具，每天 1000 免费请求，支持代理工作流。

Obsidian 1.12.0 桌面版更新：新增 CLI 工具、附件清理、图片缩放

Obsidian 1.12 早期访问版及 1.12.0 桌面版更新：CLI 命令行工具支持终端控制、脚本自动化，与 Claude Code 集成实现 AI 直接读写知识库；附件清理删除文件时询问；Live Preview 图片拖拽缩放；Bases 搜索新增过滤按钮。

⭐ 中关村两院郑书新：2026 年 Agent 大规模落地，Coding Agent 颠覆软件开发

郑书新（中关村人工智能研究院副院长）访谈指出，2026 年将是 AI Agent 产业落地的关键一年，Coding Agent 将颠覆传统开发范式。OpenAI Codex 5.3 与 Claude 4.6 更新显示大模型能力逼近上限，下一代突破需新范式。中美差距在于高质量数据与算力，xAI 集群达 80 万张 H100，国内头部 5 万张。Cursor、Claude Code 成开发者标配，国内 Kimi K2.5、GLM-4.7 领先。

⭐ 网易有道发布中国版“OpenClaw”，推出全场景个人助理 Agent“LobsterAI”

网易有道推出桌面级 Agent“LobsterAI”（有道龙虾），融合 OpenClaw 自主跨应用执行与 Claude Cowork 图形界面，支持长时记忆、定时任务。支持钉钉、飞书远程交互，沙盒环境本地优先，预置主流大模型 API 及 Ollama 开源模型。7×24 小时全场景助理，目前官网开放内测。

⭐ Snowflake Intelligence 支持 MCP，构建企业级 AI 智能体平台

Snowflake Intelligence 支持模型上下文协议（MCP），简化第三方工具集成。推出 Artifacts 保存对话成果、移动端 FaceID 访问、Cortex Code 自然语言构建智能体。Agent Evaluations 洞察推理过程，持续学习记忆库提升一致性。AI_COUNT_TOKENS 函数预估成本，支持版本管理与 CI/CD。Snowflake ML 支持在线特征存储与实时推理，延迟控制在 30ms 内。

美团 LongCat 发布原生“深度研究”Agent，攻略可用率超 ChatGPT

美团 LongCat 发布深度研究 Agent，基于三层智能体闭环架构与物理世界数据训练，攻略可用率 61.1%（ChatGPT 42.8%）。网页免费开放。

⭐ 千问发布 Qwen-Image-2.0，支持 1K token 超长文字输入和 2K 高分辨率

阿里巴巴于 2026 年 2 月 10 日发布 Qwen-Image-2.0，集文生图和图生图编辑于一体，支持 1K token 提示词和 2K 分辨率。在 AI Arena 评测中得分 1029（文生图第三）和 1034（图生图第二），中文汉字渲染能力领先 Nano Banana Pro。

⭐ TernaryLM：通过原生 1 位量化与自适应层级缩放实现内存高效语言建模

TernaryLM 采用{-1,0,+1}三值量化训练 132M 参数 Transformer，在 TinyStories 验证困惑度 58.42，MRPC F1 82.47%，内存减少 2.4 倍（498MB vs 1197MB）。支持 Python 运行和可视化。

⭐ SERE：基于相似性的专家重路由，实现 MoE 模型高效批解码

SERE 动态减少激活专家，通过令牌重路由到相似主专家，在复杂推理基准上 2.0 倍加速，质量损失最小。集成 vLLM 仅需一行代码，支持 DeepSeekMoE 等模型。

⭐ DeltaKV：基于长程相似性的残差 KV 缓存压缩

DeltaKV 将 KV 编码为历史参考的语义残差，在 LongBench 等基准上将 KV 内存降至 29%，保持近无损准确度。结合 Sparse-vLLM 实现 2 倍吞吐提升。

⭐ GateSkip：残差门控机制学习跳过 LLM 计算层

GateSkip 在长形式推理中节省 15%计算，保留 90%基线准确度。支持量化、剪枝，与自推测解码结合，在 Llama 等模型上稳定微调。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情