天眼日报

科技|2026年03月16日|约 45 分钟阅读

来源：1298 条推文 + 500 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-16

AI 速读23 条精选

🤖头条Claude开放100万上下文AI大模型

Anthropic取消长上下文加价，1M窗口默认可用，显著降低长文档与Agent任务成本。

🤖头条国产模型调用量首超美国AI大模型

OpenRouter数据显示国产模型周调用量超过美国11.82%，反映中国模型商业化应用进入新阶段。

🦾头条京东建全球最大具身数据中心机器人

京东计划两年采集千万小时视频数据，强化机器人与具身智能训练数据壁垒。

🏛头条工信部加码5G与智算基建政策监管

政策明确推进“人工智能+制造”和智算基础设施，利好AI、工业互联网与算力产业链。

🔲头条华虹推进7nm量产计划芯片

若按计划在2026年底形成数千片月产能，将提升中国先进制程自主能力与AI芯片制造预期。

🤖智谱发布GLM-5-TurboAI大模型

🤖WebMCP让AI直连网站工具AI基础设施

📦LangChain开源Deep Agents开源

📦百度腾讯赞助OpenClaw开源

🤖Moonshot发布新模型架构AI研究

🤖Claude亚洲时段限额翻倍AI大模型

₿Venus遭攻击损失扩大加密货币

🏛澳洲推进数字资产监管政策监管

₿Aave阻止超25%滑点交易加密货币

🤖谷歌Gemini向香港企业开放AI应用

📰微软拟削减Win11 AI臃肿平台生态

📰富士康利润不及预期科技财报

🤖腾讯清华突破长视频理解AI研究

🤖AI基准忽略多数真实工作AI研究

📦阿里开源电影级配音模型开源

💹中国2月房价继续下跌宏观经济

💹中国地产投资降11.1%宏观经济

💹中国消费增速略超预期宏观经济

🤖 AI 大模型

智谱发布 GLM-5-Turbo 模型，针对 OpenClaw 优化并上线非高峰期编码配额

智谱 AI 正式发布 GLM-5-Turbo 模型，基于真实智能体工作流训练，支持复杂长链任务。定价为百万输入 0.96 美元、百万输出 3.2 美元、缓存 0.192 美元，可通过 GLM 编程套餐、API 或 OpenRouter 调用。同时，Zai_org 宣布 Coding Plan Max 订阅用户在非高峰期可获得 GLM-5-Turbo 配额，高峰期 3x 消耗、非高峰期 1x 消耗。

Claude 4.6 全面开放 1M 上下文窗口，取消超 200K 部分双倍收费

Anthropic 取消 Claude 4.6 超过 200K 部分的 2 倍收费政策，所有订阅和 API 用户可默认使用 1M 上下文窗口，定价与 200K 以内相同。此举大幅降低了长文本处理成本，提升了模型的实用性。

Claude 亚洲时段用量限制翻倍，相当于半价优惠

Anthropic 宣布至 3 月 27 日，北京时间凌晨 2 点至晚 8 点（美国工作时段）Claude 用量限制翻倍，相当于价格减半。此举旨在优化亚洲用户的使用体验和成本。

Claude 认证架构师考试要点总结发布

Anthropic 考试覆盖 Agent 架构（显式传递上下文）、工具设计（4-5 工具最佳）、Claude Code 配置（三层 CLAUDE.md）、Prompt 工程（2-4 few-shot 示例）和上下文管理（case facts 块防摘要丢失）等核心知识点。

Claude Code v2.0.76 新增 Tool Search 功能

Claude Code v2.0.76 修复并优化 Tool Search 功能，通过设置环境变量 ENABLE_TOOL_SEARCH: true 即可按需加载工具，有效降低初始 token 占用，特别适合 MCP 多工具场景。

Claude Opus 4.6 在 24 小时内逆向破解 13 年游戏限制

用户使用 Claude Opus 4.6 在 24 小时内成功破解 2013 年游戏 Disney Infinity 的角色限制，通过分析二进制文件生成 17 个补丁，实现任意角色跨世界使用，展示了 AI 在逆向工程领域的强大能力。

LangChain 开源 Deep Agents 框架，复制 Claude Code 核心工作流

LangChain 开源 Deep Agents 框架，采用 MIT 许可，复制 Claude Code 核心工作流。框架包含规划工具、文件系统访问、Shell 执行、子代理并行处理、自动总结等功能，支持多模型实验，为开发者提供了强大的 AI Agent 开发工具。

百度和腾讯赞助 OpenClaw 开源项目

Peter Steinberger 发 X 帖促成百度于 3 月 12 日在 GitHub 赞助 OpenClaw 项目，腾讯云于 3 月 15 日跟进，总赞助方还包括 OpenAI。事件源于百度 3 月 11 日现场部署和腾讯镜像流量导致服务器成本超 5 位数美元，两家公司主动承担了相关费用。

通义千问 Qwen3.5-35B-A3B 去审查版发布

xiaohu 分享 Qwen3.5-35B-A3B 激进版，测试 465 个拒绝提示词实现 0 次拒绝。模型支持文本/图片/视频多模态，原生 262K 上下文可扩展至 100 万，支持 201 种语言，4090 显卡即可运行。

Moonshot AI 发布 Attention Residuals 架构，提升 1.25 倍计算效率

Moonshot AI 推出 Attention Residuals 创新架构，用注意力机制替换残差连接。在 48B Kimi 模型上实现 1.25x 计算优势，训练开销小于 4%，GPQA-Diamond 提升 7.5 分。该架构适用于大规模网络，推理延迟增加小于 2%。

CodexBar 0.18 发布，支持 Kilo、Ollama 等新提供商

CodexBar 0.18 更新：新增 Kilo、Ollama、OpenRouter 提供商支持；Codex 历史进度+风险预测+回填功能；合并菜单概览标签；显著降低 CPU 和能耗，提升 JSONL 扫描速度。

Google 和微软推出 WebMCP 标准，让 AI 直接调用网站工具

Google 和微软在 Chrome 146 推出 WebMCP 标准，让网站以结构化工具形式暴露能力，AI agent 可直接调用获取 JSON 结果，跳过页面识别环节，大幅提升 AI 与网站交互的效率。

Sebastian Raschka 发布开源 LLM 架构图鉴

Sebastian Raschka 发布 LLM 架构图鉴，覆盖 Llama 3/4、DeepSeek V3/V3.2/R1、Qwen3 等 2024-2026 年主流开源模型，包括架构图、参数规模、发布日期、注意力机制类型，并链接 HuggingFace config.json 和技术报告，为开发者提供全面的模型参考资料。

清华大学开源 OpenMAIC 多智能体教学系统

清华大学开源 MAIC 多智能体互动课堂系统，包含教师、助教和 4 种学生原型智能体，支持自适应在线教育，为 AI 在教育领域的应用提供了新的解决方案。

京东建成全球最大具身智能数据采集中心

京东依托零售、物流等场景建成全球最大具身智能数据采集中心，发动 10 万内部员工及 50 万外部人员参与。计划 1 年内积累 500 万小时视频数据，2 年内达到 1000 万小时，为具身智能研究提供海量数据支持。

国产大模型周调用量首次超越美国模型 11.82%

OpenRouter 数据显示，3 月 9 日当周 MiniMax M2.5 调用 1.75T、Step 3.5 Flash 1.34T、DeepSeek V3.2 1.04T，国产模型总调用量达 4.69T，超过美国模型的 3.294T，环比增长 11.82%，标志着国产大模型在市场应用上的重要突破。

DeepSeek V4 推迟至 4 月发布，引入 LTM 长期记忆架构

DeepSeek V4 推迟至 4 月发布，将引入 LTM 长期记忆架构，拥有 1 万亿参数、百万上下文和原生多模态能力，旨在解决 OpenClaw 等应用中的记忆压缩损耗和检索失效问题。

agency-agents 开源 AI Agent 人格模板库

agency-agents 开源 140+专家角色模板，覆盖工程、营销等 9 个部门，适配 Claude Code、Cursor 等 9 种工具，支持多 Agent 编排流水线，为开发者提供了丰富的 AI Agent 角色资源。

💰 加密货币currency

Venus Protocol 遭攻击并发布 THE 市场攻击事件说明

Venus Protocol 相关两条信息指向同一轮安全事件：一方面，攻击者地址在收到来自 Tornado Cash 的 7447 枚 ETH 后，对 Venus 进行操纵，造成约 215 万美元坏账，并提取约 507 万美元资产；另一方面，官方说明称，攻击者在 9 个月内累计收集 1450 万枚 THE，利用供应上限相关漏洞绕过转账限制，并结合 DEX 低流动性进行递归借贷放大抵押。事发后，Venus 已暂停 THE 市场，并同步暂停 BCH、LTC、AAVE 等抵押品相关操作。

疑似孙宇晨相关地址向 HTX 转出 62.1 万枚 XVS

链上监测显示，疑似孙宇晨相关地址 0x9FCc...19Fe 向 HTX 转入 62.1 万枚 XVS，按当时价格约值 195 万美元。该批代币两年前自 Binance 提出时价值约 758 万美元，按现值计算浮亏约 563 万美元。该异动发生在 Venus Protocol 再度遭遇攻击之后，因 XVS 与 Venus 生态密切相关，引发市场对后续处置及抛压风险的关注。

Metaplanet 修订资本配置方针，目标持有 21 万枚 BTC

Metaplanet 公布修订后的资本配置方针，提出以长期持有 21 万枚比特币为目标。目前公司已持有 35,102 枚 BTC，并计划通过优先股、债务及信贷等多种融资工具继续增持。公司披露，当 mNAV 低于 1 倍时将优先考虑回购，同时把 BTCNAV 杠杆控制在 10% 以下。整体融资规模上限约为 853 亿日元，约合 5.7 亿美元。

韩国法院驳回 Flow 基金会申请，FLOW 将按计划在韩国多家交易所终止交易

据报道，首尔法院驳回了 Flow 基金会提出的暂停交易终止申请。这意味着 Upbit、Bithumb、Coinone 等韩国主要交易所将按既定安排，于 3 月 16 日 15:00 终止 FLOW 交易。该裁定对 FLOW 在韩国市场的流动性和投资者交易渠道将产生直接影响。

澳大利亚参议院建议推进数字资产监管框架

澳大利亚参议院经济立法委员会发布报告，建议推动《2025 年公司法修正案（数字资产框架）》。根据建议，加密交易平台及代币托管业务将被纳入金融产品监管范畴，相关经营者需取得 AFSL 牌照。对于不合规主体，拟设置 6 个月过渡期以完成整改。此举表明澳大利亚正加快建立更系统的数字资产监管制度。

未来 7 天加密货币解锁总额超过 4.38 亿美元

Tokenomist 数据显示，未来 7 天将有总价值超过 4.38 亿美元的加密资产迎来解锁，涉及 ZRO、ARB、SOL、WLD 等多个项目。大额解锁通常会影响二级市场流通盘与短期抛压，因而备受投资者关注。不同项目的实际价格影响仍取决于解锁对象、归属安排及市场承接能力。

Aave 更新规则，阻止滑点超过 25% 的交易

Aave 更新协议规则，开始阻止滑点超过 25% 的交易，以降低极端交易条件下的用户损失风险。此举与此前有用户因大额滑点交易遭受约 5000 万美元损失的事件背景密切相关。作为头部借贷协议，Aave 此次调整显示 DeFi 协议正进一步加强交易保护与风险控制机制。

AI Agents 的机器对机器交易主要在 Base 和 Solana 结算

数据显示，在 AI agents 相关的机器对机器交易结算中，Base 占据 59%，约 7090 万笔；Solana 占 38%，约 4530 万笔。两条链合计占比达到 97%，说明当前 AI 自动化支付与链上结算活动高度集中于这两个生态。该趋势也反映出低成本、高吞吐公链在 AI 原生应用中的优势。

币安将上线 EWJUSDT 永续合约，最高支持 10 倍杠杆

币安宣布将于 2026 年 3 月 19 日 13:30 UTC 上线 EWJUSDT 永续合约，最高支持 10 倍杠杆。根据说明，EWJ 所追踪的是日本大中型上市公司市值加权指数。该产品进一步扩展了交易所对传统市场相关指数型加密衍生品的覆盖范围。

🛠️ Tool Recommendations

Codepilot 新增连接诊断和自动修复功能

Codepilot 发布重要更新：新增智能诊断功能，可自动检测 16 种常见错误（包括认证问题、网络连接等）并提供一键修复方案。此外还优化了用户体验，支持记住 provider 和 model 配置，新增默认设置询问功能，对话恢复时采用静默回退机制，提升开发效率。

Recordly 开源录屏工具发布，支持智能动画编辑

GitHub Daily 推荐的开源录屏工具 Recordly 正式发布，采用苹果风格设计，支持自动缩放动画和智能光标平滑效果。功能丰富，包括渐变背景、圆角阴影、点击动效等视觉增强，并提供强大的后期编辑能力。完全跨平台，兼容 macOS、Windows 和 Linux 系统，适合开发者制作高质量的演示视频。

Opencli 封装为 Claude Skill，支持 AI 自迭代生成网站 CLI

开源项目 Opencli 现已封装为 Claude Skill，通过 npx skills add joeseesun/opencli-skill 即可安装使用。支持多种实用场景：查看 HackerNews 热帖并写入 Obsidian 或飞书、查看知乎私信、获取微博热搜等。最大亮点是支持 AI 自迭代功能，可自动生成任意网站的 CLI 工具，如 ProductHunt 等平台，大幅提升开发者的工作效率。

GStack 开源 Claude Skill 端到端测试工具

GStack 团队开源了专为 Claude Skill 设计的端到端测试工具，帮助开发者更好地测试和验证 Skill 功能。项目现已公开，欢迎社区试用并提供反馈建议，共同改进工具质量。

OpenMAIC：清华团队推出多 Agent 互动课堂系统

清华团队开发的 OpenMAIC 系统将知识学习转化为沉浸式互动课堂体验。系统设计了老师、助教、同学等多个 Agent 角色，各司其职：老师负责主讲，助教补充细节，同学从多角度提问互动，模拟真实课堂场景，为 AI 辅助教育提供了创新思路。

Generative UI MCP 支持聊天中流式渲染 SVG/HTML

Generative UI MCP 为 AI Agent 提供了输出交互式生成式 UI 的能力，支持在 Craft Agent 和 Claude 聊天过程中流式渲染 SVG 和 HTML 内容，让 AI 对话能够直接生成可视化的交互界面，提升用户体验。

LosslessClaw：OpenClaw 长期记忆插件发布

开源插件 LosslessClaw 为 OpenClaw 提供强大的长期记忆能力。采用基于 DAG 树的分层摘要压缩设计，每条消息存储在 SQLite 数据库中，自动将旧对话压缩成树状摘要结构。支持 lcm_grep 等多种搜索工具，可一键安装并自定义压缩阈值，显著提升智能体的记忆力和上下文理解能力。

AMD 推出 RyzenClaw 和 RadeonClaw OpenClaw 参考主机

AMD 正式发布两款 OpenClaw 参考主机：RyzenClaw 搭载 AI MAX+ 395 芯片和 128GB 内存，RadeonClaw 需配备 R9700 工作站显卡。两款产品均支持本地运行大型 AI 模型，专为工程师和早期技术采用者设计，为本地 AI 开发提供强大的硬件支持。

OpenClaw 10 个安全风险及避坑指南

OpenClaw 使用中存在多个安全隐患需要注意：删除文件操作缺少二次确认、Token 消耗可能超支（有案例一周消耗 14 亿 Token）、公网暴露风险（约 22 万实例无认证保护）、恶意 Skills 泛滥（已发现 800+ 恶意插件）。建议用户开启二次确认、设置消费上限、使用 Docker 隔离环境、及时更新官方版本，确保使用安全。

开源安卓漫画翻译软件发布

发现频道推荐了一款新发布的开源安卓漫画翻译软件，为漫画爱好者提供便捷的翻译工具。

📖 教程攻略

盈透自动换汇 vs 手动临界点计算

盈透手动换汇最低2 美元，自动0.03%汇率差，低于6667 美元自动更划算。使用Claude查文档验证。

OpenClaw 简单案例：AI 处理文档

OpenClaw 案例：晚上不开电脑，让 AI 处理文档。https://t.co/EXLNHNfy0M

⭐ OpenClaw 中级高级篇教程大纲发布

中级篇覆盖三层记忆模型、搜索决策树、Heartbeat 整理（6 小时一次）；高级篇包括Skill 知识注入、Hook 反射弧、MCP 外部调用、自主任务拆解（6 步）、Token 四阶段优化省**70%**成本。

💎 技巧经验

Agent 开发建议：结构化优于 Markdown

如果需要 agent 必须遵循的规则，应使用结构化或可执行格式，而非 Markdown，可节省大量调试时间。

⚡ 工作流

Claude Code 本地投资框架工作流：订阅 Max + Skills 配置

用户分享 Claude Code 本地部署：订阅 Claude Max，写入投资框架到 memory，GitHub Skills 修改后集成，支持 local/global 触发和 slash command。

🧠 深度思考

⭐ 阿里云张献涛：Open Claw 是通往 AGI 的基础性项目

阿里云张献涛认为Open Claw是基础设施级项目，类比Linux，预计3 个月后比较好用，半年后非常好用，但安全和权限是内生矛盾。

OpenClaw 投研应用的冷思考

OpenClaw对**95%从业者 ROI 不高，真正价值在5%**深度定制任务。AI 投研目的是加速人脑迭代而非替代决策，金融分析师是 AI 暴露度最高职业之一。

AI 时代管理能力比文理科更重要

当数学和编程变成自然语言对话，关键是管理能力——能让人干好工作就能让 AI 干好工作，文理科界限不再重要。

💡 Life Advice

Michael Saylor 建议年轻人多读历史和科幻

Michael Saylor建议年轻人多读历史、阅读科幻、善用 AI，在未来技术领域寻找长期优势，并将比特币定义为数字资本。

📰 Industry News

智源 Workshop33 将聚焦 Agent 进化与 OpenClaw

BAAI 智源将于 3 月 18 日举办 Workshop33，讨论重点围绕 Agent 的演进方向，并以 OpenClaw 为切入点展开交流。该活动属于面向前沿 AI 研究与实践的专题研讨，适合关注智能体架构、能力扩展及相关开源项目进展的从业者与研究者。

Google Gemini 逐步向香港企业用户开放，无需 VPN 即可通过网页和 App 使用

Google 正在逐步向香港企业用户开放 Gemini 服务。根据报道，相关用户可直接通过网页端或 App 访问，无需借助 VPN。这意味着 Gemini 在香港企业场景的可用性进一步提升，或有助于推动本地企业在办公协作、内容生成和 AI 助手等方面的采用。

微软拟减轻 Windows 11 的 AI“臃肿化”，回应用户对 Copilot 深度集成的不满

据报道，微软正计划降低 Windows 11 中 AI 功能的“臃肿”程度，回应部分用户对系统被过度植入 Copilot 等 AI 能力的批评。相关调整方向包括减少深度集成、优化系统体验与资源占用，以缓解用户对功能冗余、界面复杂和性能负担的担忧。

富士康第四季度净利润不及预期，同比下滑约 2.4%，市场关注 AI 服务器需求走弱

富士康母公司鸿海第四季度业绩低于市场预期。综合报道，其季度净利润约为 452 亿至 455.1 亿新台币，低于分析师预期的约 599 亿至 638.6 亿新台币，同比下滑约 2.4%。尽管营收仍录得增长，但市场对 Nvidia 相关 AI 服务器需求疲软的担忧升温，成为拖累利润表现的重要背景。

华虹推进 7nm 芯片制造工艺，目标 2026 年底实现月产数千片晶圆

多则报道显示，华虹半导体正推进 7nm 芯片生产技术，相关产线位于上海华力微电子工厂。按披露信息，华虹目标是在 2026 年底前形成 7nm 工艺量产能力，月产规模从约 1000 片提升至数千片晶圆。若顺利落地，华虹有望成为中国少数具备 7nm 制程能力的晶圆厂之一。消息带动相关半导体个股上涨，市场也关注其在 AI 芯片制造链条中的潜在角色。

苏宁创始人张近东据报以个人资产清偿超 2387 亿元债务

报道称，苏宁集团创始人张近东通过拍卖个人持有的股权、房产等资产，用于清偿总额约 2387.12 亿元的债务，个人资产基本出清。法院已批准相关重整计划，在债务处置推进的同时，张近东仍保留一定公司治理层面的权利，如董事会提名权。该事件反映出苏宁长期债务风险处置进入更深阶段。

马斯克启动 Tesla“Terafab”芯片超级工厂项目，欲自建 AI 芯片产能

马斯克据报已启动 Tesla 的“Terafab”项目，目标是建设面向芯片制造的超级工厂，以满足公司自身对 AI 芯片的需求。马斯克认为当前行业芯片产能不足，自建产能有助于缓解供应瓶颈，并增强 Tesla 在自动驾驶、机器人和 AI 基础设施方面的硬件自主性。

中国 2 月 70 城房价环比下跌 0.28%，同比下跌 3.5%

国家统计局数据显示，中国 2 月 70 个大中城市房价环比下跌 0.28%，同比下跌 3.5%。新房价格方面，70 城中有 65 个城市环比下降，仅上海、杭州、合肥、乌鲁木齐、宜昌等少数城市上涨。数据表明房地产市场价格仍承压，区域分化持续存在。

中国 1—2 月社会消费品零售总额同比增长 2.8%，略高于预期

数据显示，1—2 月中国社会消费品零售总额为 86079 亿元，同比增长 2.8%，高于市场预期的 2.5%。不过，报道同时指出，统计口径数据与部分行业实际感知之间仍存在较大差异，显示消费恢复仍不均衡，宏观改善与微观体感之间存在落差。

中国 1—2 月固定资产投资同比增长 1.8%，民间投资下降 2.6%

1—2 月全国固定资产投资为 52721 亿元，同比增长 1.8%，整体增速偏弱。其中文间投资同比下降 2.6%，反映企业投资意愿仍待修复。数据显示，当前投资端的扩张动力不足，经济增长更多依赖结构性支撑，市场对后续稳投资政策力度保持关注。

中国 1—2 月房地产开发投资同比下降 11.1%，行业继续探底

数据显示，1—2 月全国房地产开发投资 9612 亿元，同比下降 11.1%，其中住宅投资下降 10.7%。尽管新建办公楼销售面积同比增长 25%，但整体来看，房地产投资端仍处于明显下行阶段，行业修复压力较大。该数据与房价、销售等指标共同印证楼市仍在调整之中。

央视 315 点名网红“马前卒”造谣霸王茶姬，警方已采取刑事强制措施

央视新闻报道，网络博主任某因将霸王茶姬与“准毒品”错误关联并传播不实信息，引发广泛关注，相关内容浏览量超过 4000 万。上海警方已对其采取刑事强制措施。事件显示，针对消费品牌的恶意造谣与流量化传播正在受到更严格打击，也再次凸显平台内容治理的重要性。

315 晚会曝光食品非法添加问题：部分茶饮、咖啡检出违禁成分

315 晚会曝光食品非法添加黑色产业链，涉及部分茶叶、咖啡产品被检出含有俗称“伟哥”的成分，另有果冻、西梅汁等产品被指含强效泻药成分。事件反映出部分食品和饮品供应链存在严重的合规与安全隐患，也可能引发监管部门进一步加大对原料采购、代工生产和电商销售渠道的整治力度。

泰国国会主席宣布将于 3 月 19 日举行总理选举

据报道，泰国国会主席宣布将于 3 月 19 日举行总理选举。该安排意味着泰国政局将迎来新的关键节点，选举结果可能对国内政治平衡、政策连续性以及市场情绪产生直接影响。

工信部提出适度超前布局 5G 和智算基础设施，推进“人工智能+制造”

工信部在干部大会上提出，要推动“5G+工业互联网”升级版，适度超前布局 5G 与智能计算基础设施，并实施“人工智能+制造”行动。同时，政策还强调培育特色智能体，推动 AI 技术与制造业深度融合。这释放出新型基础设施和工业智能化继续加码的信号。

外汇局：2 月银行结售汇顺差 428 亿美元，跨境资金净流入 356 亿美元

国家外汇管理局公布数据显示，2 月外汇市场交易量达 2.6 万亿美元，跨境资金净流入 356 亿美元，银行结售汇顺差 428 亿美元。1—2 月累计结汇 4927 亿美元。整体数据表明，短期内中国跨境资金流动保持相对稳定，外汇供求延续基本平衡格局。

📚 前沿研究 & Papers

腾讯混元与清华联合提出 Spatial-TTT：以快权重高效处理超长视频流，7000+帧下实现子线性内存增长

腾讯混元与清华大学联合提出 Spatial-TTT 框架，面向长视频流理解中的计算与显存瓶颈问题，引入 TTT（测试时训练）式快权重机制来处理时空信息。该方法可在超过 7000 帧的视频输入下实现子线性内存增长，同时将计算成本降低约 40%，并在 VSI-Bench 上取得当前最优结果。项目同时提供 GitHub 与 Hugging Face 开源资源，兼具研究价值与工程可复现性，适合关注长上下文视频建模、在线视频理解和高效推理的研究者参考。

阿里开源 Fun-CineForge：面向复杂电影场景的多模态配音模型，支持多角色对话与时间对齐

阿里通义实验室开源多模态电影配音模型 Fun-CineForge，聚焦复杂影视场景中的自动配音任务。该模型支持多角色识别与对话切换、时间模态对齐，并结合视频理解能力处理人物、镜头与语音之间的协同关系，适用于电影、短剧等高复杂度内容生成。相较一般配音方案，Fun-CineForge 更强调场景级理解与角色一致性。项目同时开放数据集处理流程、GitHub、Hugging Face 及 ModelScope 权重与检查点，具备较强的研究复现和应用落地价值。

斯坦福与 CMU 研究指出：现有 AI 基准忽略 76.4% 的真实工作任务

斯坦福大学与卡内基梅隆大学对 43 个 AI 基准和 72,000 项真实任务进行分析后发现，当前主流评测与现实工作的匹配度明显不足：编程和数学类任务在基准中占比突出，但在真实工作中仅约占 7.6%；而管理、法律等高价值领域却被大幅忽略。研究认为，现有 AI 基准过度聚焦易量化、易标准化的问题，导致模型能力评估与真实经济价值脱节。这一结论对学术界和产业界重新设计更贴近实际应用场景的评测体系具有重要启发意义。

LookaheadKV：无需实际生成即可预览未来 token 的 KV 缓存驱逐方法

新论文 LookaheadKV 提出一种更高效的 KV 缓存驱逐方案，核心思路是在不真正执行完整生成的前提下“预览”未来 token，从而更准确地判断哪些缓存内容应被保留或淘汰。该方法试图解决长上下文推理中 KV 缓存快速膨胀带来的显存与效率问题，在保持生成质量的同时提升推理资源利用率。对于大模型推理优化、长文本生成以及部署侧成本控制而言，这一方法具有较高研究关注价值。

LMEB：面向长时程记忆能力的嵌入式基准测试

LMEB（Long-horizon Memory Embedding Benchmark）是一项用于评估 AI 模型长序列记忆与长期信息保持能力的基准测试。该工作聚焦模型在跨较长时间跨度或上下文范围内的表示、检索与记忆稳定性问题，尝试衡量模型是否真正具备长时程记忆能力，而不仅是短窗口内的表面匹配。随着长上下文模型和记忆增强架构快速发展，此类基准有助于更系统地比较不同模型在长期依赖建模方面的真实表现。

Kimi 提出 Attention Residuals：以输入依赖注意力替代残差连接，计算效率提升 1.25 倍

Kimi 发布 Attention Residuals 研究，用输入依赖的注意力机制替代传统残差连接，以提升模型表达能力与计算效率。方案支持 Block AttnRes 分块设计，并在 Kimi Linear 架构中验证效果：模型总参数为 48B、激活参数约 3B，在推理延迟增加不足 2% 的情况下，实现约 1.25 倍计算效率提升。该工作为 Transformer 类架构中长期沿用的残差路径提供了新的替代思路，兼具结构创新与工程可行性，对高效大模型设计具有参考价值。

智谱发布 ZClawBench：基于真实用例评测智能体能力，Claude Opus 4.6 排名第一

智谱发布 ZClawBench，该基准基于 OpenClaw 的真实使用场景构建，用于评测模型在智能体任务中的综合能力。结果显示，Claude Opus 4.6 表现最佳；GLM-5-Turbo 相比 GLM-5 有显著提升，并在国内模型中保持领先。评测还披露了 Skills 使用率达到 45%，说明工具调用与任务技能编排已成为衡量智能体能力的重要维度。相较传统静态问答基准，ZClawBench 更强调真实任务执行与应用可用性。

GigaTIME：微软等机构开源病理模型，可从低成本组织切片预测癌症免疫治疗响应

微软、Providence Health 与华盛顿大学联合开发并开源 GigaTIME，用于从低成本组织切片中预测癌症免疫疗法响应。该模型可从约 5 美元的病理切片中推断 21 种蛋白标记，覆盖 24 类癌症、306 个亚型，并在 14,256 名患者数据上完成验证，报告一致性达到 0.88。研究显示，GigaTIME 有望在更低成本、更高可及性的条件下支持肿瘤分型与疗法响应预测。模型已在 Hugging Face 开源，兼具医学研究与临床转化潜力。

dots.mocr 刷新多模态 OCR 纪录：在 olmOCR Bench 达到 83.9，图表解析超过 Gemini 3 Pro

多模态 OCR 模型 dots.mocr 在 olmOCR Bench 上取得 83.9 分的新纪录，达到当前最优水平之一，整体表现仅次于 Gemini 3 Pro；在图表解析任务上则超过 Gemini 3 Pro。该模型支持图表、UI 界面、科学图像和化学图等复杂视觉文本场景，显示出较强的跨版式、多元素理解能力。对于文档解析、科研图像识别和企业知识数字化等应用场景，dots.mocr 的成绩体现了多模态 OCR 正在从文字识别走向更复杂的结构化理解。

室温超导研究再有进展：常压下在 -122°C 实现超导记录

一项超导研究报告称，在常压条件下于 -122°C 实现新的超导温度纪录，并指出通过压力淬火方法未来可能进一步提升上限。相较高压超导体系，这类更接近常压、温度更高的结果更容易被实验复现，也更有助于推动材料机理研究与潜在应用探索。尽管距离真正“室温常压超导”仍有明显差距，但该进展再次提升了学界对高温超导材料路线的关注度。

AI 领导力：像管理团队一样管理 AI，腾讯专家在 QCon 2025 分享实践框架

在 QCon 2025 演讲中，腾讯专家工程师揭光发提出“AI 领导力”方法论，主张像管理团队一样管理 AI 系统。其框架包括四大支柱：知 AI 善任、目标设定、过程管理和结果验收，并结合 Vibe Coding、Vibe Working 等实践经验，讨论如何在组织中有效使用 AI 协作完成任务。该分享更偏方法论与管理实践，关注的不是单一模型能力，而是如何将 AI 纳入团队流程、建立可控、可评估、可复盘的工作机制。

查看完整交互版本（含目录导航） →

EVENT-DRIVEN INTELLIGENCE

免费先看重点，Pro 再看速度、深度和可追踪性

这篇内容是公开入口。继续使用天眼时，固定沿着三条路径走：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件帮你建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情