天眼日报

🤖 AI 大模型
Databricks 发布 OfficeQA Pro 评测,前沿模型在企业文档推理上最高仅 48.1%
Databricks 推出 OfficeQA Pro 评测,基于美国财政部近 100 年公报、89000 页文档与 2600 万数值测试企业文档推理。Claude Opus 得分 48.1%居首,GPT-5.4 为 36.1%。
Fish Audio 开源 S2/S2 Pro TTS 模型,支持 80+语言、实时多说话人生成与词级情绪控制
Fish Audio 发布 S2 Pro,支持 80+语言和细粒度内联控制,已提供 Hugging Face 下载入口。同时开源 S2-Pro 和 S2 模型,主打文本生成音频、语音克隆、实时多说话人 TTS(RTF 0.195、首包延迟 100ms)、词级情绪标签与流式推理,延迟低于 150ms,基于约 1000 万小时、近 50 种语言音频训练,情绪与音色还原接近商用品质,权重与代码已开源。
Hugging Face 推出 Storage Buckets,提供类 S3 可变存储
Hugging Face 上线 Storage Buckets,支持类 S3 可变存储、快速写入与覆盖,面向检查点、日志和处理后数据等高吞吐 AI 场景。
Hugging Face CLI 现已支持通过 Homebrew 安装
Hugging Face 官方 CLI 现可直接通过 brew install hf 安装,降低本地工具接入门槛。
飞书上线云端 OpenClaw 创建服务,月底前限免每日 10 万额度
飞书上线云端 OpenClaw 创建服务,支持一步部署,活动称限免至月底,每日提供 10 万额度。
ModelScope 介绍 Sirchmunk,无需向量数据库的本地检索方案
Sirchmunk 主打无 VectorDB 检索,支持自演化索引、MCP Server、Web UI 与 Docker,面向本地仓库和网页数据搜索。
Anthropic 起诉美国政府撤销供应链风险标签
Anthropic 在两个法院起诉美国政府,要求撤销供应链风险标签。公司称该标签针对外国威胁而非美国公司,OpenAI 和 Google 超过 30 名员工联名支持。
Kimi K2.5 成为 DHH 日常高频使用模型
DHH 表示 Kimi K2.5 是日常基础任务首选,通过 Fireworks 在 OpenCode 中以 200 tps 运行。
A16z 发布 Top 100 AI 应用排行榜,Claude 排第 6
A16z 发布 Top 100 AI 应用排行榜,Claude 仅排第 6 位,Anthropic 平均每用户月贡献 200 美元,付费意愿远超其他 AI 产品。
Nature 研究:所有主流 AI 模型均可被诱导协助学术造假
Nature 发表研究显示,测试的 13 个主流 AI 模型(包括 GPT-5、Claude 等)均可被诱导帮助撰写虚假论文或制造垃圾科学,Claude 抵抗能力最强但仍可被长对话绕过。
OpenAI 将 Sora 视频生成功能整合进 ChatGPT
OpenAI 将 Sora 视频生成能力添加至 ChatGPT,可能提升使用量但也增加成本,独立 Sora 应用将继续运营但长期前景不明。
百度云推出零部署 OpenClaw 服务 DuClaw
百度云推出 DuClaw 服务,预装百度搜索、百科和学术搜索技能,支持 DeepSeek、Kimi-K2.5、GLM-5、MiniMax-M2 等模型,现可通过网页访问。
Claude Code 新增/btw 支线对话命令
Claude Code 新增/btw 命令,可在主任务执行过程中发起一次性支线提问,不中断重构、测试或多文件改动流程。
OpenClaw-RL 支持基于用户反馈异步强化学习
OpenClaw-RL 将本地模型封装为 API,依据点赞、纠错等反馈在后台异步学习,项目称上月底开源、当前约 1.3k stars。
微软研究提出 PlugMem 通用智能体记忆系统
Microsoft Research 的 PlugMem 将交互历史转为事实与技能知识单元,提升长期记忆检索效率并减少上下文浪费。
Google 发布 Gemini Embedding 2 原生多模态嵌入模型
Google 推出 Gemini Embedding 2,单模型统一处理文本、图像、视频、音频、文档,支持交错多模态输入和 100 种语言;官方称用于检索时相较多模型串联,延迟降低 70%、召回率提升 20%,上下文窗口 8K token,MTEB 基准领先。现已在 Gemini API 和 Vertex AI 预览,适用于语义搜索、分类、聚类与 RAG。
ChatGPT 新增交互式学习功能,覆盖 70 多个数学与科学概念
ChatGPT 上线交互式学习,免费用户可用,当前覆盖 70+数学和科学概念。
Kimi 创始人杨植麟将在 Nvidia GTC 公开分享 Kimi K2.5 训练细节
Kimi 创始人杨植麟将于 3 月 17 日 11:00 PDT 在 Nvidia GTC 分享 K2.5 训练细节。
Sora 网页端新增 References 参考素材功能
Sora 在网页端视频编辑器上线 References 标签,可复用角色、风格、道具、服装、镜头运动与提示词清单,帮助多段视频保持一致性。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。