天眼晚报
🤖 AI 大模型
𝕏 Claude Opus 4.7 在核磁共振分析上媲美专业化学软件
Anthropic报告显示,Claude Opus 4.7在预测 NMR 谱图上接近专业软件MestReNova水平,并能从 NMR 数据反向推断分子结构,无需化学微调。
💻 OpenAI 推出 Lockdown Mode 保护敏感数据防提示注入
OpenAI发布新安全功能Lockdown Mode,旨在降低 ChatGPT 在处理敏感数据时遭提示注入攻击的风险,但仍不能完全免疫。
𝕏 Papa Johns 成为首家采用 Google AI 语音订餐代理的快餐连锁
Papa Johns采用Google Food Ordering AI Agent实现个性化语音订餐,Gemini Enterprise Agent Platform帮助跟踪转化率和购物车放弃。
𝕏 ChatGPT 月活跃用户突破 10 亿
Sensor Tower数据显示,ChatGPT月活用户正式突破10 亿,成为史上增速最快的应用,耗时不到三年,超越 Google Maps、TikTok、Instagram 和 YouTube。
𝕏 Agent Arena 发布真实工作场景 AI 模型排行榜
Arena 发布基于 30 万+任务、200 万+工具调用的 Agent 排行榜,GPT-5.5 High以+10.7%净提升领先,Claude Opus 4.7 Thinking +9.5%位列第二,GPT-5.4 High +8.9%第三。
𝕏 本周开源 AI 模型爆发:25+重磅模型密集发布
本周开源 AI 领域迎来历史性一周,NVIDIA发布Nemotron 3 Ultra(550B 混合 Mamba-MoE)、Google发布Gemma 4 12B(全模态任意输入输出)、Ideogram 4首次开放权重(9.3B 流匹配 DiT)、Liquid AI LFM2.5-8B-A1B 边缘 MoE、JetBrains Mellum2-12B 等,覆盖 LLM、图像生成、语音、视频、3D 等多模态。
𝕏 Ideogram 4 首次开放模型权重,称最强开源文生图模型
Ideogram 4(9.3B 参数)首次以开放权重形式发布,在 Design Arena 和 LMArena 上排名第二(仅次于 GPT Image 2),成为当前最强的开源文生图模型,尤其擅长处理图文混合场景。
𝕏 Anthropic 内部 80%代码已由 Claude 编写
Anthropic 表示 Claude 现在编写了公司 80% 以上的生产代码,工程师人均每日合并代码量是 2024 年的 8 倍。在内部优化任务中,Claude Mythos 预览版效率达到资深人类的 52 倍。
𝕏 DeepSeek V4 更新引发内容审查争议
DeepSeek V4 被指出在代码改进后在关键历史事件回复中出现内容审查,该行为引发技术社区广泛讨论。
𝕏 谷歌每月支付 SpaceX 9.2 亿美元租用 GPU 算力
谷歌与SpaceX达成协议,每月支付9.2 亿美元租用11 万块英伟达 GPU用于 AI 计算,协议从 2026 年 10 月至 2029 年 6 月。此前Anthropic已与 SpaceX 达成类似租约。
𝕏 混合法律 Agent 性能超越前沿模型
Fireworks AI与合作伙伴训练开源法律模型,使用GLM 5.1为主力、Opus 4.7为顾问的混合 Agent,在 100 任务中18%全通过,而 Opus 仅 14%,成本仅**$368** vs $954。
Meta 一再推迟向开发者发布新 AI 模型
据WSJ报道,Meta持续推迟向开发者发布其最新 AI 模型,具体原因未披露,此举可能影响开发者生态与开源策略。
𝕏 国产算力里程碑:千卡昇腾 910C 跑通 DeepSeek 1.6 万亿模型全参数后训练
联合攻关团队(河套学院、哈工大、华为等)在国产 AI 算力平台上成功跑通DeepSeek-V4-Pro全参数后训练,1.6 万亿参数,全球首次。
𝕏 Google 发布 Gemma 4 量化系列:QAT 与量化检查点
Google发布Gemma 4 QAT,量化感知训练后内存减少3 倍,16GB RAM即可运行Gemma 4 26B-A4B;同时发布量化训练检查点,所有模型尺寸可在Hugging Face下载,量化后本地运行内存需求减少 50%,手机、笔记本、树莓派等端侧设备可流畅运行。
美国政府考虑入股大型 AI 企业
三名知情人士透露,美国政府高级官员已与美国大型 AI 企业进行初步讨论,探讨政府入股的可能性,尚未有具体方案。
𝕏 OpenAI 大规模封号后陆续解封,赠送 1 个月订阅补偿
OpenAI大规模封号后正在解封账号,向掉订阅用户赠送1 个月同等级订阅。被封号包括在美国使用正价200 美元Pro 的用户。
𝕏 ChatGPT 推出全新记忆系统:dreaming 机制与跨对话记忆
ChatGPT上线'dreaming'记忆机制,相比旧 saved memories 更主动,后台自动整理用户上下文,长期对话效果显著提升;同时推出新记忆系统,自动总结用户偏好、项目背景、工作习惯,跨对话持续使用,用户无需每次重新介绍上下文。
𝕏 腾讯 WorkBuddy 成为中国首个 PC 端生产力 AI Agent
腾讯 WorkBuddy支持读取文件、调用工具、写报告、分析数据,连接GitHub/Jira/Notion等,支持从 Slack/微信控制。
𝕏 Grok Build 推出新版本:增强并行工具调用和提问能力
xAI推出Grok Build新版本,增加并行工具调用行为,提升提问能力,优化展示效果。
𝕏 Claude Code 上下文超 70-80%后出现幻觉
用户经验:Claude Code在上下文利用率超过 70-80%时,回复质量下降,开始胡言乱语。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。