天眼早报
🤖 AI 大模型
𝕏 Anthropic Claude Fable 5 遭美国政府出口管制及后续进展
美国政府以国家安全为由,对Anthropic发布仅 3 天的旗舰模型Claude Fable 5实施出口管制,要求切断所有外国用户访问,包括盟友。亚马逊CEO 安迪·贾西在测试中发现越狱漏洞后向白宫报告,Anthropic 拒绝修复漏洞,导致封禁。公司已派遣技术团队赴华盛顿斡旋,希望尽快恢复访问。同时,Fable 5 在代码迁移和重构方面表现突出,Stripe 用其一天完成 5000 万行 Ruby 代码迁移。此外,有疑似 Fable 5 系统提示词在 GitHub 泄露,包含产品身份、工具路由等详细设计。Anthropic CEO 达里奥·阿莫代伊长期预警 AI 风险,此次反噬引发争议。
🔶 OpenAI 遭美国多州总检察长集体调查,传票关注“模型谄媚”
由多州总检察长组成的联盟对OpenAI展开调查,上周五收到传票,要求提供广告、用户数据、模型谄媚等相关文件。传票首次将“模型谄媚”写入取证清单,此前多起用户伤害诉讼指向 ChatGPT。OpenAI 表示将建设性合作,这是各州针对 AI 公司的最新法律行动,正面临 IPO 与监管赛跑。
智谱 AI 发布 GLM-5.2 旗舰模型,支持 1M 上下文,超越 Fable 5 成本仅十分之一
智谱 AI发布GLM-5.2旗舰模型,核心升级为100 万 token上下文窗口(5 倍于 5.1 版),最大输出 131072 token。新增 High 和 Max 两级推理力度。将遵循MIT 协议开源。在BridgeBench基准上以100.0分排名第一,推理得分42.8超过 Fable 5,成本仅为Fable 5的1/10,速度达300 tokens/秒。港股盘中一度涨47.68%。兼容 Claude Code、Cline 等 8 种编程工具。
AI 大模型厂商陷入“订阅困局”:重度用户导致严重亏损
SemiAnalysis测评显示,OpenAI和Anthropic的订阅模式面临成本危机。ChatGPT Pro200 美元计划在重度使用下 API 成本高达1.4 万美元;Claude Max极限下成本8000 美元。厂商被迫收缩不限量策略。企业正采用任务路由将 AI 成本削减95%。
🔶 Google DeepMind 发布 57 页报告《从 AGI 到 ASI》
Shane Legg等十余位 DeepMind 研究员发布报告,系统分析从通用人工智能到超级人工智能的四条路径:持续扩大规模、算法范式转变、递归自我改进、多智能体协作。报告也指出数据墙、资源极限等六道减速关卡。
🔶 巴西黑马大模型 Rio3.5 发布后翻车,被指套壳缝合国产模型
巴西里约热内卢市政府旗下 IT 公司开源的Rio 3.5 397B模型,采用 MoE 架构和 SwiReasoning 框架,在多项基准测试中超越Qwen 3.7 Plus等开源模型,引发 AI 社区轰动。不到 24 小时被Nex-AGI指认套壳缝合,该模型实际拼接国产开源模型。
𝕏 SemiAnalysis 深度解析:SMIC N+3 节点金属间距小于 Intel 18A?
SemiAnalysis发布对SMIC N+3节点的深度评测,对比TSMC N6,并分析了HiSilicon Kirin 9030、工艺技术、单元架构等关键指标,揭示国产芯片最新进展。
WWDC 2026:Apple 租用 Google 的 1.2 万亿参数模型重建 Siri
Apple 在 WWDC 2026 发布全新 Siri AI,基于与 Google 合作的 1.2 万亿参数 模型,年成本约 10 亿美元。新 Siri 具备屏幕感知、个人上下文理解能力,最少需要 12GB 内存。
Google 发布 Gemini-SQL2,Text-to-SQL 执行准确率 80.04%刷新纪录
Google Research 发布 Gemini-SQL2,基于 Gemini 3.1 Pro 构建,在 BIRD 基准上达到 80.04% 执行准确率,覆盖 37 个专业领域 的 95 个数据库。刷新榜单纪录,但未公布 API 细节。
OpenAI 斥资 1.5 亿美元启动合作伙伴网络,加速企业 AI 转型
OpenAI 宣布推出合作伙伴网络,投入 1.5 亿美元,目标 2026 年底认证 30 万 专业顾问。首批加入者包括 埃森哲、贝恩、波士顿咨询、麦肯锡、普华永道 等顶级咨询公司。
𝕏 OpenRouter 发布 Fusion:一次调用融合多模型输出,低成本超越前沿模型
模型聚合平台OpenRouter推出Fusion,将同一提示并行发给一组模型,再由 judge 模型合成答案。在 DRACO 基准测试中,由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro组成的预算面板得分64.7%,接近 Fable 5 单模型,成本约一半。三个平价模型组合以约半价达到64.7%,超过 GPT-5.5 和 Opus4.8。
𝕏 研究揭示 AI Agent 部署后会逐渐不可靠,提出 AgingBench 基准
德克萨斯大学论文发现 AI 代理在部署后即使模型不变也会逐渐退化,因为记忆压缩、事实混同、维护清空等过程会悄悄劣化。提出的AgingBench基准检查代理跨会话的可靠性。研究警告“给更多记忆”往往是错误修复。
Anthropic 即将启用实名制刷脸验证
Anthropic发送隐私政策更新邮件,从7 月 8 日起可能要求用户验证年龄或身份,通过第三方Persona上传身份证件和自拍照。验证针对消费级账户(Free、Pro、Max),且未来随 Agent 任务复杂化可能扩大范围。
古尔曼:苹果新版 Siri 相当于头部 AI 六个月前水平
彭博社古尔曼测试新版Siri后表示,苹果终于进入现代 AI 市场,但能力大致相当于领先 AI 聊天机器人六个月前的水平。新功能包括个人情境和屏幕感知。
18.42 万亿 Token!中国 AI 大模型周调用量连续七周领跑
据 OpenRouter 数据,上周全球大模型总调用量 44.6 万亿 Token,中国 18.42 万亿,连续七周超美国。DeepSeek-V4-Flash 周调用量 4.41 万亿蝉联第一,MiniMax M3 升至第二。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。