天眼早报
🤖 AI 大模型
𝕏 AlphaFold 之父、诺贝尔化学奖得主 John Jumper 离开 Google DeepMind 加入 Anthropic
2024 年诺贝尔化学奖得主、AlphaFold核心负责人John Jumper宣布离开Google DeepMind加入竞争对手Anthropic。他博士毕业仅 6 个月即被 Demis Hassabis 任命领导 AlphaFold 团队,此次跨界加入 AI 安全公司引发行业震动。Anthropic 近期已吸纳多位 OpenAI 及 DeepMind 核心研究员。这是继 Noam Shazeer 等之后又一重大人才流失。
𝕏 GLM 5.2 开源模型发布后迅速登上多个排行榜前列
智谱 AI开源模型GLM 5.2在Agent Arena排名升至第三,超越 Google;在PostTrainBench上取得SOTA,超越GPT-5.5和Opus 4.8;在OpenCode等平台发布的排行榜中位列第 6。该模型采用反奖励黑客模块训练,在长程任务中表现优异。多位开发者反馈其在金融基准测试中通过率约80%,远超其他开源模型。Artificial Analysis排行榜中幻觉率持续下降(V5 系列从 34%降至 28%)。
𝕏 Goldman Sachs:AI 竞赛成 5.3 万亿美元资本开支周期
Goldman Sachs预计 2025-2030 年超大规模云商在 AI 和数据中心上的资本开支达5.3 万亿美元。AI 基础设施融资面临瓶颈,投资者担心发行人集中度。瓶颈或从模型需求转向融资能力、电力供应和项目执行。
𝕏 研究表明数据中心并未推高美国居民电价,甚至略有降低
一篇arXiv论文(2606.19777)分析 2015-2024 年美国各州数据发现,数据中心容量上升**10%与居民电价下降约0.4%**相关。原因是固定成本分摊到更多电量上。但论文警告若电网供给不足,效应可能翻转。
𝕏 特朗普政府与 Anthropic 因 AI 安全爆发冲突
The Economist报道:特朗普政府希望 AI 技术增强美国全球地位,而Anthropic担心其工具需要安全防护,双方产生巨大分歧。
𝕏 Anthropic AECI 预测 Mythos 5 的 METR 时间视野达 61.3 小时
Anthropic的 AI 能力评估(AECI)预测其Mythos 5模型在METR(衡量自主完成任务时间)上的可达61.3 小时,逼近100 小时大关。这标志着 AI 自主性正向马拉松级任务迈进。
𝕏 Google DeepMind 内部爆料:排名落后且组织官僚化
据DeepMind内部员工爆料,公司在Artificial Analysis榜单仅排第五,落后于Anthropic、OpenAI及智谱 AI。上次明显进步的模型是 4 个月前的 3.5 Flash,预计 6 月 30 日发布的Gemini 3.5 Pro被内部认为“不是我们需要的 step change”。员工质疑资源最多、硬件最强却守不住前沿。
𝕏 AI 基础设施缺口:AMP 计算网格显示 4.7 GW 结构性短缺
AMP运营者Anjney Midha透露其已确保1.3 GW电力,但四年内需求约6 GW,缺口4.7 GW。预期 2026 年底的过剩在六周内消失,短缺是结构性的而非 2024 年遗留问题。
𝕏 有道开源 1.3B TTS 模型,支持 14 小语种和语音克隆
有道开源 1.3B 大小的TTS模型,支持14 个小语种,可实现高精度语音克隆,保留角色原本声音、语气和情绪。
𝕏 OpenRouter 评测显示中国模型在 OpenRouter 上超过美国,但实际仅占全球 Token 约 1%
分析师通过对比OpenRouter(100 万亿 token/月)与Google(3200 万亿 token/月)、OpenAI等行业总量,指出OpenRouter仅占全球 token 消耗的约1%,且其用户群偏向价格敏感的西方开发者。中国模型在这一非典型样本中领先,并不代表全球竞争力。
𝕏 Elon Musk 预测 AI 与机器人将导致通缩,建议直接向民众发钱
马斯克表示,只要商品和服务增速超过货币供应增速(AI 与机器人可实现),就不会有通胀,反而需对抗通缩。他建议直接由财政部向人民发钱。
𝕏 GitHub 为 Copilot Max 用户提供额外 $200 积分,推广 AI 构建
GitHub宣布Copilot Max用户可获得额外**$200**积分用以在 GitHub Copilot 应用中构建项目。Pro 和 Pro+用户后续也将获得优惠。
𝕏 Claude Code 2.1.185 发布:优化流超时提示机制
Anthropic发布Claude Code CLI 2.1.185,流中断提示改为“等待 API 响应·将重试”,触发时间从10 秒延长至20 秒,减少过早重试。
𝕏 GitHub 研究发现 LLM 上下文验证可将秘密扫描误报减少 75.76%
GitHub与合作伙伴研究表明,利用LLM进行上下文验证,可将秘密扫描告警的误报率降低75.76%。相关研究成果已发布。
𝕏 多人反映 Codex 近期变笨,Claude Code CLI 亦被指不如 Codex
多名开发者反馈OpenAI Codex近几天表现变差(“y codex so dumb”),同时Claude Code CLI被认为在面向工作场景上落后于Codex。另一用户指出 Codex 在长程标准化任务上仍优于 Claude Code。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。