天眼晚报
🤖 AI 大模型
𝕏 SpaceX 发布太瓦级太空 AI 卫星计划,首颗卫星算力达 120 千瓦
SpaceX 宣布启动 AI 卫星 项目,首颗卫星配备 150 千瓦 峰值功率与 120 千瓦 持续算力,相当于单台 NVIDIA GB300 机架。卫星采用 70 米 翼展太阳能阵列,通过 激光链路 互联,目标在 2027 年底 实现 1GW 年部署速率,最终迈向 1TW 算力规模。
𝕏 Cognition 发布 FrontierCode 代码评估基准,Claude Opus 4.8 领跑
Cognition 发布 FrontierCode 代码评估基准,涵盖 150 个任务。Claude Opus 4.8 在最高难度子集(Diamond)获得 13.4% 得分,远超 GPT-5.5 的 6.3%。该评测强调代码的 可合并性 与 回归安全,揭示当前模型在高质量工程代码生成上仍有巨大提升空间。
𝕏 OpenAI 发布《为造福所有人而生》愿景宣言,定调 2028 自动化研究员
OpenAI 首席执行官 Sam Altman 与首席科学家 Jakub Pachocki 联合发布愿景宣言,提出 AI 将迈入“第三阶段”,致力于让 AI 像电力一样普及。宣言明确规划到 2028 年 3 月 实现 自动化 AI 研究员,并呼吁建立国际组织协调前沿 AI 安全,强调人机协同而非完全替代人类。
𝕏 Anthropic Mythos 传闻即将发布,定价 $125/M output token
据多方消息,Anthropic 将在 6 月 10 日发布 Mythos 模型,定价极高:输入 $25/M token,输出 $125/M token。Palo Alto Networks 称用 Mythos 6 周找出 5-6 年安全漏洞。
𝕏 Step 3.7 Flash 在 Coding Agent 任务中表现亮眼
开发者测试 StepFun 的 Step 3.7 Flash 模型,在 Cursor Agent 中从真实 Agent traces 生成可检查的本地 HTML 工具,展示了模型读上下文、查资料、写代码的综合能力。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。