天眼晚报
🤖 AI 大模型
SpaceX 登陆纳斯达克,马斯克成为全球首位万亿美元富豪
SpaceX IPO 首日在纳斯达克交易(代码 SPCX),开盘市值超 2 万亿美元,位列美股第七。马斯克 个人财富飙升至约 1.05 万亿美元,成为全球首位 万亿富豪。IPO 募资 750 亿美元 创历史纪录。
美伊谈判接近达成协议,伊朗资金释放
一名 美国高级官员 表示,美伊 尚未到达终点线但已“非常接近”,预计未来几天签署 谅解备忘录。阿联酋 已同意向 伊朗 释放总计 100 亿美元 的冻结资金。伊朗外交部 发言人表示,双方已就谈判中的 大部分问题达成共识,处于内部决策最后阶段。条款包括重新开放 霍尔木兹海峡 和解锁港口。
Claude Fable 5 发布,成为最强公开 AI 模型并登顶编码代理指数
Anthropic 发布 Claude Fable 5,基于 Mythos 5 模型,能力大幅超越前代。在 WeirdML 基准测试中,80% 的独立运行得分达历史最佳 10%以内。在 Artificial Analysis 编码代理指数中,Claude Code with Fable 5 得分 77 领先,超越 Opus 4.8。生物和网络能力接近危险阈值,需 30 天 数据留存,约 5%查询降级到 Opus 4.8。
💻 Mistral 被曝融资 30 亿欧元,估值达 200 亿欧元
据 TechCrunch 报道,Mistral 正在以约 200 亿欧元(231.5 亿美元)估值融资 30 亿欧元,估值较 C 轮翻倍。
𝕏 Dario Amodei:强大 AI 将成为国家军事和经济主导力量
Anthropic CEO 在博客中称,强大 AI 将很快成为任何国家军事和经济力量的主要来源,远超过去技术。领先 AI 意味着拥有'数据中心里的天才之国'。
𝕏 研究:稀疏自编码器可能不是差劲的模型控制工具
论文表明 稀疏自编码器 可优于简单基线用于模型控制,关键在于特征标签的因果权重。该工作挑战了之前认为 SAE 控制能力弱的结论。
Anthropic 报告称 80% 代码由 Claude 编写,“递归自我改进”引发热议
Anthropic 发布博文称 80% 的代码由 Claude 编写,并提出 递归自我改进(RSI) 概念。数据显示工程师代码产出提升 8 倍,仅 4 月就完成 800+ API 修复。OpenAI 和 Sakana AI 也跟进讨论。
Anthropic Claude Code 翻车复盘:三个生产事故的深刻教训
Anthropic 罕见公布 Claude Code 三个生产事故:默认推理强度从 high 改 medium 致变笨(1 个月后回滚)、缓存优化误清 thinking history 导致遗忘、在 system prompt 加字数限制导致编程质量降 3%。文章强调了 reasoning history 是工作记忆、系统提示每一步都是代码等原则。
𝕏 OpenAI 收购云端执行平台 Ona,强化 Codex 生态
OpenAI 宣布收购开发者云端执行平台 Ona,其安全云执行与任务编排技术将整合至 Codex 生态。OpenAI 表示目前每周超 500 万人使用 Codex,较年初增 400%,收购将推动 Codex 向企业级长期运行 AI 智能体平台演进。
三年半突破 10 亿月活,ChatGPT 成为史上增长最快应用
Sensor Tower数据显示,ChatGPT自 2022 年 11 月推出至今仅用3.5 年即突破10 亿月度活跃用户,打破此前 Google 地图保持的5 年纪录。Claude和Meta AI也位列增长最快应用前列。
小米 MiMo Code 开源,但 bug 引发争议
小米 MiMo 团队开源终端编程 Agent MiMo Code(基于 OpenCode),采用 MIT 协议。宣称在 SWE-Bench 等基准中优于 Claude Code,但开源后229 个 Issues暴露自动删除 npm 包、内存泄漏等问题。实测 1 小时仅写 4 个文件。罗福莉称这是 14 天 5 人的 vibe coding 之旅。
华为发布 openPangu 2.0 大模型
华为 在 HDC 2026 上宣布 openPangu 2.0 全面升级,余承东 承认盘古大模型“没做好”,立下“中国第一、世界第一”目标。支持 512K 超长上下文,分为 Pro(505B/18B 激活)和 Flash(92B/6B 激活)两个版本。
𝕏 Kimi 发布并开源 K2.7 Code 编程模型
月之暗面 发布并开源 Kimi K2.7 Code。在多项编程基准中显著提升:Kimi Code Bench v2 提高 21.8%,MLS Bench Lite 提高 31.5%,编程 Agent 性能提升,平均 推理 token 消耗降低 30%。支持图像视频输入,API 定价不变。
伊朗战争推动法德电动车需求激增 50%
雷诺 CEO 表示,自伊朗战争开始以来,法德 电动车订单 激增 50%。油价上涨和环保政策推动需求。
美股软件板块连跌 9 天,AI 冲击担忧加剧
iShares 北美软件 ETF IGV 连跌 9 天,跌幅超 16%,创 20 年 最长连跌纪录。Adobe 跌 7.7%,甲骨文 跌 1.6%,市场担忧 AI 颠覆。
🔶 Claude Fable 5 安全限制引发争议及后续撤销
Claude Fable 5 发布后因激进安全分类器引发大量批评,免疫学家称连“cancer”一词都被标记为生物安全风险,纯数学概念也被判为网络安全风险。AI 研究员 Nathan Lambert 评论静默操纵损害信任。随后Anthropic撤销隐藏安全措施,明确回退将告知用户。
𝕏 Fable 5 vs deep^2:成本对比悬殊
开发者对比 Anthropic Fable 5 和 OpenAI deep^2(Amp)实现相同功能:Fable 运行 1 小时 40 分花费$350,deep^2 快速完成花费$20。两者都理解任务,Fable 首次正确但成本高。
全球首个零工经济劳动者保护条约获联合国通过
联合国 通过里程碑条约,为零工经济工人设定 最低工资 要求,并明确平台义务,影响数百万工作者。
以色列防长暗示可能再次军事打击伊朗核设施
以色列 国防部长 卡茨 声明,以军已获指示做好准备,确保未来有能力独立阻止 伊朗 获得核武器。
𝕏 Gemini Omni Flash 在视频生成排行榜登顶
Gemini Omni Flash 在视频生成排行榜中超越 Veo 3.1 和 Seedance 2.0,在文生视频赛道领先第二名 61 分,成为当前最强的视频生成模型。
Anthropic 启动首批数据中心租赁洽谈,寻求谷歌资金担保支持
Anthropic正推进自建算力战略,已与多家美国数据中心开发商签署十余份意向书。管理层拟与谷歌合作:谷歌为租金提供财务担保并联合研发服务器芯片,此举有望大幅降低 Anthropic 算力成本。
IMF 与乌克兰达成 81 亿美元贷款协议,增速放缓
国际货币基金组织 与 乌克兰 就 81 亿美元 贷款项目达成工作人员层协议,为发放约 6.9 亿美元 铺路。同时 IMF 预计,受俄乌冲突和中东战争外溢影响,乌克兰 2026 年 GDP 增速将放缓至 1%至 1.6%。
𝕏 花旗将 AMD 评级上调至买入,盘前涨近 2%
花旗 将 AMD 评级从中性上调至 买入,AMD 盘前涨近 2%。
Adobe 股价暴跌 10%至 2018 年来最低,AI 担忧加剧
Adobe 股价周五下跌 10%,刷新 2018 年 以来最低位,市场担忧 AI 对软件行业增长前景的冲击。
𝕏 英伟达开始向中国客户推销 Vera CPU
据 路透社 独家消息,英伟达 已开始向中国客户推销其新一代 Vera CPU,寻求在 AI 芯片限制下扩大市场。
📡 中国司机用塑料头饰欺骗特斯拉 Autopilot 监控
据 WIRED 报道,中国司机使用名人 塑料头饰、闪烁屏幕等 DIY 设备,绕过特斯拉 Autopilot 的 分心驾驶 检测。
美国能源部长称炼油商可吸收更多委内瑞拉原油
美国能源部长赖特 表示,委内瑞拉目前日产 120 万桶 中约一半输美,未来比例可能上升。
𝕏 币安投资 X/xAI/SpaceX 系列交易,估算获利 6.6 亿美元
据估算,币安 在 2022 年投资推特 5 亿美元,经 xAI、SpaceX 收购和 IPO,该笔投资价值升至 11.6 亿美元,净赚 6.6 亿美元。
𝕏 交易员分析 WTI 油价:若霍尔木兹开放,目标看至 65 美元
交易员分析称,若 霍尔木兹海峡 重新开放,WTI 原油 价格预计缓慢跌至 65 美元,当前约 82 美元,建议做空。
𝕏 PlainApp:开源本地工具,用浏览器管理安卓手机
PlainApp 是一款开源本地工具,可在同一 WiFi 下用浏览器管理安卓手机,支持 传文件、收发短信、实时投屏,无需账号无广告。
𝕏 产品创意挖掘五步法:从 TikTok 趋势到上线
创业者总结完整流程:用 TikTok Creator Search Insight 找需求、Sensor Tower 验证付费意愿、分析评论区、做最小版本、自拍 100 条 视频验证。
𝕏 QuantMind:开源量化金融知识库与检索工具
QuantMind 可自动抓取研报和论文,结合 金融领域微调模型 构建 语义知识图谱,支持自然语言查询因子策略。
𝕏 暗访曝光非法钓鱼窝料产业链,地西泮超标危害健康
澎湃新闻 暗访发现非法添加 地西泮(安定)的钓鱼窝料产业链,工厂日产 10 吨,利润率超 50%,通过电商销往全国,鱼流入餐桌可能致胎儿畸形。
洲际交易所:布伦特原油投机者净多头减少 43,609 手
截至 6 月 9 日当周,布伦特原油 投机者净多头头寸减少 43,609 手 至 208,891 手;柴油投机者净多头增加 1,804 手。
𝕏 Claude Fable 5 用户展示创意使用案例
Anthropic 的 Claude Fable 5 发布后,用户展示多种创意用法,包括重构游戏、生成动画等,引发广泛讨论。在 5 道 UI/UX 设计测试中全部一次性通过,包括将 Craigslist 现代化改造并加入微动效。
𝕏 Kimi 推出全球首张 AI 原生信用卡,消费兑换算力
月之暗面 推出全球首张 AI 原生信用卡,每笔消费可转化为 AI 算力额度,用于兑换 Agent 额度和会员权益。
华为云与 MiniMax 多模态旗舰模型 M3 完成适配
华为云基于昇腾算力与MiniMax开源模型M3适配,打通算力到企业生产力闭环。
𝕏 Token 正在成为 AI 时代的日常消耗品,电信和金融业已介入
讨论 token 从开发者计费单位变为普通人账单中的一行,中国电信 已将 token 打包进话费套餐,Kimi 推出 AI 原生信用卡。
𝕏 MiniMax Hub:AI 工作站,整合文字、图片、音乐、视频创作
MiniMax 发布 Hub,可同时进行 研究、写脚本、生成图片和音乐、编辑视频,将智能代理组成完整创意团队。
𝕏 全球砂子危机:年消耗 500 亿吨,半导体产业面临挑战
全球每年消耗 500 亿吨 砂子,可用的河砂和海砂正在枯竭。半导体 行业需要极度纯净的二氧化硅,供应日益紧张。
𝕏 胃癌预防指南:两招降低风险
45 岁以上 或有 胃癌家族史 者,建议每 5 年 做一次胃镜;日常推行 分餐、使用公筷,减少幽门螺杆菌传播。
𝕏 中国以间谍罪逮捕一名美国公民
据 纽约邮报 报道,中国 逮捕了一名涉嫌 间谍活动 的美国公民,加剧两国紧张关系。
𝕏 用 Claude Fable 5 作为代理监工 Opus 4.8 以节约 Token
用户分享使用 Fable 5 创建子代理监督 Opus 4.8 工作的技巧,既能节约 Token 又能保证工作质量。
𝕏 OpenWrt 透明代理 daed,基于 eBPF 的高性能方案
daed 是一款基于 eBPF 的 OpenWrt 透明代理工具,支持 CO-RE 特性,提供高性能网络加速。
𝕏 Curated 设计文件库,供 AI 编程代理使用
一个精选的 Markdown 设计文件库,供 AI 编程代理(如 Claude Code)直接使用,提升 UI 生成质量。
𝕏 使用 Midscene 远程控制手机发送短信
分享利用 Midscene 通过手机远程控制另一台手机回复短信的另类用法。
SpaceX 焊工因持股成为百万富翁
SpaceX 一名时薪 28 美元 的焊工 Juan Hernandez,因持有公司股票,随着估值升至 167 美元,持仓价值超 100 万美元。
论“反向半人马”:AI 工具使用者的自我定位
博客文章探讨了开发者在使用 AI 编码工具(如 GitHub Copilot)时保持主导地位的重要性,反对沦为“反向半人马”。
“你不上传到 ChatGPT 就行了吗?”——AI 使用方式反思
一篇博文回应了非技术人员误认为任何问题都可以简单“上传到 ChatGPT”解决的误解,强调专业知识和问题定义的重要性。
1937 年世界博览会上的奖励黑客:极权主义为何输给自由民主
分析 1937 年巴黎世博会上 苏联 和 纳粹 的华丽展馆与英美寒酸展馆对比,指出极权主义陷入 奖励黑客 的陷阱。
𝕏 Max Tegmark:政治光谱正转向反对 AI 取代人类
Future of Life Institute 主席 Max Tegmark 认为,跨政治光谱的情绪正转向反对 AI“取代人类”的竞赛,政客们开始倾听。
𝕏 手机厂商把发布会话术平移 AI 宣传,引发争议
小米 宣布 MiMo Code“无限上下文”,华为 声称发布盘古大模型时“全世界不知大模型为何物”,专业人士质疑其表述不严谨。
𝕏 Mac 三指手势实现中键点击和拖拽
一款开源工具可实现 Mac 三指手势替代 middle-click 和拖拽,提升效率。
𝕏 70 倍实时音频转录工具
一款新工具可实现 音频 转录速度达 70 倍 实时,大幅提升语音数据处理效率。
𝕏 Transform DataFrames 为交互式 GPU 图表
一款新工具可将 Python DataFrames 转换为交互式 GPU 加速 图表,提升数据可视化性能。
WASI 0.3 正式发布
WebAssembly 系统接口 WASI 0.3 版本正式发布,带来多项改进。
𝕏 OpenAI 邀请好友重置额度策略引发争议
OpenAI推出类似拼多多的邀请好友重置额度机制,被用户调侃为营销手段。
Kimi 2.6 一句话生成超级玛丽测试表现糟糕,配额消耗严重
开发者测试 Kimi 2.6 一句话生成《超级玛丽》游戏,结果生成内容无法运行、无跳跃功能。调用 Kimi Code 跑同一任务耗时 2-3 个 5 小时周期,消耗 63% 周配额,产出却几乎不可用。
𝕏 类似 Phodal 的月度新模型发布清单发布
GLM-5.2、GPT-5.6、Gemini Omni 及 MiniMax M3 开源权重等模型即将在 6 月底前发布,AI 模型竞争持续加速。
🔵 Anthropic、OpenAI 和谷歌高管计划出席 G7 峰会
据法国总统府名单,OpenAI的山姆·奥特曼、谷歌的德米斯·哈萨比斯和Anthropic的达里奥·阿莫代伊计划出席下周在法国举行的G7 峰会。各国领导人希望了解最新 AI 技术及潜在机遇和威胁。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。