天眼早报
🤖 AI 大模型
苹果联合谷歌与英伟达开发新一代 AI 模型,WWDC 2026 发布全新 Siri AI
苹果在 WWDC 2026 上正式推出新一代 Siri AI,基于 Apple Intelligence 平台并引入 Google Gemini 模型技术,同时与 NVIDIA 合作支持其最先进云端大模型 AFM Cloud Pro。新 Siri 能利用个人情境理解、跨应用操作、感知屏幕内容,支持 iOS 27、macOS 27 等全系统,提供专属 App 和跨设备同步。苹果强调 AFM Cloud Pro 完全自研,非 Gemini 套壳,包含 5 个模型。由于监管原因,该功能暂不在欧盟和中国大陆推出。
𝕏 Sam Altman 发布 OpenAI 未来计划:到 2028 年 AI 将主导公司研究
Sam Altman 发布 OpenAI 未来路线图,宣布进入第三发展阶段,目标包括:构建自动化 AI 研究员、加速科学与生产力,以及为每个人提供个人 AGI。预计到 2028 年 3 月,OpenAI 相当一部分研究将由 AI 系统与人类研究员协作完成。同时呼吁成立国际监管机构。
🔵 OpenAI 秘密提交 IPO 文件,与 Anthropic 竞逐公开市场
OpenAI 周一宣布已向 SEC 秘密提交 S-1 上市招股书,由高盛和摩根士丹利承销。此前 Anthropic 已提交类似文件,两家 AI 巨头合计寻求募集数千亿美元资金,或成史上最大 IPO 之一。同时,CEO Sam Altman 联合创立的眼球扫描公司 Tools for Humanity(估值 25 亿美元)宣布裁员。
🏠 小米发布 MiMo-V2.5-Pro-UltraSpeed,万亿参数模型突破 1000 tokens/s
小米 MiMo 联合 TileRT 发布 V2.5-Pro UltraSpeed 模式,这是业内首次在 1 万亿参数 模型上实现 1000 tokens/s 输出速度,采用 FP4 量化与 DFlash 并行推测解码,模型权重已开源。API 定价为普通版 3 倍,限时开放至 6 月 23 日。
NotebookLM 重大升级:接入 Gemini 3.5、智能体 Antigravity、网页搜索与多元输出
谷歌为 NotebookLM 推送重大升级,底层模型更换为 Gemini 3.5,接入智能体 Antigravity,支持自主从网页查找并添加资料,输出格式新增 PDF、DOCX、PPTX、Excel、数据可视化图表等。每个笔记本现配备安全云端计算环境,可编写和运行代码。该功能先向谷歌 AI Ultra 用户和部分 Workspace 客户开放。
阿里巴巴成立 TokenFoundry 事业部,吴泳铭亲自带队加速 AI 商业化
阿里合并通义大模型与未来生活实验室,成立 TokenFoundry 事业部,CEO 吴泳铭亲自带队,目标年底 Token 收入 30 倍 增长。
谷歌每月向 SpaceX 支付 9.2 亿美元租用 11 万块 GPU
谷歌与SpaceX达成算力协议,每月支付9.2 亿美元租用约11 万块 NVIDIA GPU,用于满足Gemini Enterprise激增的需求。协议从 2026 年 10 月至 2029 年 6 月,包含提前终止条款。
𝕏 Google 选择 Intel 制造 2028 年 3M+ TPU 芯片
据 The Information 报道,Google 已选择 Intel 代工生产超过 300 万颗 TPU 芯片,计划 2028 年交付。这是 Intel 代工业务的重要胜利,为 AI 芯片寻找台积电之外的第二供应源。
DeepSeek 开招 IDC 设计规划工程师,拟自建 GW 级数据中心
DeepSeek 官方放出 IDC 设计规划工程师 岗位,明确要求参与从 MW 到 GW 级 基础设施规划,涵盖高密度 GPU 集群、液冷等前沿技术。这标志着 DeepSeek 从租用算力转向自建算力基础设施。
DeepSeek 完成首轮外部融资
DeepSeek 完成首轮外部融资,具体金额及投资方尚未披露,引发市场高度关注。
阶跃发布开源模型 Step 3.7 Flash,速度比 GPT-5.5 快 4 倍
阶跃星辰开源 Step 3.7 Flash,198B 参数多模态模型,激活参数 11B,速度达 400 Tokens/s,视觉理解能力强。接入 Claude Code 后可提升 Agent 工作效率,支持视频理解、推理等任务。
Anthropic 雇佣 1000 名工程师培训 Claude Code
Anthropic 通过项目“Marlin”雇佣约 1000 名 人类软件工程师,时薪 280 美元,训练 Claude Code 写出更简化、更易维护的代码。
𝕏 MiniMax 发布多模态模型 M3,1M 上下文计划开源
MiniMax 发布 M3 多模态模型,支持图像视频输入和 1M token 上下文窗口,计划约 10 天 内开源权重。在多项评测中接近 GPT-5.5 水平。
Anthropic 计划发布 Claude Fable 5,名为 Mythos 公开版
科技记者 Alex Heath 爆料,Anthropic 计划于明天发布 Mythos 公开版本,更名为 Claude Fable 5,新增"实质性安全护栏",在长周期复杂任务上表现"大幅提升"。
𝕏 Anthropic 研究:AI Agent 在生物学数据检索中存在严重不一致性
Anthropic 研究发现,AI Agent 在处理生物学数据时结果极不稳定。同一 埃博拉序列 任务中,Claude Sonnet 4 三次返回 106、15、5 条序列,而正确答案为 266 条。缺失数据导致疫情溯源从 2014 年误判为 1922 年。
报告显示美国企业因 AI 预算压力转向付费使用 DeepSeek
Ramp 平台数据显示,美国企业正在直接向 DeepSeek 付费,5 月企业软件趋势榜登顶。Uber 四个月耗光全年 Token 预算,Salesforce 支付 Anthropic 约 3 亿美元。
微信发布 AI Skill 文档,数百万小程序成为 AI 执行层
微信发布开发者接入 AI 生态指引,支持 小程序 以两种模式让 AI 直接操作。自动模式零门槛,开发模式需定制 Skill。美团 已宣布接入。这使微信成为 AI Agent 时代超级连接器。
𝕏 xAI 发布 Grok 视频生成模型 1.5 预览版,支持图生视频和音频
xAI 推出 grok-imagine-video-1.5-preview 视频生成模型,支持 图像转视频 及原生音频生成,最长 15 秒,在 Artificial Analysis 视频竞技场排名第二。
𝕏 Grok Build 0.1 在 Agent Arena 排名第 15,提升 bash 能力
Agent Arena 最新排名显示,xAI 的 Grok Build 0.1 排名第 15 位,在 bash 能力上较 Grok 4.3 有显著提升,但可操控性略降。
𝕏 美国 AI 初创公司正通过 OpenRouter 将流量路由至中国大模型
数据显示,OpenRouter 上的周 Token 消耗量在 2025 年主要由美国模型驱动,但 2026 年初中国模型突然成为主要增长引擎,表明 AI 模型市场正从品牌忠诚转向实用主义。
𝕏 Kimi 发布桌面版 Agent “Kimi Work”:300 个智能体协同,本地运行
Kimi 推出桌面端 AI Agent Kimi Work,支持 300 个专门 Agent 自动协同完成任务,包括浏览器控制、实时数据抓取(Yahoo Finance、World Bank 等)、生成 PPT/Word/Excel 等,所有计算在本地进行,无需云端。
𝕏 vLLM-Omni v0.22.0 发布,支持 NVIDIA Cosmos 3 世界模型与多模态推理
vLLM 发布 vLLM-Omni v0.22.0,支持 NVIDIA Cosmos 3 世界模型(文本/图像/音频/视频/动作),新增机器人服务、TTS、图像/视频扩散模型及更广的量化覆盖。共 339 次提交,124 位贡献者。
𝕏 Opus 4.8 在 FrontierCode 基准评测中被评为最佳编码模型
Cognition 发布 FrontierCode 基准评测,使用 20 余名开源开发者手工构建 150 个任务(每个耗时超 40 小时),不仅测试单元测试通过率,还评估回归安全、代码整洁性、测试正确性和代码质量。结果显示 Opus 4.8 在所有模型中表现最佳。
📄 "FlashMemory-DeepSeek-V4: 通过前瞻稀疏注意力实现超长上下文"
FlashMemory 提出前瞻稀疏注意力(LSA),将物理 KV 缓存 压缩至全上下文的 13.5%,在 500K 长度下降低超 90%缓存开销,同时下游准确率平均提升 0.6%。
📄 "STAR-KV: 通过软阈值自适应秩控制的低秩 KV 缓存压缩"
STAR-KV 实现 75% KV 缓存压缩,结合低秩感知混合精度量化后总压缩达 20 倍,注意力模块最高加速 6.9 倍,端到端吞吐提升 3.1 倍,代码开源。
📄 "INFUSER: 影响力引导的自我进化提升推理能力"
INFUSER 通过双角色共训练框架,让 8B 模型在奥赛和 SuperGPQA 上相对提升超 20%,并优于冻结的 32B 推理模型。代码已开源。
📄 "Reasoning Arena: 当可验证奖励不足时的轨迹锦标赛"
Reasoning Arena 通过轨迹锦标赛生成细粒度相对奖励,在竞赛数学和编程基准上平均提升 7.6%,训练加速 27%–41%,节省近 50% 生成计算。
📄 "PACT: 扩散策略的自进化物理安全对齐"
PACT 通过后训练框架将预训练扩散策略投影到约束可行区域,安全违规平均减少 31.0%,任务成功率提升 30.7%,在模拟和真实机器人上验证。
📄 "GEAR-VLA: 学习几何感知的动作表征实现通用机器人操作"
GEAR-VLA 在 LIBERO、零样本 LIBERO-Plus 和 RoboTwin 2.0 上达到 SOTA,在 212 个未见物体的通用抓取基准上实现 90.1% 成功率,泛化到新本体。
📄 "Ego-Pi: 利用自我中心人类和机器人数据微调 VLA"
Ego-Pi 证明人类数据可使机器人学习新任务语义和组合技能而无对应机器人数据,提升 CALVIN 长周期任务 10.7 个百分点,真实 SO-101 任务成功率从 72.7% 升至 78.1%。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。