天眼早报

科技|2026年07月01日|31 分钟阅读
来源:960 条推文 + 4 篇 RSS 文章·Lanyun·BatchV2 生成·2026-06-30 — 2026-07-01
分享
AI 速读17 条精选
🏛头条美国解除对Anthropic Claude出口管制

美国商务部撤回对Anthropic最先进模型Claude Mythos 5和Claude Fable 5的出口管制,无需许可证即可全球流通。此举解除了对高级AI模型扩散的限制,标志着美国AI出口政策重大转向,将加速先进技术进入中国等市场,改变全球AI竞争格局,并可能引发盟友效仿与安全争议。

🤖头条Anthropic发布Claude Sonnet 5,主打低成本Agent

Anthropic推出Claude Sonnet 5,具备100万token上下文和自主计划、浏览器与终端操作能力,Agent性能接近数月前更大更贵模型,输入仅$2/M tokens。这使得高能力Agent大幅降价,预计推动中小企业广泛部署,降低开发门槛,并对OpenAI与Google形成直接定价压力。

🤖头条美团开源1.6T模型,全用国产芯片训练

美团发布LongCat-2.0,参数1.6万亿MoE,上下文100万token,在5万片国产华为昇腾芯片上完成训练与推理,编码和Agent表现强劲。这是首个全程在纯国产算力集群上训练的万亿模型,证明中国自主AI产业链已达可实用水平,有望加速国产替代,减少对NVIDIA的依赖。

🔲头条Etched AI芯片估值50亿美元,拿下10亿订单

专为Transformer推理的芯片公司Etched估值达50亿美元,实现10亿美元销售额,能效比GPU高10倍。这表明专用AI推理芯片获得市场认可,可能打破NVIDIA在AI推理市场的垄断,为大规模部署提供更高效低成本选项,引发AI芯片投资新浪潮。投资者Bryan Johnson已参投。

🤖头条OpenAI将部分模型推理成本降低一半以上

据The Information报道,OpenAI通过量化、KV缓存、批处理等技术,大幅降低模型推理成本,传统流量仅需两三百块GPU。此举可将毛利率从33%提升至52%,有望推动API和ChatGPT进一步降价,加速AI应用普及,迫使Anthropic等对手跟进优化,重塑行业成本基准。

🔲NVIDIA Blackwell推理栈将DeepSeek V4成本降5倍
🤖Anthropic推Claude Science科学工具
🤖微软小参数GUI Agent击败GPT-5.4
🔲中国通过海底电缆出口AI推理算力
💡Amazon成立10亿美元组织追赶OpenAI
💡Kimi估值315亿美元,ARR三个月翻三倍
📰Neuralink实现穿硬脑膜电极植入突破
🤖AI成功破解80年数学埃尔德什难题
🏛CIA局长称前沿AI为数字核武器
🏛解放军报提出词元是新质战斗力
💡Spellbook发布全球首套AI端到端合同管理
🤖Andrew Ng详细阐述AI编程三个关键循环

🤖 AI 大模型

𝕏 【重磅】美国商务部解除对 Anthropic Claude Fable 的出口管制

根据 WIRED 独家报道,美国商务部长 Howard Lutnick 致信 AnthropicTom Brown撤回对 Claude Mythos 5Claude Fable 5 的出口管制,不再需要许可证即可出口、再出口或在境内转让。此前白宫高级官员已提前透露此消息。

𝕏 ⭐ Anthropic 发布 Claude Sonnet 5,主打低成本 Agent 能力

Anthropic 推出 Claude Sonnet 5,官方称其为"最具 Agent 能力的 Sonnet",支持 1,000,000 token 上下文窗口。它能自主制定计划、使用浏览器和终端,自主运行水平数个月前还需要更大更贵的模型才能实现。OpenRouter 上线促销价:输入 $2/M tokens,输出 $10/M tokens(优惠至 8 月 31 日,之后恢复 $3/$15)。系统卡共 145 页,评测显示 CyberGym 得分 52.7%,MASK 谎言率仅 3.1%,每任务成本 $2.29。

𝕏 ⭐ 美团发布 LongCat-2.0:1.6T 参数开源模型,基于纯国产芯片训练

美团 发布开源模型 LongCat-2.01.6T 参数 MoE(33B–56B active),1M token 上下文窗口。该模型在 50,000 片国产华为芯片 上完成预训练与推理,是业界首个全程在国产算力集群上训练的万亿模型,编码和 Agent 基准表现不俗。

𝕏 ⭐ Anthropic 推出 Claude Science 科学科研工具

Anthropic 发布 Claude Science 测试版,集成代码追踪、60 个科学数据库、3D 蛋白/基因组可视化,可提交任务至实验室 HPC 或 Modal 计算。早期用户报告 10 次审稿草稿不超过 100 页,种系分析仅需十分之一时间。这是 Anthropic 生命科学与医疗健康计划的一部分。

𝕏 ⭐ OpenAI 通过新方法将推理成本降低一半以上

The Information 报道OpenAI 已通过量化、KV 缓存、批处理、推测解码等技术,将部分现有模型的推理成本降低 一半以上。未登录 ChatGPT 流量仅需两三百块英伟达 GPU。此举有望推动毛利率从 2025 年的 33% 升至 2026 年的 52%。

𝕏 ⭐ NVIDIA Blackwell 推理栈一个月内将 DeepSeek V4 代币成本降低 5 倍

NVIDIA 最新报告称,其 Blackwell 推理栈通过优化,一个月内DeepSeek V4 的代币成本降低了最高 5 倍

𝕏 ⭐ GLM-5.2 成为最智能的开源权重模型,但也是最啰嗦的模型之一

Artificial Analysis 评测显示,GLM-5.2(智谱)在 CritPt 物理基准上追平 Claude Opus 4.8(均 21%),但在 AA 智能指数上为 51 分,低于 Opus 4.8(56)和 GPT-5.5(55)。其输出 token 数高达 1.41 亿(95% 推理),是 GPT-5.5 的 2 倍,幻觉率更高。

𝕏 ⭐ 华为开源 openPangu-2.0-Flash:920 亿参数模型

华为 开源 openPangu-2.0-Flash,参数规模 920 亿,在国产昇腾芯片上训练。该模型展示中国在软硬件全栈 AI 自主化方面的持续进展。

𝕏 ⭐ OpenAI 发布 GeneBench-Pro 基准,评估 AI 在生物数据分析中的能力

OpenAI 推出 GeneBench-Pro,这是一个研究级基准,用于测试 AI Agent 处理混乱生物数据、选择正确分析路径、做出类似真实计算研究判断的能力。旨在推动 AI 在计算生物学领域的进步。


🛠️ AI 工具推荐

𝕏 Hugging Face 上线按本地硬件过滤 AI 模型功能

Hugging Face 推出新功能,用户可根据 本地硬件(如显卡型号、显存)过滤 800,000+ 公开模型。该功能基于 Stanford 研究,显示 71.3% 的 ChatGPT 查询可在本地模型上准确回答。

𝕏 ⭐ Acti 发布"Agentic Keyboard",将 AI 代理直接嵌入手机键盘

Acti 推出创新 AI 键盘,用户在任何文本输入框输入意图后按住空格键,即可自动调用 app 和 API 返回结果,无需切换应用。例如输入"World Cup today"直接显示直播卡片。这是将键盘变为 AI Agent 的超级分发层。

𝕏 ⭐ Higgsfield 发布 Seed Audio 1.0:AI 音频模型,支持 18 种语言配音

Higgsfield 推出 Seed Audio 1.0,提供声音更换、文本转语音、视频配音(支持 18 种语言)等功能。可通过 Higgsfield MCP 在 Claude 中调用,与 Higgsfield 的视频模型配合使用。

𝕏 ⭐ LangChain 的 LlamaParse MCP 升级:让 AI 代理自动处理文档

LlamaIndex 发布 LlamaParse MCP 更新,AI 代理可以自动从合同、发票、报告中提取结构化数据,并直接访问知识库(PDF、Office 文档等)进行搜索、读取和检索。重新组织了聚焦的工具,支持并行处理。

𝕏 Rampart:本地运行实时 PII 移除的浏览器扩展

开发者构建 Rampart,基于 transformersjs 和本地模型,在浏览器中实时移除文本中的 zip、state、city 等敏感信息,数据不离设备。

𝕏 Vercel 推出容器化服务 Vercel Services

Vercel 发布 Vercel Services,支持全栈应用的原子部署与回滚、单一预览 URL 以及服务间私有网络。一个 Vercel 项目即可管理整个应用。

𝕏 ⭐ Claude 桌面应用正式登陆 Ubuntu/Linux

Anthropic 为 Linux 用户推出 Claude 桌面应用,此前仅支持浏览器和终端。Ubuntu 用户现在可以直接安装使用 Claude。


📖 教程攻略

𝕏 LOOP ENGINEERING 开源框架:让 AI 代理自动循环工作

匿名开发者开源 LOOP ENGINEERING 框架,包含 6 种生产模式(daily triage、CI sweeper、PR babysitter),以及 CLI 工具和 Claude Code/Codex 适配器。用户可用 npx @cobusgreyling/loop-init 一键启动。

𝕏 构建会议准备代理的完整教程

教程利用 Claude Project 设置代理, 2 分钟 生成简报,设置仅需 10 分钟

𝕏 微服务环境下 AI Agent 系统设计与编码的最佳实践

详细介绍如何在 微服务架构 中使用 AI Agent 进行系统设计:Monorepo 布局、AGENTS.md 文档、契约测试、Mock Server 验证闭环。引用 Anthropic 文档和社区经验。


💎 技巧经验

𝕏 Claude Code 检测第三方 API 代理的机制解析

技术分析指出 Claude Code 会通过修改系统提示词中标点格式(日期格式、Unicode 撇号)来检测用户是否使用第三方 API,帮助识别来自中国的代理流量,可能用于封号。建议中转站用户避免使用 Claude Code。

𝕏 Agent 自动化安全:放行信号必须进程内闭环

做 Agent 自动化系统时应避免将“放行信号”写在调用者也能写的地方(如 PR 评论),应使用 returncode、内存状态、签名结果等进程内闭环,防止伪造。


⚡ 工作流

𝕏 ⭐ LangChain 教您构建语音 Agent:Gemini Live + Deep Agents 架构

LangChain 发布教程,展示如何利用 Gemini Live(低延迟、自然对话)+ Deep Agents(长时研究任务)+ LangSmith(可观察性)构建可靠语音 Agent。采用"三明治架构"兼顾对话自然性和任务可靠性。


📚 论文研究

𝕏 NVIDIA 发布 ASPIRE:机器人技能库可无限自我进化

NVIDIA GEAR 实验室与 UMich、Berkeley、CMU 合作推出 ASPIRE 框架,使机器人通过编码代理观察多模态传感器数据、进化搜索控制程序,将最佳知识蒸馏到可扩展的技能库中。已在 150+ 任务90+ 技能 上验证,sim2real 迁移 token 节省达 10 倍,将全部开源。

𝕏 Microsoft 发布 Sico-Evolution:4B 参数 GUI Agent 击败 GPT-5.4 和 Claude Opus 4.7

Microsoft 开源 Sico-Evolution,一个仅 4B 参数 的 GUI Agent 模型,在 Task Success Rate 上从 39.8% 跃升至 82.9%,超越 GPT-5.4Claude Opus 4.6/4.7。表明小参数模型在特定任务上可通过进化策略超越大模型。

𝕏 困扰人类 80 年的埃尔德什难题被 AI 成功破解

华尔街日报中文版 报道,数学界经典难题 埃尔德什问题 被 AI 成功破解,整个数学界为之震动。文章探讨了 AI 的发现机制、人类为何未能发现以及相关启示。

𝕏 OpenAI 调试一年崩溃:发现硬件问题及开源代码中 18 年漏洞

OpenAI 分享调试数据基础设施崩溃的完整记录:追踪了一年的崩溃,最终发现一个硬件问题以及另一个在开源代码中存在 18 年 的漏洞。展示了工程团队深入排查复杂系统问题的能力。

𝕏 LLMs 解决 9 个理论计算机科学开放问题

研究者利用 GPT-5.5 ProClaude Opus 4.8 解决 9 个 开放问题,包括 4 个 COLT 和 1 个 FOCS 问题。

𝕏 Qwen 发布 RL 编程 Agent 奖励信号研究:每个信号都有有效期

Qwen 新论文研究 奖励设计 对长周期编程 Agent 的影响,发现测试通过率、LLM 裁判、执行轨迹等信号均存在“有效期限”,超过某个 horizon 后奖励会被黑客攻破,不再反映真实正确性。


🚀 产品发布

𝕏 ⭐ Etched AI 芯片公司估值达 50 亿美元,已获 10 亿美元订单

Etched,一家设计专门用于 Transformer 推理的 AI 芯片初创公司,估值已达 50 亿美元,并实现 10 亿美元 销售额。其芯片比 GPU 能效高 10 倍,被认为可能颠覆 Nvidia 的统治地位。Bryan Johnson 透露他已投资。

𝕏 ⭐ 亚马逊成立 10 亿美元 FDE 组织,追赶 OpenAI 和 Anthropic

Amazon 宣布成立新的 "Foundation Development Engineering" (FDE) 组织,预算高达 10 亿美元,旨在加速内部 AI 大模型研发,对标 OpenAIAnthropic。此举显示云计算巨头在 AI 领域的军备竞赛升级。

𝕏 ⭐ Google 发布 Nano Banana 2 Lite 和 Gemini Omni Flash

Google DeepMind 推出 Nano Banana 2 Lite(最快图像模型,~4 秒出图,成本 $0.034/千张)和 Gemini Omni Flash(视频生成 API,$0.10/秒)。两者可通过 Interactions API 协同:快速生成图像后立即用 Omni Flash 动画化,最多支持连续三次编辑。

𝕏 ⭐ Anthropic 发布 Claude Science:专为科研设计的 AI 应用

Anthropic 推出 Claude Science 应用(beta),旨在覆盖研究全流程。关键特性:Artifacts 可追溯到代码、按需管理运行环境、可连接 60+ 科学数据库。面向科学家,强调工作流而非新模型。

𝕏 Flowith 推出 Matrix:多 Agent 公司操作系统

Flowith 发布 Matrix,一套多 Agent 长期运行操作系统:用户输入使命,系统自动编排多部门(Research/Engineering/Growth/Product),并闭环产出可验证结果(网站、收入、流量)。在 GDPval 基准上达 95.45%

𝕏 ⭐ Spellbook 发布全球首套端到端 AI 合同管理基础设施

Spellbook Legal 推出 Autonomous Contract Management,全球首个端到端 AI 原生合同栈。从合同进入收件箱到续签全程 AI 支持,拥有约 5000 家客户覆盖 80 个国家。

𝕏 Zed 编辑器发布 DeltaDB:基于编辑增量而非快照的版本控制

Zed 编辑器推出 DeltaDB,以每次编辑的增量而非 Git 快照为基本单元,记录完整编辑历史及产生这些编辑的对话,专为 AI 代理的连续工作流设计。

𝕏 ByteDance 发布 Seed Audio 1.0:一次生成语音、音乐和音效

字节跳动 通过 BytePlus 推出 Seed Audio 1.0,一个非流式 TTS 模型,可同时输出语音、音乐和音效,支持参考音频和图像引导,目前仅对企业开放。

𝕏 Cline 支持 Claude Sonnet 5,终端编码性能提升且防注入更强

Cline CLI 和扩展现已支持 Claude Sonnet 5,在 Terminal-Bench 上达到 Opus 4.8 水平,成本低于 Opus 一半,且显著提高了对 prompt 注入劫持的防御能力。

𝕏 Rasbt 新书《从零构建推理模型》正式出版

Sebastian Raschka 新书 《Build a Reasoning Model (From Scratch)》 出版,440 页全彩,涵盖推理缩放、强化学习、蒸馏技术。

Elon Musk 宣布 Neuralink 解决了通过硬脑膜植入电极的难题,极大提升脑机接口的 安全性易用性


🌍 国际大事

𝕏 ⭐ CIA 局长称前沿 AI 类似于数字核武器

CIA 局长 John Ratcliffe 在罕见公开讲话中宣布对 CIA 技术方法进行“根本性重塑”,并表示将前沿 AI 称为“类数字核武器”并非“不妥”。

𝕏 ⭐ 美国对以色列支持率出现有记录以来最大持续下滑

《经济学人》 报道,美国民众对以色列的支持率近年来出现有记录以来最严重的持续下降。分析亲以色列游说团体下一步可能采取的策略。

𝕏 解放军报发文:词元是新型战斗力的关键要素

解放军日报 发表题为《词元:新质战斗力的关键要素》的文章,提出深化词元技术军民协作、依托产业规模和成本优势构建平战一体高效产业体系。

𝕏 卢卡申科紧急访华寻求北京保护,俄白中三角关系出现重大转变

Gerashchenko_en 分析称,卢卡申科 在与 普京 会晤后紧急前往 北京 面见 习近平,这是未事先计划的访问。中国强调支持白俄罗斯主权独立和领土完整,可能意味着 北京 对明斯克提供保护迹象。普京则提出彻底解放顿巴斯和新俄罗斯的目标,显示战争升级。

𝕏 拉丁美洲政治右转:右翼认同率达二十多年来最高

《经济学人》 报道,18 个拉美国家 的民调数据显示,受访者自认 右翼 的比例创 二十多年 新高,反映该地区政治格局显著右移。

𝕏 美伊会谈数月未解决根本问题,14 点计划无实质进展

美国与伊朗 数月的会谈产出两份 14 点计划,但《经济学人》分析认为尚未解决地区任何根本性问题。文章要求免费注册阅读。

𝕏 乌克兰系统性地摧毁俄罗斯炼油厂流化催化裂化装置,或导致长期燃料危机

ChrisO_wiki 报道,乌克兰正系统性地攻击俄罗斯炼油厂的 流化催化裂化装置(FCC),此类复杂设备俄罗斯难以自行修复且受制裁只能从中国订购,可能导致长期燃料危机。

𝕏 美国最高法院大幅扩大总统权力,影响所有继任者

美国最高法院 作出裁决,显著扩大总统行政权力,该裁决不仅适用于现任总统,也将影响每一位继任者。


📈 财经市场

𝕏 Kimi 月之暗面新一轮投前估值 315 亿美元,ARR 三个月翻三倍

AI_Whisper_X 分析,Kimi 新一轮融资投前估值 315 亿美元(上一轮 200 亿美元),ARR 三个月翻三倍,API 收入占七成以上。Coinbase 等海外企业已接入 Kimi,通过路由和缓存优化将 AI 支出砍掉近一半。

𝕏 美团王兴股东大会反思:价格战错误、收缩投资、回归主业

美团 股东大会上 王兴 头发几乎全白,承认 价格战 无必要,将撤出理想汽车、智谱、宇树等投资,回归主营业务,看好消费降级折扣超市。


🏭 工业能源

𝕏 黄仁勋:阻止中国获得英伟达芯片不会阻止中国 AI 发展

黄仁勋 接受 Fox Business 采访表示,出口管制反而刺激中国国产芯片生态成熟,华为已证明可进行大规模训练。长期风险是美技术被排除在关键系统之外。

𝕏 ⭐ 中国开始出口 AI 计算:通过海底电缆输送处理后的 tokens

Min Choi 报道,中国数据公司开始通过 海底电缆 向海外输送处理后的 tokens,推理即服务成为新的全球贸易形式,标志着中国从芯片进口国向计算出口国转变。


🧠 深度思考

𝕏 Andrew Ng 详解 AI 编程的三种关键循环

Andrew Ng 在《The Batch》中分享构建产品的 三个循环:agentic coding loop(分钟级迭代)、developer feedback loop(小时级)和 external feedback loop(天/周级),强调人类 上下文优势 仍是关键。

𝕏 Perplexity CEO 警告:出口管制可能催生更强大的中国 AI 竞争者

Aravind Srinivas 在采访中表示,出口管制迫使中国在物理层(数据中心、电力、人才)快速进步,可能将他们转化为更强大的竞争对手。他认为中美开源模型差距仅 12 个月

𝕏 大学专业排名对本科生意义有限

专业排名对 本科生 择校帮助有限,应关注 一线城市青年助理教授。以 东北大学 为例。

𝕏 Dario Amodei 强硬表态:中国不应拥有强大的 AI

Anthropic CEO Dario Amodei 在 Dwarkesh Patel 播客中直言,美国国家安全利益要求阻止中国获得强 AI,称反驳观点“可疑”。


📰 综合新闻

𝕏 中国开始通过海底电缆出口 AI 推理算力

据多方信息,中国数据公司正通过海底电缆将处理后的 token (AI 推理) 运往海外。推理正成为新的全球贸易商品,这可能改变 AI 算力格局。

𝕏 Tesla 在奥斯汀开始测试无方向盘和踏板的 Cybercab

Tesla 在奥斯汀启动 Cybercab 实际道路测试,该车辆无方向盘和踏板,完全依赖 FSD 自动驾驶。这是迈向全无人驾驶出租车商业化的重要一步。

SpaceXAI(xAI 被 SpaceX 收购后)为孟菲斯地区(Colossus 数据中心所在地)Starlink 用户提供 50% 月费折扣,新用户免硬件费。已向符合条件的用户自动应用,无需操作。作为社区回馈计划。

𝕏 iPhone 18 Pro 泄露内容遭苹果大规模 DMCA 删除

苹果利用 DMCA 大规模删除社交平台上泄露的 iPhone 18 Pro 相关内容。知名爆料人 @evleaks 因发布 iPhone 18 Pro 跌落测试视频被 X 平台封禁。

𝕏 湖南警方侦破 31 年前灭门命案,借助现代刑侦技术

1995 年湖南永兴一家五口被杀案告破,嫌疑人 邓某 隐姓埋名逃亡 31 年,2026 年警方通过现代刑侦技术锁定其在广西南宁,6 月 21 日将其抓获。

𝕏 云南医院发生输液失误,错将患者药水输给另一人

云南玉溪 峨山县人民医院 医护人员将 55 岁女患者的药水错输给一名车祸男性患者,输完第一瓶才发现。所幸药物相同,男子无不适。院方承认严重疏漏。


💡 生活建议

𝕏 高血压患者“无盐”饮食导致骨折,医生提醒科学控盐

武汉 86 岁 高血压奶奶因家人极端 无盐 饮食导致 低钠血症(血钠 128 mmol/L),摔倒骨折。医生强调低盐≠无盐,建议每天食盐不超过 5 克,定期监测电解质。

𝕏 为什么你根本无法静下心来学习?专注是与潜意识的血战

心理学家 乔丹·彼得森 观点:人本身缺乏自我管理,越缺乏越被本能控制。专注本质上是一场与潜意识争夺身体控制权的斗争


由 X-Crawler AI 生成于 2026-07-01 08:09

EVENT-DRIVEN INTELLIGENCE

免费先看重点,Pro 再看速度、深度和可追踪性

这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件帮你建立复访,再决定是否升级到更深的追踪能力。

天眼早报:科技(2026-06-30)