天眼晚报

科技|2026年07月01日|约 61 分钟阅读

来源：927 条推文 + 221 篇 RSS 文章·Lanyun·BatchV2 生成·2026-07-01

AI 速读21 条精选

🤖 AI 大模型

𝕏 Anthropic Fable 5 与 Mythos 5 解禁恢复上线，同步发布 Claude Sonnet 5

美国商务部正式解除对 Anthropic Fable 5 和 Mythos 5 的出口管制，Anthropic 宣布从 7 月 1 日 起恢复用户访问。新增安全分类器以阻止网络安全滥用，但导致约 0.5% 正常编码请求误报，部分能力降级。同一天，Anthropic 同步发布 Claude Sonnet 5，具备自主计划、使用浏览器/终端等 Agent 能力，限时优惠价格（输入 $2/百万 token，输出 $10/百万 token）。此举标志着前沿 AI 模型的监管博弈取得阶段性成果。

𝕏 Claude Sonnet 5 发布：Agent 能力升级，限时价格更低

Anthropic 发布 Claude Sonnet 5，SWE-bench 性能达 82.1%，具备自主计划、使用浏览器/终端等 Agent 能力。限时定价 输入 2 美元/百万 token，输出 10 美元/百万 token（至 2026 年 8 月 31 日），恢复后为 3/15 美元。与 Opus 4.8、GPT 5.5 对比：Sonnet 5 因新 tokenizer 费用与 Opus 4.8 相当，编程首选仍是 GPT 5.5；Sonnet 5 在金融领域表现最佳。

🔶 Anthropic 发布 Claude Science：面向科学家的 AI 工作台

Anthropic 推出 ClaudeScience，定位为面向科学家的 AI 工作台，整合科研常用工具、数据库和算力，覆盖文献分析到论文定稿全流程。每个输出附带完整可复现的过程记录。ManifoldBio、艾伦研究所、UCSF 等已应用，将两年工作量压缩至数周。已在 macOS/Linux 开启 Beta，对 Pro 及以上用户开放。

美团开源 LongCat-2.0：1.6T 参数 MoE 模型，全流程国产芯片训练

美团发布 LongCat-2.0，开源 1.6T 参数 MoE 模型（激活 33B-56B），支持 100 万 token 上下文。使用 5 万张 国产芯片完成从头预训练和推理，强调 Agentic Coding 能力，证明国产集群可大规模训练 LLM。

🔶 Claude Code 被曝隐藏后门代码，检测中国用户并标记降智

Reddit 用户爆料，Claude Code 内置隐藏代码，会读取用户系统时区（如 Asia/Shanghai）、检查代理地址是否包含中国云厂商关键词（含 百度、阿里、字节 等 147 项域名），并悄悄改写系统提示词以打标。Anthropic 承认此实验用于反滥用和反蒸馏，已计划在次日版本中回滚删除该代码。引发用户对隐私和地域歧视的广泛担忧。

🔶 谷歌 Nano Banana 2 Lite 上线：4 秒出图，单张仅 0.034 美元

谷歌发布 Nano Banana 2 Lite（gemini-3.1-flash-lite-image），单张 1K 图成本 0.034 美元，平均生成速度 4 秒，可直接生成视频。性能在 Elo 评分和延迟上均超越字节 Seedream 5.0 Lite，挑起文生图价格战。

𝕏 OpenAI GPT-5.6 Sol 在 GeneBench-Pro 测试中取得重大突破

OpenAI 首席执行官 Sam Altman 透露，新评估基准 GeneBench-Pro 专注于计算生物学的判断密集型分析，问题需人类专家 20-40 小时完成。GPT-5.6 Sol 在此测试中取得显著进步，标志着 AI 在科学推理领域的关键进展。

𝕏 OpenAI 内部数据显示 Codex Agent 使用率从不足 10% 飙升至全公司主力

OpenAI 内部数据显示，一年前 ChatGPT 是默认 AI 工具，如今法务、财务、HR 全部迁移至 Codex，使用率从不到 10% 变为每个部门的主力。Claude Code、Google Jules、微软 Copilot Workspace 也在走同样路线，对话式 AI 被 Agent 式 AI 替代。

𝕏 爆料：Google Gemini 3.5 Pro 即将发布，支持 2M 上下文和 Deep Think

Google Gemini 3.5 Pro 被曝将于 7 月初 发布，核心升级：2M token 上下文窗口、Deep Think 推理模式、编程和 Agent 工作流大幅增强。UI 和前端生成能力也有重点升级，旨在与 Claude 4、GPT-5.6 竞争。

🔶 Karpathy 提出 LLM-WIKI：将笔记视为源代码，让 AI 编译成知识库

Karpathy 开源 LLM-WIKI 方案，主张将个人笔记当作不可变的源代码，用 LLM 一次性编译成结构化的 Wiki 知识库，取代传统 RAG。已在 Obsidian、Cursor 社区引发迁移热潮，被视为知识管理的新范式。

𝕏 开源 35B 模型 Agents-A1 发布，在长任务测评中超越更大参数模型

来自中国的 Agents-A1（35B） 模型开源（Apache-2.0），通过 45K token 平均长度的训练轨迹学习完整工作流程。在 FrontierScience-Olympiad 上获 79.0 分，超越 Kimi-K2.6（73.0） 和 DeepSeek-V4-pro（76.0）。

𝕏 Ollama 集成 MLX 后 Gemma 4 在 Apple Silicon 上速度提升近 90%

Ollama 通过 MLX 实现了 Gemma 4 在 Apple Silicon 上近 90% 的速度提升，改进的多 token 预测（MTP）默认启用，系统自动动态调整推测 token 数量以避免降速。

𝕏 Nemotron 3 Ultra 在 Together AI 上日消耗量达 350 亿 token

NVIDIA 的 Nemotron 3 Ultra 模型在 Together AI 平台上线后，日消耗量迅速攀升至 350 亿 token，成为 OpenRouter 上的热门开放模型。

𝕏 Google 发布 TabFM，专为表格分类与回归设计的基础模型

Google Research 推出 TabFM ，一个专为表格数据分类和回归设计的 基础模型，可在单次前向传播中生成对未见过的表格的高质量预测，现已开放试用。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情