07月01日 · 科技晚报

天眼晚报

科技|2026年07月01日|61 分钟阅读
来源:927 条推文 + 221 篇 RSS 文章·Lanyun·BatchV2 生成·2026-07-01
分享
AI 速读21 条精选

🤖 AI 大模型

𝕏 Anthropic Fable 5 与 Mythos 5 解禁恢复上线,同步发布 Claude Sonnet 5

美国商务部正式解除对 Anthropic Fable 5 和 Mythos 5 的出口管制Anthropic 宣布从 7 月 1 日 起恢复用户访问。新增安全分类器以阻止网络安全滥用,但导致约 0.5% 正常编码请求误报,部分能力降级。同一天,Anthropic 同步发布 Claude Sonnet 5,具备自主计划、使用浏览器/终端等 Agent 能力,限时优惠价格(输入 $2/百万 token,输出 $10/百万 token)。此举标志着前沿 AI 模型的监管博弈取得阶段性成果。

𝕏 Claude Sonnet 5 发布:Agent 能力升级,限时价格更低

Anthropic 发布 Claude Sonnet 5,SWE-bench 性能达 82.1%,具备自主计划、使用浏览器/终端等 Agent 能力。限时定价 输入 2 美元/百万 token,输出 10 美元/百万 token(至 2026 年 8 月 31 日),恢复后为 3/15 美元。与 Opus 4.8GPT 5.5 对比:Sonnet 5 因新 tokenizer 费用与 Opus 4.8 相当,编程首选仍是 GPT 5.5;Sonnet 5 在金融领域表现最佳。

🔶 Anthropic 发布 Claude Science:面向科学家的 AI 工作台

Anthropic 推出 ClaudeScience,定位为面向科学家的 AI 工作台,整合科研常用工具、数据库和算力,覆盖文献分析到论文定稿全流程。每个输出附带完整可复现的过程记录。ManifoldBio艾伦研究所UCSF 等已应用,将两年工作量压缩至数周。已在 macOS/Linux 开启 Beta,对 Pro 及以上用户开放。

美团开源 LongCat-2.0:1.6T 参数 MoE 模型,全流程国产芯片训练

美团 发布 LongCat-2.0,开源 1.6T 参数 MoE 模型(激活 33B-56B),支持 100 万 token 上下文。使用 5 万张 国产芯片完成从头预训练和推理,强调 Agentic Coding 能力,证明国产集群可大规模训练 LLM。

🔶 Claude Code 被曝隐藏后门代码,检测中国用户并标记降智

Reddit 用户爆料,Claude Code 内置隐藏代码,会读取用户系统时区(如 Asia/Shanghai)、检查代理地址是否包含中国云厂商关键词(含 百度、阿里、字节 等 147 项域名),并悄悄改写系统提示词以打标。Anthropic 承认此实验用于反滥用和反蒸馏,已计划在次日版本中回滚删除该代码。引发用户对隐私和地域歧视的广泛担忧。

🔶 谷歌 Nano Banana 2 Lite 上线:4 秒出图,单张仅 0.034 美元

谷歌发布 Nano Banana 2 Lite(gemini-3.1-flash-lite-image),单张 1K 图成本 0.034 美元,平均生成速度 4 秒,可直接生成视频。性能在 Elo 评分和延迟上均超越字节 Seedream 5.0 Lite,挑起文生图价格战。

𝕏 OpenAI GPT-5.6 Sol 在 GeneBench-Pro 测试中取得重大突破

OpenAI 首席执行官 Sam Altman 透露,新评估基准 GeneBench-Pro 专注于计算生物学的判断密集型分析,问题需人类专家 20-40 小时完成。GPT-5.6 Sol 在此测试中取得显著进步,标志着 AI 在科学推理领域的关键进展。

𝕏 OpenAI 内部数据显示 Codex Agent 使用率从不足 10% 飙升至全公司主力

OpenAI 内部数据显示,一年前 ChatGPT 是默认 AI 工具,如今法务、财务、HR 全部迁移至 Codex,使用率从不到 10% 变为每个部门的主力。Claude CodeGoogle Jules微软 Copilot Workspace 也在走同样路线,对话式 AI 被 Agent 式 AI 替代。

𝕏 爆料:Google Gemini 3.5 Pro 即将发布,支持 2M 上下文和 Deep Think

Google Gemini 3.5 Pro 被曝将于 7 月初 发布,核心升级:2M token 上下文窗口Deep Think 推理模式、编程和 Agent 工作流大幅增强。UI 和前端生成能力也有重点升级,旨在与 Claude 4GPT-5.6 竞争。

🔶 Karpathy 提出 LLM-WIKI:将笔记视为源代码,让 AI 编译成知识库

Karpathy 开源 LLM-WIKI 方案,主张将个人笔记当作不可变的源代码,用 LLM 一次性编译成结构化的 Wiki 知识库,取代传统 RAG。已在 Obsidian、Cursor 社区引发迁移热潮,被视为知识管理的新范式。

𝕏 开源 35B 模型 Agents-A1 发布,在长任务测评中超越更大参数模型

来自中国的 Agents-A1(35B) 模型开源(Apache-2.0),通过 45K token 平均长度的训练轨迹学习完整工作流程。在 FrontierScience-Olympiad 上获 79.0 分,超越 Kimi-K2.6(73.0)DeepSeek-V4-pro(76.0)

𝕏 Ollama 集成 MLX 后 Gemma 4 在 Apple Silicon 上速度提升近 90%

Ollama 通过 MLX 实现了 Gemma 4 在 Apple Silicon 上近 90% 的速度提升,改进的多 token 预测(MTP)默认启用,系统自动动态调整推测 token 数量以避免降速。

𝕏 Nemotron 3 Ultra 在 Together AI 上日消耗量达 350 亿 token

NVIDIANemotron 3 Ultra 模型在 Together AI 平台上线后,日消耗量迅速攀升至 350 亿 token,成为 OpenRouter 上的热门开放模型。

𝕏 Google 发布 TabFM,专为表格分类与回归设计的基础模型

Google Research 推出 TabFM ,一个专为表格数据分类和回归设计的 基础模型,可在单次前向传播中生成对未见过的表格的高质量预测,现已开放试用。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。