天眼晚报
🤖 AI 大模型
美国政府强制下线 Anthropic Fable 5 和 Mythos 5,引发全球开发者信任危机
美国商务部援引国家安全权限发布出口管制指令,要求暂停所有外国公民(包括在美外籍员工)访问 Fable 5 和 Mythos 5 模型。由于无法精准过滤国籍,Anthropic 被迫于美东时间 6 月 12 日全球关停这两款仅发布 3 天的最新旗舰模型。官方称此举是为了防止“越狱”攻击被滥用,但公司认为反应过度并正在争取恢复服务。该事件导致大量依赖该模型的海外企业及非美国公民开发者无法使用,被视为地缘政治对大模型部署的直接干预,迫使全球企业加速转向开源模型或自建私有化部署方案。作为补偿,Anthropic 重置了受影响开发者的 Claude Code 限额并临时增加 50%。
𝕏 智谱 GLM-5.2 正式发布,支持 100 万上下文并下周开源
智谱 AI 发布旗舰模型 GLM-5.2,核心特性包括 100 万 token 超长上下文窗口及强大的代码专项优化能力。该模型已于今日下午面向所有 Coding Plan 用户(Lite/Pro/Max/团队版)全量开放,API 服务预计下周上线。随后,模型将以 MIT 协议正式开源。这一举措被视为在海外最强模型受限后的战略对冲,旨在为开发者提供高性能、长上下文的国产替代方案,并在长程 Coding 任务中保持领先优势。
𝕏 月之暗面开源 Kimi-K2.7-Code 模型,Token 消耗降低 30%
月之暗面正式开源 Kimi-K2.7-Code 代码专用模型,针对长任务进行深度优化。相比上一代 K2.6,该模型在推理过程中减少 30% Token 消耗,同时大幅提升 Agent 成功率。在权威基准测试中,Kimi Code Bench v2 得分提升 21.8%,Program Bench 提升 11.0%,MLS Bench Lite 提升 31.5%。此外,模型支持即将推出的 6x High-Speed Mode,权重已上传至 Hugging Face,标志着国产代码模型在效率与能力上的双重突破。
𝕏 MiniMax M3 模型 Day-0 开源适配摩尔线程 MTT S5000
MiniMax 新一代多模态旗舰模型 M3 正式开源,采用创新的 Block sparse attention 技术,预填充速度提升 9 倍。摩尔线程旗舰智算卡 MTT S5000 宣布完成对该模型的 Day-0 适配,支持 CUDA 与 ROCm 双栈环境。与此同时,Together AI 也上线了 MiniMax-M3 原生多模态模型,支持 100 万 token 上下文,在相同场景下实现 15 倍解码 加速及 125% 的推理吞吐量提升,展现了国产算力与算法的高效协同。
𝕏 SGLang v0.5.13 发布:默认启用 Speculative Decoding V2
SGLang 发布 v0.5.13 版本,核心升级包括默认启用 Speculative Decoding V2(树形草稿),显著提升生成速度;新增 Breakable CUDA Graph (BCG) 技术,使预填充效率媲美 PCG 且更灵活。新版本还支持 Nemotron 3 Ultra、Step-3.7-Flash 等新模型及扩散模型实时生成,进一步优化了推理性能。
𝕏 NVIDIA 开源 SkillSpector 扫描 AI 代理漏洞
NVIDIA 开源 SkillSpector 安全扫描工具,旨在解决 Agent 生态中的供应链安全风险。该工具覆盖 64 种 漏洞模式,检测发现 26.1% 的 Agent 技能存在漏洞,5.2% 显示恶意意图。支持本地运行并输出 SARIF 格式集成至 CI 流程,帮助开发者快速识别并修复潜在的安全隐患。
𝕏 Vercel 推出 HarnessAgent 统一 AI 框架切换能力
Vercel 在 AI SDK 7 Canary 版本中发布 HarnessAgent,提供统一 API 支持在 Claude Code、OpenAI Codex 等智能体环境间无缝切换。该工具自动处理技能编排与安全沙箱,开发者只需定义一次智能体即可流式传输结果,极大简化了多模型协作的开发流程,提升了构建复杂 AI 应用的效率。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。