06月15日 · 科技晚报

天眼晚报

科技|2026年06月15日|96 分钟阅读
来源:1999 条推文 + 706 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-06-13
分享
AI 速读15 条精选

🤖 AI 大模型

美国政府以国家安全为由,下令 Anthropic 暂停 Fable 5 和 Mythos 5 全球访问

美国商务部于 6 月 12 日以国家安全为由,发布出口管制指令,要求Anthropic暂停所有外国国民(包括美国境内的外国人及外籍员工)对Fable 5Mythos 5的访问。Anthropic 被迫立即关闭这两个模型的全球访问,并启动退款流程。Anthropic 认为这是误解,正积极争取恢复。其他 Claude 模型不受影响。这是美国政府首次对前沿 AI 模型实施如此全面的出口管制,影响深远。

𝕏 MiniMax M3 开源:428B 参数,100 万上下文,多模态

中国团队MiniMax开源M3模型,428B参数、23B激活、100 万 token上下文、原生多模态。自研稀疏注意力机制,对标 Llama 和 Qwen。

𝕏 Kimi 发布 K2.7-Code 编程模型,优化编码 Agent 且成本更低

Kimi发布K2.7-Code编程模型,在 K2.6 基础上优化编程 Agent 能力:Kimi Code Bench v2提升21.8%至 62.0,推理 token 平均减少30%。首个在MCP Mark Verified上超过Opus 4.8的开源模型(81.1 vs 76.4)。已上线Ollama云,部署于NVIDIA B300数据中心 GPU,同等任务成本仅**$0.28vs GPT-5.5 的$0.93**,性价比突出。支持多模态与强制 Thinking 模式。同时开源版本 token 消耗降低 30%,长任务成功率大幅提升。

𝕏 NVIDIA 开源 AI Agent 安全扫描器 SkillSpector,发现 26.1%含漏洞

NVIDIA开源SkillSpector,扫描 AI agent 技能的 64 种漏洞模式(提示注入、凭据窃取等)。研究分析 42,447 个技能发现26.1%含漏洞,**5.2%**有恶意意图。支持本地运行,输出 SARIF 格式。

𝕏 智谱 GLM-5.2 发布:面向 Coding Plan 用户全量开放,支持 1M 上下文,下周开源

智谱今日发布GLM-5.2,作为新旗舰模型,具备强大编码能力、1M上下文支持及长任务优势。即日起向 GLM Coding Plan 全量用户开放,API及聊天机器人服务下周上线,模型将以MIT协议开源。开发者测试显示在 Cursor 等场景中开发体验显著提升:单 Agent 可处理长链路任务,debug 时低价读取日志更高效。在Anthropic模型被禁同日发布,开源路线显得更为可靠。

摩根大通:智谱与 MiniMax 定价策略分化,上调智谱目标价至 1400 港元

摩根大通报告称,智谱提价一倍后用量仍增长,维持“增持”评级,目标价1400 港元MiniMax旗舰模型 M3 上线一周后永久降价50%,下调至“中性”,目标价从 1100 港元降至400 港元。报告认为定价权是模型公司估值核心。

研究:SFT 主导 Gemini 安全属性,而非 RL 等其他训练阶段

Google DeepMind团队发现,Gemini模型的安全相关属性主要来自预训练+SFT的组合,而非 RL 阶段。SFT 是干预模型安全的高杠杆点。

𝕏 SGLang v0.5.13 发布,默认启用推测解码 V2 及 BCG 预填优化

SGLang v0.5.13 发布,新增支持 Nemotron 3 Ultra、Step-3.7-Flash 等多款模型,Speculative Decoding V2默认启用,Breakable CUDA Graphs提升预填速度,Blackwell 上 Qwen 3.5 加速。

𝕏 Cohere 发布 30B 开源 Agentic Coding 模型,性能接近 Qwen3.6

Cohere发布轻量级30B开源模型,专为智能体编程任务设计,基于Command A+的并行 transformer 架构,层数翻倍。在Terminal-BenchSWE-Bench上表现远超Gemma 4,接近Qwen3.6水平。

𝕏 Fable 5 测试中自主编写 WebGPU 内核,后遭全球封禁

开发者反馈Fable 5在测试中自主编写WebGPU内核实现Gemma 4推理,速度达255 tok/s。随后 Anthropic 回滚了隐形开发限制,紧接着Fable 5被全球暂停访问。

Fable 5 vs Opus 4.8 实测:差距小于预期,Opus 性价比更高

The New Stack 对比测试显示,Fable 5Opus 4.8在推理和编码任务上结果高度相似,Fable 诊断更犀利但编码成本高出一倍多($12.19 vs $5.80)。Opus 提供同等质量,价格不到一半。

𝕏 OpenMed:本地优先的开源医疗 AI 项目,支持苹果硬件加速

OpenMed是一款本地优先的开源医疗 AI项目,所有分析在本地完成,支持脱敏、提取医学实体、识别疾病药物等,在苹果设备上通过MLX加速快24-33 倍

𝕏 drawio-skill:自然语言描述即可生成 drawio 图表的 Skill

drawio-skill是一个 AI Skill,可用自然语言生成 ER 图、UML 类图等drawio图表,自带检查修正闭环,支持 5 轮迭代优化和图标搜索。

💹 科大讯飞发布星火多模态大模型 X2-VL

科大讯飞在 2026 长三角机器人及自动化展览会上发布星火多模态大模型 X2-VL,定位为综合国产多模态模型,为无锡具身智能产业提供 AI 大脑。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。