天眼晚报

科技|2026年06月24日|约 71 分钟阅读

来源：1135 条推文 + 314 篇 RSS 文章·Lanyun·BatchV2 生成·2026-06-24

AI 速读18 条精选

🤖 AI 大模型

Anthropic的Mythos模型在测试中数小时识别出美国政府机密系统安全漏洞。参议员Mark Warner援引 NSA 负责人的说法。该测试结果导致政府限制外国公民访问 Fable 5 和 Mythos 5。百余名网络安全专家联名反对限制措施。

百度发布 Unlimited OCR 模型，采用参考滑动窗口注意力（R-SWA）技术，3B 参数 500M 激活，一次前向推理可解析数十页文档，在 OmniDocBench 评测中准确率达93%。

豆包专业版即日上线，起步价68 元/月，最高500 元/月，支持办公模式（操作电脑、调用技能、生成文档），标准套餐为免费版5 倍额度。

Mistral发布Mistral OCR 4，当前 OCR 评分最高，支持返回边界框、分类、置信度等数据。

豆包 Seed-2.1-Pro在多项测试中 coding 及前端能力进步明显，可通过豆包 App“办公任务”模式、TRAE IDE选择该模型，或通过火山引擎方舟 API 调用（Model ID: doubao-seed-2-1-pro-260628）。

新模型VibeThinker仅3B参数，在 AIME26 上达94.3，LiveCodeBench v6 Pass@1 达80.2，性能匹配DeepSeek V3.2等大模型。使用 SFT+GRPO 训练。

Anthropic推出Claude Tag，允许企业用户在Slack中@Claude 委派任务，Claude 可访问指定频道和工具。该功能以 beta 形式向 Claude Enterprise 和 Team 方案开放。

OpenThoughts-Agent发布完全开源的数据制作流程，基于Qwen3-32B微调后在 7 个智能体基准上平均准确率达44.8%。关键发现：指令选择比教师模型更重要。

腾讯正在为其企业通讯应用企业微信准备推出 AI Agent，旨在锁定用户生态。该工具由 DeepSeek 提供支持，是后 ChatGPT 时代中国科技巨头激烈竞争的一部分。

百度千帆发布企业级 AI 订阅服务Token Plan 企业版，聚合DeepSeek-V4、GLM-5及Kimi-K2.6等模型，覆盖代码开发、智能办公等场景。

Google联合 50+厂商推出A2A 协议，标准定义多 Agent 协作，已捐赠至Linux 基金会，获 22000+星。

有用户在ChatGPT网页中发现GPT-5.6踪迹，按以往惯例，推测可能于近日内正式发布。

EVENT-DRIVEN INTELLIGENCE

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

NEXT STEP · 留下邮箱

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。