05月14日 · 科技早报

天眼早报

科技|2026年05月14日|84 分钟阅读
来源:1474 条推文 + 250 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-13 — 2026-05-14
分享
AI 速读19 条精选

🤖 AI 大模型

𝕏 【重磅】英国国家 AI 安全研究所发布前沿模型评估:Mythos 与 GPT-5.5 能力倍增周期仅 4.5 个月

英国国家 AI 安全研究所最新报告指出,MythosGPT-5.5在网络安全任务上的能力正在快速提升,完成复杂任务的长度每几个月翻一番。报告显示,能力倍增周期缩短至 4.5 个月,且模型性能受限于推理 token 数量而非底层能力上限。

𝕏 【重磅】Nous Research 发布 Token Superposition Training,训练速度提升 2-3 倍

Nous Research推出Token Superposition Training (TST),一种修改标准 LLM 预训练循环的方法。该方法在匹配 FLOPs 的情况下,将墙钟时间缩短 2-3 倍,且无需改变模型架构、优化器或分词器。实验验证涵盖270M10B-A1B MoE规模,推理模型与传统预训练完全一致。

𝕏 ⭐ Anthropic 宣布 Claude Code 周使用限额提升 50% 并新增月度额度

Anthropic宣布从即日起到7 月 13 日Claude Code周使用限额提升50%;同时付费计划用户可获得专属月度额度,覆盖 Agent SDKGitHub Actions等程序化调用场景。

𝕏 ⭐ LangChain 发布 SmithDB 与 Engine,重构 Agent 可观测性

LangChain发布专为Agent 可观测性设计的分布式数据库SmithDB,性能提升12 倍;同时推出Engine,能自动分析追踪数据并生成修复代码,实现自改进 Agent闭环。

𝕏 ⭐ Notion 推出开发者平台:支持外部 Agent 编排、自定义工具及数据库同步

Notion正式发布开发者平台,引入External Agents API允许集成任意 Agent,新增Workers托管计算沙箱用于构建自定义工具,并推出CLI命令行工具。新功能支持将Salesforce等数据源同步至 Notion 数据库,实现自动化工作流。

𝕏 ⭐ Android 16 引入本地 MCP 式能力,应用可向 Gemini 暴露工具函数

Android 16新增本地AppFunction机制,应用可用**@AppFunction**向 Gemini 等代理暴露工具,支持跨应用动作链且无需云端服务器。

𝕏 ⭐ LangChain 发布 SmithDB 等七大新工具加速 Agent 开发

LangChain在 Interrupt 大会上发布一系列新产品,包括专为 Agent 可观测性设计的SmithDB(速度提升15 倍)、LangSmith EngineSandboxesManaged Deep Agents。这些工具旨在覆盖从开发到部署的全生命周期,支持企业级 Agent 构建。

𝕏 ⭐ SGLang 支持 Laguna-XS.2 模型,SWE-bench 验证率达 68.2%

SGLang新增对Laguna-XS.2(33.4B-A3B 混合架构)的支持,该模型专为Agent 编码设计,在SWE-bench Verified测试中达到68.2%,支持131K-token上下文及原生工具调用解析。

𝕏 ⭐ MiniCPM-V 4.6 开源,1.3B 多模态模型可在手机端做图像识别

面壁智能开源MiniCPM-V 4.6,参数量1.3B,AA 评测仅耗5.4M token,低于 Qwen3.5-0.8B 非推理版 101M。

𝕏 ⭐ PayPal 与 Anthropic 合作推出面向小企业的 AI 培训及 Claude 插件

PayPal宣布与Anthropic合作,为小企业推出免费 AI 培训课程及Claude for Small Business插件。该插件可连接QuickBooksHubSpot等工具,协助处理发票和退款任务,需人工审批以确保合规。

𝕏 ⭐ Anthropic 将 Claude Agent SDK 程序化调用改为额度制,6 月 15 日生效

AnthropicClaude Agent SDK、claude -p、GitHub Actions 等程序化调用纳入美元额度:Pro 20 美元、Max 20x 200 美元6 月 15 日生效。

𝕏 ⭐ Anthropic 将为付费 Claude 套餐加入 Agent SDK 月度额度

Anthropic称自6 月 15 日起,付费Claude套餐将包含独立的Claude Agent SDK月度额度,覆盖脚本、claude -p 和第三方 SDK 应用。

𝕏 ⭐ Google Gemini 网站 4 月访问量达 27.61 亿,连续 16 个月增长

Similarweb数据显示,Gemini网站 4 月访问量达27.61 亿,环比增6.38%、同比增 574.47%,连续 16 个月增长。

𝕏 ⭐ Mythos Preview 首次完成英国 AISI 两个网络靶场

Mythos Preview被称为首个端到端完成英国AISI两个网络靶场的模型,其中包括此前无模型攻破的Cooling Tower任务。

𝕏 ⭐ Anthropic CFO 披露收入与算力采购细节

Anthropic CFO Krishna Rao 称,公司运行收入从2.5 亿美元增至300 亿美元,已融资约750 亿美元,并负责 Trainium、TPU、GPU 算力分配。

𝕏 ⭐ Supabase 推出 Agent Skills,AI 代理直接尊重 RLS 规则

Supabase发布Agent Skills,使 AI 代理(如Claude CodeCursor)能直接理解并遵守数据库的**RLS(行级安全)**策略。通过一条命令 npx skills add supabase/agent-skills,即可让代理在构建应用时自动遵循数据权限,消除猜测 CLI 命令的需求。

𝕏 ⭐ Cursor 推出云环境运行 Agent 功能,支持完整开发栈配置

Cursor宣布用户可在云环境中运行AI Agent,支持克隆仓库、安装依赖及配置工具链凭证。企业客户如DecagonAmplitude已利用此功能让 Agent 端到端处理任务,并具备版本回滚与审计日志功能。

𝕏 ⭐ Claude Code 每周用量上限临时提高 50%

AnthropicClaude Code每周上限提高50%,覆盖 Pro、Max、Team、Enterprise,叠加上周5 小时窗口翻倍,有效期至7 月 13 日

𝕏 ⭐ Mythos 模型成为首个通过 AISI 全部网络安全演练的 AI 系统

Anthropic发布的 Mythos预览版成为首个成功解决 AISI(人工智能安全研究所)所有网络安全演练的模型,展示了其在防御性 AI 领域的突破性能力。

𝕏 Finance Agent Benchmark v2 显示开源权重金融模型逼近前沿模型

Kimi K2.6GLM 5.1DeepSeek V4 Pro在金融智能体基准约44%-45%,距领先模型约 7 分。

𝕏 Amazon 在搜索栏推出 Alexa+驱动的 AI 购物助手

Amazon在 App 和网站加入Alexa for Shopping,可比较商品、生成购买指南、追踪价格并自动找优惠。

𝕏 Google 推出 Gemini Intelligence,深化 Android 跨应用自动化

GoogleGemini Intelligence整合进Android,支持跨应用多步骤任务自动化。

𝕏 OpenAI 向企业提供 30 天内试用 Codex 可获两个月免费额度

Sam Altman企业在未来30 天内试用迁移到Codex,可获得两个月免费使用额度。

𝕏 Hugging Face 展示用 Claude Code 微调视觉语言模型

Hugging Face演示让Claude Code计算 VRAM、选择实例并启动模型微调任务。

𝕏 DramaBox 开源语音模型支持表演生成与可验证签名

Resemble AI发布开源DramaBox,同时提供表演式语音生成和可验证声音签名。

𝕏 本地 Qwen-3.6-35B-A3B 可在 M1 Max 64GB 上完成实际开发任务

Qwen-3.6-35B-A3B配合llama.cpp可在M1 Max 64GB上并行处理两个项目,达到可工作水平。

𝕏 Warp 接入 Claude Opus 4.7 快速模式,速度提升约 2.5 倍

Warp Agent向付费用户开放Claude Opus 4.7快速模式,在保持模型能力下速度约提升2.5 倍


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。