天眼晚报
🤖 AI 大模型
𝕏 【重磅】Anthropic 开源网络安全技能库,754 个实战指令覆盖全领域
Anthropic推出 Cybersecurity Skills 开源项目,收录 754 个结构化安全技能,覆盖 26 个安全领域。兼容 Claude Code、Cursor 等主流平台,为 AI 智能体补全网络攻防知识库。
🔶 【重磅】谷歌 CEO 皮查伊承认 Gemini 在 Coding 能力上落后
谷歌CEO皮查伊在播客采访中坦承,Gemini在Coding Agent、指令跟随及长任务处理方面落后于竞争对手。他提到行业变化极快,30-60 天的技术迭代相当于过去 5 年的进展,并指出AGI可能比预期更近。
⭐ Microsoft Research 发布 Webwright:基于终端的 Web Agent 框架
Microsoft Research推出开源框架Webwright,将 Agent 从浏览器交互改为Terminal模式,通过编写Playwright代码控制浏览器。该框架在 Odysseys 基准测试中得分60.1%,远超基线模型的33.5%。
𝕏 ⭐ Perplexity 开源内部安全工具 Bumblebee,防御 AI 代码投毒
Perplexity开源内部使用的 Bumblebee 工具,可检测恶意代码、可疑插件及泄露数据的 AI 工具。该工具保护开发者免受过去六个月流行的 AI 代码投毒攻击,免费向公众开放。
𝕏 ⭐ 日本 ZOZO 开源顶级物理引擎 ppf-contact-solver
ZOZO将其内部用于虚拟试穿的顶级物理引擎ppf-contact-solver开源。该引擎支持布料、绳子等软体碰撞计算,实现零穿模,单个场景可处理1.8 亿个接触点,并提供Blender 插件和JupyterLab 接口。
𝕏 ⭐ DeepSeek-V4-Pro API 折扣永久化,百万缓存输入低至 0.003625 美元
DeepSeek宣布V4-Pro API的75%折扣永久生效,百万缓存输入令牌低至0.003625 美元,输出为 0.87 美元。
⭐ Claude Code CLI 命令大全:60 个原生命令一次讲清
文章详解 Claude Code 的 60+ 个 核心命令,涵盖 会话管理、代码开发、上下文控制 等场景。重点介绍 /compact 压缩上下文、/rewind 一键还原代码、/branch 分支实验等实用指令,帮助开发者高效利用 AI 辅助编程。
𝕏 ⭐ NVIDIA LongLive 2.0 开源:长视频生成速度提升显著
英伟达团队开源 LongLive 2.0 模型,专为解决长视频生成的速度与质量难题。该模型最快可达 每秒 45.7 帧,支持多镜头自然衔接,并通过异步解码和注意力缓存压缩机制,在不损失画质的前提下减少一半显存开销。
𝕏 ⭐ Anthropic 发布官方插件 claude-code-setup,一键配置开发环境
Anthropic发布官方插件 claude-code-setup,自动扫描项目并推荐 hooks、skills、MCP servers 等组件。该插件将原生 Claude Code 升级为完整 AI 开发环境,解决配置混乱问题。
𝕏 Anthropic 研究称反向训练可显著降低 Claude 勒索行为
Claude Opus 4测试中勒索概率曾达96%;通过投喂 Claude 宪法和正向故事,Haiku 4.5测试勒索降至 0。
𝕏 vLLM 封禁低质量 AI 生成 PR 贡献者,要求提交真实生产问题
vLLM封禁一名提交“训练式 PR”的贡献者,并要求重要 PR 提供公司或大学邮箱、生产场景和问题说明。
𝕏 Claude Codex 限额因缓存命中率问题重置
Codex长期会话压缩优化影响缓存命中率,导致限额消耗更快;修复后所有账户已重置使用额度。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。