天眼晚报
编程与视觉能力大幅提升,在多项基准测试中超越GPT-5.4和Gemini 3.1 Pro,但长文本处理准确率下降引发争议,标志AI模型竞争加剧。
总参数350亿,激活仅30亿,智能体编码能力比肩更大模型,推动AI开源生态和高效模型发展。
轻量级框架支持多智能体工作流,兼容100+ LLMs,降低AI应用开发门槛,促进工具生态繁荣。
生产级AI视频模型,已用于春晚舞台效果,推动媒体娱乐行业AI应用和商业化进程。
🤖 AI 大模型
𝕏 🔥 Anthropic 发布 Claude Opus 4.7,编程与视觉能力大幅提升但长文本处理现争议
Anthropic发布了新模型Claude Opus 4.7。官方及用户测试显示,其在多项基准测试中超越GPT-5.4和Gemini 3.1 Pro,尤其在SWE-bench Pro编程测试中得分提升11%,视觉测试准确率从54.5%飙升至98.5%,在代理式 CAD 设计领域也达到先进水平。然而,该模型在百万级上下文(MRCR 基准)准确率从78.3%大幅下降至32.2%,处理相同内容需额外消耗35%的 token,且其自适应思考功能在非数学/代码任务上表现不佳引发争议。模型内置严格安全机制,默认思考强度已提升至xhigh档位。
𝕏 🔥 阿里开源 Qwen3.6-35B-A3B 稀疏 MoE 模型,智能体能力突出
阿里巴巴通义千问团队开源了Qwen3.6-35B-A3B模型。该模型总参数350 亿,激活参数仅30 亿,采用Apache 2.0协议。官方称其智能体编码能力可比肩激活参数大 10 倍的模型,并已在本地成功导航真实代码仓库并管理超过30 个工具调用,展示了在复杂任务中的实用性。
🐙 🔥 OpenAI 开源轻量级 Agents SDK,支持多智能体工作流
OpenAI在GitHub开源了Agents SDK,这是一个用于构建多智能体工作流的轻量级框架。该 SDK 支持OpenAI Responses和Chat Completions API以及100+其他 LLMs。
🛠️ AI 工具推荐
𝕏 🔥 Perplexity 向 Max 用户放量 Personal Computer 功能
Perplexity开始向Max 订阅用户和候补名单放量Personal Computer功能。该功能与 Mac App 打通,可安全编排本地文件、原生应用和浏览器,旨在将 AI 叙事推进到本地设备。
𝕏 🔥 HeyGen 开源 HyperFrames 框架,可通过 Claude Code 构建视频
HeyGen开源了HyperFrames框架,支持通过Claude Code将纯 HTML 动效转换为视频。该框架支持GSAP、Lottie等库,允许开发者使用HTML代码生成类似Remotion的动感视频,并提供了完整的视频渲染管线和编辑器 UI,效果出色。
𝕏 🔥 Codex 推出内置浏览器功能,支持“点哪问哪”
Codex推出内置浏览器功能,用户可在浏览网页时点击任意元素,Codex会自动截图并抓取DOM 元素作为上下文,实现精准的前端开发修改和文档查询。
𝕏 🟢 Cognee 开源项目:6 行代码为 AI Agent 构建持久化记忆
开源项目Cognee结合向量搜索与图数据库,只需6 行代码即可为 AI Agent 构建持久化记忆层。支持从30+数据源接入,提供 Pythonic 数据管道,已有15900+ Star,可替代传统 RAG 方案。
𝕏 🟢 VibeKnow:一键将文本/PPT 转为知识讲解视频
推荐 AI 工具VibeKnow,用户只需提供文字、PDF、网页链接或 PPT,平台即可自动完成从内容理解、分镜、配音配乐到字幕封面生成的全流程视频制作,无需剪辑经验,适用于科普、教学等场景。
𝕏 🟢 Arrow 1.1 发布,可通过代码绘制复杂 SVG 图片
Arrow发布1.1和1.1 Max版本,能够完全通过代码绘制出复杂的SVG图片,绘画过程可视化。
𝕏 🟢 Firecrawl 开源其底层 Web Agent 框架
Firecrawl将其底层的Web Agent 框架完全开源。该框架专为构建具备搜索、爬虫和网页交互能力的智能体设计,支持并行子 Agent 和自定义 Skill,可通过命令行快速生成项目脚手架。
📖 教程攻略
𝕏 🔥 ⭐ 《动手学大模型》系列编程实践教程开源
由上海交通大学课程讲义拓展而来的《动手学大模型 Dive into LLMs》系列教程在GitHub开源。内容覆盖微调部署、提示学习、知识编辑、模型水印等11 个主题,每章配有 PDF、Markdown 和 Jupyter 脚本。
🟩 🟢 使用 Docker 搭建 PostgreSQL 只读副本:分步指南
一份详细的实操指南,指导用户如何使用Docker在本地搭建PostgreSQL主数据库和流式复制副本,以分离读写负载。
𝕏 🟢 使用 Gemini 在 10 分钟内搭建 VLESS+Reality 代理节点
用户分享使用Gemini在10 分钟内完成VLESS + Reality + XTLS Vision代理节点搭建的全过程,提供了详细的 AI 提示词和步骤。
🟩 🟢 Shell 脚本中$@、$、"$@"和"$"的区别详解
通过具体示例,清晰解释了 Shell 脚本中处理命令行参数时,带引号和不带引号的**$@与$**变量在行为上的关键区别。
💎 技巧经验
𝕏 🟢 防止 npm install 供应链投毒的小技巧
分享一个防止 npm install 供应链投毒的技巧:若某个项目被投毒,只要在 7 天内 被发现,有毒的 npm 包 大概率会被删除,从而避免后续安装。方案源自 V2EX 站长。
𝕏 🟢 ⭐ 使用 Claude Code 导出并管理微信聊天记录与联系人
用户分享使用Claude Code成功导出微信中1000 多条聊天记录和2000 多个联系人,并利用 AI 管理所有沟通历史。整个过程耗时一下午,强调行动的重要性。
𝕏 🟢 ⭐ AI 编程上下文管理:状态机、回滚与压缩技巧
深度解析 AI 编程工具的上下文管理,提出上下文窗口本质是状态机的观点。核心技巧包括:使用/rewind回滚到错误发生前的状态比直接纠正更高效;在触发/compact前告知 AI 下一步计划,以优化压缩结果。
🚀 产品发布
𝕏 🔥 ⭐ 火山引擎 Seedance 2.0 API 正式开放
火山引擎宣布Seedance 2.0 API 正式开放,BytePlus全球同步。该模型是生产级 AI 视频生成模型,已被用于春晚舞台效果制作。
由 X-Crawler AI 生成于 2026-04-17 20:02
每日精选 · 直送邮箱
订阅天眼日报
AI 精选科技要闻摘要,每天一封,免费无广告。