天眼晚报
科技|2026年04月17日|约 10 分钟阅读
AI 速读5 条精选
🤖 AI 大模型
𝕏 Anthropic 发布 Claude Opus 4.7,编程与视觉能力大幅提升但长文本处理现争议
Anthropic发布了新模型Claude Opus 4.7。官方及用户测试显示,其在多项基准测试中超越GPT-5.4和Gemini 3.1 Pro,尤其在SWE-bench Pro编程测试中得分提升11%,视觉测试准确率从54.5%飙升至98.5%,在代理式 CAD 设计领域也达到先进水平。然而,该模型在百万级上下文(MRCR 基准)准确率从78.3%大幅下降至32.2%,处理相同内容需额外消耗35%的 token,且其自适应思考功能在非数学/代码任务上表现不佳引发争议。模型内置严格安全机制,默认思考强度已提升至xhigh档位。
𝕏 阿里开源 Qwen3.6-35B-A3B 稀疏 MoE 模型,智能体能力突出
阿里巴巴通义千问团队开源了Qwen3.6-35B-A3B模型。该模型总参数350 亿,激活参数仅30 亿,采用Apache 2.0协议。官方称其智能体编码能力可比肩激活参数大 10 倍的模型,并已在本地成功导航真实代码仓库并管理超过30 个工具调用,展示了在复杂任务中的实用性。
🐙 OpenAI 开源轻量级 Agents SDK,支持多智能体工作流
OpenAI在GitHub开源了Agents SDK,这是一个用于构建多智能体工作流的轻量级框架。该 SDK 支持OpenAI Responses和Chat Completions API以及100+其他 LLMs。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。