04月17日 · 科技晚报

天眼晚报

科技|2026年04月17日|10 分钟阅读
来源:1411 条推文 + 561 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-17
分享
AI 速读5 条精选

🤖 AI 大模型

𝕏 Anthropic 发布 Claude Opus 4.7,编程与视觉能力大幅提升但长文本处理现争议

Anthropic发布了新模型Claude Opus 4.7。官方及用户测试显示,其在多项基准测试中超越GPT-5.4Gemini 3.1 Pro,尤其在SWE-bench Pro编程测试中得分提升11%,视觉测试准确率从54.5%飙升至98.5%,在代理式 CAD 设计领域也达到先进水平。然而,该模型在百万级上下文(MRCR 基准)准确率从78.3%大幅下降至32.2%,处理相同内容需额外消耗35%的 token,且其自适应思考功能在非数学/代码任务上表现不佳引发争议。模型内置严格安全机制,默认思考强度已提升至xhigh档位。

𝕏 阿里开源 Qwen3.6-35B-A3B 稀疏 MoE 模型,智能体能力突出

阿里巴巴通义千问团队开源了Qwen3.6-35B-A3B模型。该模型总参数350 亿,激活参数仅30 亿,采用Apache 2.0协议。官方称其智能体编码能力可比肩激活参数大 10 倍的模型,并已在本地成功导航真实代码仓库并管理超过30 个工具调用,展示了在复杂任务中的实用性。

🐙 OpenAI 开源轻量级 Agents SDK,支持多智能体工作流

OpenAIGitHub开源了Agents SDK,这是一个用于构建多智能体工作流的轻量级框架。该 SDK 支持OpenAI ResponsesChat Completions API以及100+其他 LLMs


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。