天眼晚报

科技|2026年04月20日|约 50 分钟阅读

来源：1146 条推文 + 569 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-20

AI 速读13 条精选

🤖 AI 大模型

𝕏 马斯克公布 Grok 模型路线图，Grok 5 目标 AGI

马斯克 公布了 Grok 模型的完整发展路线图：4.4 版本为 1T 参数、4.5 版本为 1.5T、5.0 版本将实现 AGI、6.0 版本为 ASI、7.0 版本为 ASI2。目前开放测试的是 4.3 beta 版本（0.5T 参数）。

𝕏 苹果 iOS 27 将为 Siri 引入第三方 AI 扩展系统

苹果计划在 iOS 27 中为 Siri 引入 Extensions 系统，允许用户直接选择 ChatGPT、Gemini 或 Claude 等第三方 AI 来处理 Siri 请求，无需跳转至独立应用。

𝕏 Claude Opus 4.7 实测 token 消耗显著上升

Simon Willison 更新 Claude token counter 后发现，Opus 4.7 的文本 token 消耗约为旧版的 1.46 倍，处理高分辨率图像时 token 消耗最高接近 3 倍。尽管模型单价未变，但这一变化可能导致开发者的实际 API 账单显著上涨。

𝕏 匿名模型 Elephant Alpha 上线 OpenRouter，主打高智效比

匿名模型 Elephant Alpha 在 OpenRouter 平台上线，主打高智效比与即时响应。实测首字延迟仅 12ms，吞吐量达 210 tok/s，在多步骤 Agent 链和指令准确率测试中均获满分。该模型专攻资料整理、结构化输出和代码补全，适合与 Claude/GPT 等大模型搭配作为轻量执行层。

𝕏 EDINET-Bench：评估 LLM 复杂金融任务能力的新基准

新研究发布 EDINET-Bench 基准测试，专门用于评估 大语言模型 在处理基于日本财务报表的复杂金融任务上的表现。

🤗 PersonaVLM：实现长期个性化交互的多模态大语言模型

研究论文提出 PersonaVLM，这是一种能够进行长期个性化交互的 多模态大语言模型，旨在根据用户历史对话和行为提供更贴合、连贯的响应。

🔵 新加坡金管局敦促银行修复安全漏洞，应对 AI 风险

新加坡金融管理局敦促银行修复网络安全漏洞，因对 Anthropic 最新 AI 模型 Claude Mythos 的担忧已蔓延至亚洲。此举旨在应对高级 AI 模型可能带来的新型网络攻击风险。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情