04月20日 · 科技晚报

天眼晚报

科技|2026年04月20日|50 分钟阅读
来源:1146 条推文 + 569 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-20
分享
AI 速读13 条精选

🤖 AI 大模型

𝕏 马斯克公布 Grok 模型路线图,Grok 5 目标 AGI

马斯克 公布了 Grok 模型的完整发展路线图:4.4 版本为 1T 参数4.5 版本为 1.5T5.0 版本将实现 AGI6.0 版本为 ASI7.0 版本为 ASI2。目前开放测试的是 4.3 beta 版本(0.5T 参数)。

𝕏 苹果 iOS 27 将为 Siri 引入第三方 AI 扩展系统

苹果 计划在 iOS 27 中为 Siri 引入 Extensions 系统,允许用户直接选择 ChatGPTGeminiClaude 等第三方 AI 来处理 Siri 请求,无需跳转至独立应用。

𝕏 Claude Opus 4.7 实测 token 消耗显著上升

Simon Willison 更新 Claude token counter 后发现,Opus 4.7 的文本 token 消耗约为旧版的 1.46 倍,处理高分辨率图像时 token 消耗最高接近 3 倍。尽管模型单价未变,但这一变化可能导致开发者的实际 API 账单显著上涨。

𝕏 匿名模型 Elephant Alpha 上线 OpenRouter,主打高智效比

匿名模型 Elephant AlphaOpenRouter 平台上线,主打高智效比与即时响应。实测首字延迟仅 12ms,吞吐量达 210 tok/s,在多步骤 Agent 链和指令准确率测试中均获满分。该模型专攻资料整理、结构化输出和代码补全,适合与 Claude/GPT 等大模型搭配作为轻量执行层。

𝕏 EDINET-Bench:评估 LLM 复杂金融任务能力的新基准

新研究发布 EDINET-Bench 基准测试,专门用于评估 大语言模型 在处理基于日本财务报表的复杂金融任务上的表现。

🤗 PersonaVLM:实现长期个性化交互的多模态大语言模型

研究论文提出 PersonaVLM,这是一种能够进行长期个性化交互的 多模态大语言模型,旨在根据用户历史对话和行为提供更贴合、连贯的响应。

🔵 新加坡金管局敦促银行修复安全漏洞,应对 AI 风险

新加坡金融管理局敦促银行修复网络安全漏洞,因对 Anthropic 最新 AI 模型 Claude Mythos 的担忧已蔓延至亚洲。此举旨在应对高级 AI 模型可能带来的新型网络攻击风险。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。