04月22日 · 科技晚报

天眼晚报

科技|2026年04月22日|173 分钟阅读
来源:1461 条推文 + 480 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-22
分享
AI 速读20 条精选

🤖 AI 大模型

𝕏 SpaceX 与 Cursor 达成合作,并获得 600 亿美元收购选择权

SpaceXCursor宣布达成合作协议,年内可选择600 亿美元收购 Cursor,或支付 100 亿美元合作费用。相关披露还提到,Cursor 将使用 xAI Colossus 算力训练编程模型,且交易背景与公司筹备大规模 IPO 进程相互交织。这一安排兼具业务协同与资本运作色彩,是 AI 编程工具赛道中的重磅事件。

𝕏 Google 推出下一代 Deep Research 与 Deep Research Max,并开放 API

Google发布新一代Deep ResearchDeep Research Max,报价分别为1 美元7 美元每份报告。新版本支持 MCP 接入 FactSet、S&P Global、PitchBook 等外部数据源,可处理 PDF、CSV、图片、音视频等多种输入,并支持原生生成图表与信息图。这意味着研究型 Agent 正从单一文本摘要迈向可连接数据源、可视化输出的完整研究工作流。

𝕏 Moonshot 披露 Kimi K2.6 在 Agent 编码基准上逼近或超过 Claude Opus 4.6

Moonshot发布Kimi K2.6后披露,其在 SWE-bench Pro 58.6LiveCodeBench 89.6HLE with tools 54.0 等多项 Agent 与编码基准中接近或超过 Claude Opus 4.6。同时其输入价格低至0.95 美元/百万 token,凸显出在高性能 Agent 场景下兼顾效果与成本的竞争力。

𝕏 OpenAI 正式发布 ChatGPT Images 2.0,并向 ChatGPT、Codex 与 API 全量开放

OpenAI正式发布ChatGPT Images 2.0,并已在ChatGPTCodex与 API 同步上线。多方信息显示,该版本支持最高2K 分辨率输出,显著强化小字体与多语言文本渲染、复杂排版、多图一致性、UI 生成与图像编辑能力,中文字符表现也明显提升;部分介绍还提到其具备更强的候选图生成、自我复核与复杂视觉任务处理能力。

𝕏 Kimi K2.6 被评为接近顶级 Agent 能力的开源权重模型

围绕Kimi K2.6的多份评测与开发者实测显示,其在Agent、链式工具调用、信息综合、研究综述与设计任务上已逼近前沿闭源模型。Fireworks AI 团队认为它是首个在复杂工具调用上接近 Opus 4.6 的开源权重模型,部分子集甚至超过 GPT 5.2;开发者还指出其具备低成本与高速度优势,但仍存在耗 token 与思考循环等问题。

𝕏 Anthropic 测试将 Claude Code 移出 Pro 后又恢复,反映代理成本压力

Anthropic曾对约2%新用户测试调整 20 美元 Pro 订阅,可能不再包含Claude Code,引发用户对权益收缩的质疑;随后定价页已恢复相关描述,外部确认 Claude Code 重新回到 Pro。多方讨论认为,此次反复与长程代理带来的代币成本上升、订阅收入与使用成本失衡有关,凸显 AI 编程代理商业模式仍在摸索。

𝕏 蚂蚁集团发布 Ling 2.6 Flash,104B 参数主打低成本非推理能力

蚂蚁集团发布Ling 2.6 Flash,采用 104B 总参数/7.4B 激活参数 的 MoE 架构,支持262K 上下文。其定价低至输入 0.1 美元/百万 token、输出 0.3 美元/百万 token,并在 Artificial Analysis 智能指数中获得 26 分。整体定位强调以较低成本提供高可用、非重推理型的大模型能力。

𝕏 X 推出 Custom Timelines,基于 Grok 为 75+ 主题生成专属信息流

X正式上线Custom Timelines,用户可在首页固定 75+主题 信息流,依托 Grok 对帖文内容的理解与个性化推荐生成专属时间线。目前该功能先向 iOS Premium 用户开放,Android 后续跟进。相比传统关注流,这一产品更强调主题化组织与算法增强的信息消费体验。

𝕏 百度开源 ERNIE-Image 文生图模型,24G 显存可商用部署

百度开源ERNIE-Image及推理代码,主打8B 参数、消费级24G 显卡可运行,并提供 Turbo 版本实现8 步推理生成高保真图像。相关信息还指出,该模型支持中英日长文本渲染,并可商用部署,意味着百度正在以更完整的工程化方案切入开源文生图第一梯队。

𝕏 OpenAI Developers 开源 Euphony,用于可视化浏览 ChatGPT 与 Codex 会话日志

OpenAI Developers发布开源工具Euphony,可将 ChatGPTCodex 的原始 JSON 日志转换为可视化界面,支持时间线浏览、搜索筛选、翻译与编辑,便于排错、分享与结果复现。该工具提升了开发者对模型会话与代理执行过程的可观测性,也有助于调试复杂工作流。

🔶 智平方发布 AlphaBrain Platform,开源具身智能模型社区

智平方发布AlphaBrain Platform,一次性开源 NeuroVLA、基于 RL Token 的 VLA 训练架构,以及可插拔世界模型架构,面向全球开发者开放。该平台不仅是单个模型开源,更像是围绕具身智能训练与系统搭建的完整社区化基础设施,强调开放协作与模块化扩展。

𝕏 DeepSeek 下一代模型疑似接入官方 API,出现 100 万上下文迹象

多位开发者测试发现,DeepSeek官方 API 疑似已开始部署新一代模型,出现100 万上下文支持迹象,且推理输出在 65536 token 附近截断,显示服务端可能已先行上线而文档尚未同步更新。社区也围绕接口变化、模型版本与能力边界展开讨论,表明 DeepSeek 新版本发布前奏可能已经开始。

𝕏 Google 展示基于 Gemini 3.1 Flash Live API 的实时视觉代理

Google Developers展示了基于Gemini 3.1 Flash Live API构建的实时视觉代理,能够同时完成看、听、说并生成音乐。官方还提供了较完整的技术解析与接入信息,方便开发者基于该实时多模态能力构建交互式应用,体现 Gemini Live 能力向开发平台的进一步开放。

𝕏 Odyssey 发布 Odyssey-2 Max 世界模型,主打物理精度提升

Odyssey推出Odyssey-2 Max,定位新一代世界模型。官方强调其在物理准确性方面有显著提升,目标是推动对现实环境的实时模拟与交互式建模,面向更强的环境理解、动态推演与沉浸式交互应用。这代表模型能力正从传统语言理解进一步延伸到对可交互世界的建模。

𝕏 Notion 接入 Kimi K2.6,强调开源权重模型的任务执行能力

Notion宣布接入Kimi K2.6,并称其是首个表现接近顶级闭源模型的开源权重模型之一,重点强化工具调用与复杂任务执行体验。此举不仅体现 Kimi 在企业级工作流场景中的可用性,也反映 Notion 正将更强的开源模型纳入其生产力产品栈。

𝕏 AI Studio 上线可对话式 Agents,首发 Deep Research Agent

AI Studio上线可直接对话的Agents,首个产品为 Deep Research agent。其支持协作式规划、后台运行任务,以及原生图表与信息图生成,体现 Google 正把研究型代理从 API 能力扩展到可直接交互的开发环境中,降低构建与测试复杂代理工作流的门槛。

𝕏 OpenAI 确认 Codex Responses 为官方支持接口,且 Codex 将继续向免费版与 Plus 提供

有关 Codex 的两则信息显示,OpenAI员工首次确认 /backend-api/codex/responses官方支持接口,现有 PiOpencode 已在使用,这有利于开源工具稳定适配;同时团队成员表示 Codex 将继续向免费版与 20 美元 Plus 用户开放,不会提前取消权限,缓解了外界对权限收紧的担忧。

𝕏 Gemma 4 本地并发演示开源,MacBook Pro M4 Max 可跑 10+ 路并发

Gemma 4 26B A4B 的本地并发演示已开源,展示在 MacBook Pro M4 Max 上可同时处理10+并发请求,单请求速度约 18 tokens/秒。这一结果突出了新一代轻量模型和本地推理优化在消费级高端设备上的可用性,适合关注端侧部署与多路服务能力的开发者。

🔵 日本与澳洲监管机构关注 Anthropic Mythos 对金融与网络安全的潜在风险

来自彭博的两则报道显示,Anthropic Mythos 已引起监管层关注日本财务大臣片山皋月计划与大型银行会面,评估该模型对金融体系的潜在威胁;澳洲联储则因其可能提升复杂网络攻击能力而持续监测。两国机构的动作表明,前沿模型的系统性风险正进入金融与网络安全监管视野。

𝕏 OpenAI Image 2 / GPT-Image-2 在图像基准与竞技场取得领先

围绕GPT-Image-2的多项评测显示,其不仅在IRGB图像推理生成基准取得 26.7%,被称为新的 SOTA,还在 Image Arena 获得 1512 分,领先第二名 242 分。这表明 OpenAI 新一代图像模型不仅在生成质量上占优,也在图像理解、推理与可用性相关评测中展现出明显优势。

𝕏 阿里巴巴发布生态级 AI 助手“千问小九我”

阿里巴巴推出生态级 AI 助手千问小九我,定位为可在旗下应用间协同执行任务的对话式助手。其能力覆盖点外卖、订票、打车等生活服务,强调通过统一对话入口完成跨应用任务流转,后续将在阿里系 App 中逐步上线,体现阿里对生态型 AI 助手的布局。

𝕏 Claude 面向中国用户开放微信、支付宝与银联支付

Claude已支持中国用户通过微信支付宝银联付款,意味着其订阅与支付流程对中国用户更加友好,也降低了境外支付门槛。该变化有助于 Claude 在中国用户群体中的进一步渗透。

𝕏 Step 3.5 接入 Hermes Agent 免费层

Stepfun Step 3.5 已替换 Mimo 接入 Hermes Agent,用户可通过 Nous Portal 免费层直接使用。这一接入让更多用户能够以低门槛体验 Step 系列模型在代理式使用场景中的能力。

𝕏 MiniMax Music 2.6 接入 Sonus AI Music

MiniMax Music 2.6 已为 Sonus AI Music 提供底层能力。官方称新版本在人声乐器细节与风格表达方面有所提升,显示音乐生成模型正持续向更细腻的可听感和风格控制演进。

𝕏 Qwen3.6-35B-A3B 登顶 Hugging Face 本周热门模型

Qwen3.6-35B-A3B登上Hugging Face本周热门榜第 1,反映其在开发者社区中的短期关注度与讨论热度持续上升。尽管信息量有限,但足以说明该模型近期具备较强社区势能。

𝕏 韩国美联储主席提名人称 AI 生产率提升或为降息提供空间

凯文·沃什在参议院听证会上表示,AI 驱动生产率增长可能为美联储降息提供空间。这一表态将 AI 对宏观经济效率的影响直接纳入货币政策讨论,也使 AI 生产率红利成为利率预期中的潜在变量。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。