天眼早报
🤖 AI 大模型
𝕏 马斯克计划以 600 亿美元收购 Cursor,Cursor 将推出 Origin 代码托管平台
马斯克 承认 SpaceX 在 AI 赛道落后,计划动用 860 亿美元 储备扭转局面,其中包括以 600 亿美元 全股票交易收购编程智能体 Cursor。被收购后,Cursor 将推出 Origin,一个为 Agent 时代设计的代码托管与协作平台,集成 Git 功能,目标从 AI 编辑器升级为端到端开发平台。
𝕏 Grok 4.3 登陆 Amazon Bedrock
xAI 宣布 Grok 4.3 在 Amazon Bedrock 上可用,提供行业领先的 幻觉率 和 工具调用 能力,支持 100 万 token 上下文、可配置推理力度、原生工具调用和结构化输出,开发者可借助 Bedrock 安全推理引擎构建应用。
𝕏 DeepSeek 获 74 亿美元融资,估值 500 亿美元
DeepSeek 完成 74 亿美元 融资,估值 500 亿美元,创始人 梁文锋 持股近 90% 并个人出资约 30 亿美元。腾讯、宁德时代等参投。
𝕏 OpenAI 发布 LifeSciBench 基准
OpenAI 发布 LifeSciBench,与 173 位科学家 合作开发,包含 750 个任务 覆盖七项生物学研究流程。GPT‑Rosalind 得分超过 GPT‑5.5。
𝕏 GLM-5.1/5.2 在 CritPt 测试中得分持平 Opus 4.8 和 GPT-5.4
独立评测机构 Artificial Analysis 显示,GLM-5.1 在 CritPT 测试中得分 20.9,远超智谱官方标注,达到 Opus 4.8 和 GPT-5.4/5.5 水平。同时 GLM-5.2(最大推理模式)在 CritPt 前沿物理问题评测中同样得分 20.9%,与 Claude Opus 4.8 持平,远超其他开源模型。
𝕏 OpenAI Codex 支持接入任意开源大模型
OpenAI 宣布 Codex 支持接入任何开源大模型,不强制绑定自家模型,并发布文档指导替换底层模型。随后 Codex 官方再次确认该平台现支持任意模型,开发者可光明正大将 DeepSeek、GLM 等模型接入 Codex 工作流。
𝕏 OpenAI 年支出 340 亿美元,收入仅 130 亿
FT 报道 OpenAI 去年营收约 130 亿美元,但研发支出 190 亿,销售营销 60 亿,总支出 340 亿,烧钱速度或威胁依赖其需求的 Nvidia、Oracle 等公司。
🔵 法国总统马克龙试图绕过特朗普对 Anthropic 的禁令,Anthropic 被警告需获政府许可
法国总统马克龙 与 G7 领导人及科技高管会谈,探索通过 可信合作伙伴 部署最先进 AI 模型,以规避美国对 Anthropic 模型的限制。同时美国商务部警告 Anthropic,需获得政府许可才能让外国人访问其 最先进 AI 模型。
🔵 苹果计划 2027 年推出摄像头 AirPods 和可折叠 iPhone
苹果 计划在 2027 年推出 摄像头 AirPods、智能眼镜和 可折叠 iPhone,作为重大产品推动的一部分。
𝕏 超 100 个 AI 代理协作将 Gemma 4 推理吞吐提升 5 倍
Hugging Face 发起代理协作挑战,100+ 代理 参与,1000+ 消息 交互,提交 450 项 结果,一周内将 Gemma 4 的推理吞吐从 100 tok/s 提升至 500 tok/s 以上。
𝕏 阿里通义实验室开源 LOGOS 科学基础模型
阿里通义实验室 开原 LOGOS,一个通用科学基础模型,将蛋白质、分子等科学对象映射到共享离散 token 空间,实现跨领域知识迁移。
🔵 微软通过销售 OpenAI 模型在中国建立大型 AI 业务
微软 已在中国建立了销售 OpenAI 模型的大型业务,尽管美中在 AI 领域竞争加剧。该业务为微软贡献了可观收入。
𝕏 Catnip 发布 MaineCoon 实时音视频模型
Catnip 发布 MaineCoon,一个 220 亿 参数的实时音视频模型,可在单张 H100 上以 47.5FPS 运行,实现低延迟角色流。
🔵 AI 健康初创公司目标 2027 年底覆盖半数拉美医生
获 a16z 支持的医疗 AI 初创公司计划到 2027 年底 让 AI 助手覆盖拉美 190 万 医生的一半,以缓解医疗专业人员短缺。
🔵 Crosby Intelligence 推出法律 AI 基准与奖学金
Crosby Intelligence 启动,发布 RedlineBench 合同谈判基准、$25K 研究奖学金,并举办应用 AI 对话。
𝕏 OpenAI 研究:深度使用 AI 每周节省超 10 小时
OpenAI 最新研究报告显示,深度使用 AI(如 GPT-5 Thinking、Deep Research)的员工每周节省超 10 小时,重度用户 的 AI 用量是轻度用户的 8 倍。
𝕏 Kimi K2.7 与 Claude Fable 5 对比:开源便宜 16 倍且质量相当
Together Compute 测试了 Kimi K2.7(开源)和 Claude Fable 5 生成落地页的能力,结果显示 Kimi 成本低 16 倍,质量相近。
𝕏 Google DeepMind 发布从 AGI 到 ASI 报告
Google DeepMind 发表《From AGI to ASI》报告,探讨通过 scaling、范式转变 等 4 条路径通向超级智能。
𝕏 GLM-5.2 设计能力获 Opus 级好评
开发者测试 GLM-5.2 在游戏、落地页、HTML 作品、3D 世界等设计任务中的表现,认为其质量接近 Claude Opus 4.8,优于多数闭源模型。
𝕏 新论文提出 LoopCoder-v2 高效推理时扩展方法
新论文提出 LoopCoder-v2,仅需一次循环即可实现高效的推理时计算扩展,提升代码生成任务性能。
𝕏 Sakana AI 发布首个商用产品 Sakana Marlin
Sakana AI 发布首个商用产品 Sakana Marlin,可代理人类的研究任务。
𝕏 GLM 5.2 在 Next.js Evals 中击败 Opus 4.8
Vercel CEO rauchg 透露,开源模型 GLM 5.2 在 Next.js Evals 中击败 Opus 4.8,并强调 ai sdk 的价值日益凸显。
𝕏 Allen AI 发布 MolmoMotion 3D 运动预测模型
Allen AI 发布 MolmoMotion,给定一个或几个视频帧、物体上的 3D 点及指令,可预测未来几秒内这些点的 3D 运动轨迹。
𝕏 OpenCode 五月数据:月活 1000 万,日处理 5 万亿 token
OpenCode 五月运营数据:1000 万 MAU、5 万亿 token/天、2300 万下载量、1100 万 ARR。
𝕏 智谱 AI 继续预训练 3 万亿 tokens
智谱 AI 继续预训练 3 万亿 tokens,通过 RL 和多模态有望大幅领先 GLM 5.5,接近 Fable 水平。
𝕏 Gemini TTS 新增流式输出功能
Gemini TTS 新增 流式输出 功能,设置 stream: true 即可实时生成语音,适合语音助手等应用。
🐙 微软开源 Fara-7B 高效 Agent 模型
微软 开源 Fara-7B 参数规模的 Agent 模型,专注于计算机使用任务(GUI 操控)。配套发布 WebTailBench 评测基准,性能达到先进水平。
𝕏 Kimi K2.7 Code 在 Agent Arena 排名第 19
LMSYS 的 Agent Arena 显示 Kimi K2.7 Code 总体排名第 19,开源模型第 6,任务成功率突出但可控性下降 12.25%。
𝕏 Llama.cpp 发布全新品牌与官方网站
ggerganov 主导的 Llama.cpp 项目更新品牌形象并上线官方站点,进一步推动本地大模型运行。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。