天眼早报
Anthropic 据称正以超过9000亿美元估值洽谈至少300亿美元融资,最快本月底完成。若落地,将强化其在算力采购、模型研发和企业销售上的弹药,也显示头部大模型竞争已进入超大资本开支阶段,估值和融资规模继续抬高行业门槛。
台积电董事会核准向 TSMC Arizona 增资最高200亿美元,并派发一季度每股7元台币现金股利。该投入将继续推进美国先进制程产能建设,关系到英伟达、苹果等客户供应链韧性,也反映全球半导体制造本地化趋势仍在加速。
伊朗就霍尔木兹海峡提出谈判条件,英国将派无人机、战机和军舰参与多国护航;评估称33处导弹阵地仍有30处具备作战能力,WTI 原油收于102.18美元。该海峡承载全球关键能源运输,若冲突升级将冲击通胀、航运和央行利率预期。
蚂蚁集团联合浙江省卫健委发布 AntAngelMed,称为全球首个开源100B参数医疗大模型,6.1B激活参数、推理超200 tokens/s,并在 HealthBench、MedAIBench 排名第一。医疗模型开源有助于医院、药企和开发者低成本验证临床推理应用,但也会放大合规和安全评测压力。
DeepMind 系公司 Isomorphic Labs 获得21亿美元新融资,Demis Hassabis 表示资金将延续 AlphaFold 路线,推动 AI 药物发现研发和商业化。大额融资说明 AI 制药正从蛋白结构预测走向药物管线和商业合作,可能改变早期发现成本结构和药企研发外包格局。
🤖 AI 大模型
𝕏 蚂蚁集团发布全球首个开源 100B 医疗大模型 AntAngelMed
蚂蚁集团联合浙江省卫健委推出 AntAngelMed,称其为全球首个开源 100B 参数医疗大模型。该模型在 HealthBench、MedAIBench 等医疗评测榜单排名第一,采用 6.1B 激活参数,推理速度超过 200 tokens/s,并通过 GRPO 强化学习优化临床推理能力与医疗场景中的同理心表达。
𝕏 Hugging Face 公开数据集突破 100 万,AI 构建门槛继续降低
Hugging Face 宣布平台公开数据集数量正式突破 100 万。官方数据显示,自 AI Agent 能力成熟以来,数据集数量在 8 个月 内实现翻倍,而此前达到前 50 万耗时约 4 年。这意味着 Petabytes 级数据已可供数百万开发者使用,本地模型训练和垂直模型构建的数据瓶颈进一步降低。
𝕏 Google DeepMind 发布 AI Co-Mathematician,刷新数学研究基准纪录
Google DeepMind 推出面向数学家的智能体工作台 AI Co-Mathematician,在 FrontierMath Tier 4 基准测试中取得 48% 的高分,刷新 AI 系统纪录。该系统支持异步状态管理、文献发现与定理验证,已解决部分开放性问题,并能为数学研究提供新的推理路径和研究视角。
𝕏 Thinking Machines 发布 276B 实时交互模型 TML-Interaction-Small
Thinking Machines 发布 TML-Interaction-Small,这是一款 276B MoE 模型,采用 12B 激活参数,主打实时自然交互。模型支持 200ms 微轮次 与约 0.40 秒交互延迟,面向更低延迟、更高频反馈的对话式 AI 场景。
🔵 Anthropic 洽谈至少 300 亿美元融资,估值或超过 9000 亿美元
Anthropic 正洽谈以超过 9000 亿美元估值 融资至少 300 亿美元,若完成将成为该公司迄今最大融资轮之一。报道称协议尚未最终敲定,最快可能在本月底完成,显示头部大模型公司在算力、研发与商业化竞争中的资本需求仍在快速上升。
𝕏 LangChain 重新开源 Chat LangChain,展示生产级问答智能体架构
LangChain 团队宣布重新开源 Chat LangChain 项目,用于展示如何构建生产级问答智能体。该实例每周处理近 2T tokens,并包含多项面向稳定性、检索、对话体验和部署实践的改进,为开发者提供企业级 Agent 架构 的参考范本。
𝕏 GPT-5.5 高分版首次解决 ProgramBench 任务,表现优于 Opus 4.7
GPT-5.5 high/xhigh 版本成功解决首个 ProgramBench 任务,并在多项指标上显著优于 Opus 4.7。测试显示,该模型能根据任务需求自动选择 C 或 Python 语言,体现出更强的代码生成、问题分解与逻辑推理能力。
🐙 Needle 将 Gemini 工具调用能力蒸馏到 2600 万参数模型
Needle 项目将 Gemini 的工具调用能力蒸馏到 2600 万参数 模型中,展示了小模型复现大模型工具使用能力的可行路径。该 GitHub 项目在 Hacker News 获得 229 分与 79 条评论,受到开发者社区关注。
𝕏 语音交互模型基准发布:xAI Grok Voice 在客服场景领先
Artificial Analysis 发布语音转语音模型的代理性能基准测试,覆盖航空、零售和电信等真实客服场景。结果显示,xAI 的 Grok Voice Think Fast 1.0 以 52.1% 的任务解决率领先,平均对话时长 5.6 分钟;OpenAI 的 GPT-Realtime-2 (High) 以 39.8% 解决率位居其后。
𝕏 Perplexity 公开 Qwen3 235B 在 GB200 NVL72 上的推理服务研究
Perplexity 发布研究,介绍如何在 NVIDIA GB200 NVL72 机架上服务后训练版 Qwen3 235B。研究重点强调大规模 MoE 推理 在高吞吐场景中的优势,对部署超大参数开源模型、优化多卡并行与提升推理效率具有参考价值。
𝕏 姚顺宇长访谈谈 Claude Code、Gemini 与 AI 编程实践
姚顺宇 在 4 小时访谈中谈及 Claude Code、Gemini、Anthropic 文化与 AI 编程实践,并表示自己的 90% 代码 由 AI 生成。访谈内容聚焦前沿模型在真实研发流程中的使用方式,以及 AI 编程对工程师工作习惯的改变。
𝕏 Meta 发布 Sapiens2 高分辨率人体视觉模型家族
Meta Sapiens2 是 Meta 发布的高分辨率人体视觉模型家族,基于 10 亿张人体图像 训练,覆盖姿态估计、人体分割、法线估计和点云预测等任务。模型规模从 0.1B 至 5B 不等,面向更精细的人体理解与生成式视觉应用。
🛠️ AI 工具推荐
𝕏 Claude Code 新增 Agent 视图,支持并行管理与任务编排
Claude Code 更新引入 Agent View 功能,开发者可在统一界面管理多个代码智能体。新视图支持 并行智能体 运行、后台任务监控、状态指示器、行内回复以及待审查的 PR 列表,体现开发者工作流正从直接编码转向智能体编排与监督。
𝕏 Xiaomi MiMo 修复多轮对话工具调用错误,影响 Cursor、TRAE 等框架
Xiaomi 发布 MiMo 系列模型技术公告,指出在多轮对话中,工具调用后若缺失 reasoning_content 字段,会触发 400 错误。受影响框架包括 TRAE、Cursor、Roo Code 等,官方已提供文档指导开发者修复上下文完整性问题。
𝕏 Data-Analysis-Agent:用自然语言查询数据库的开源分析工具
Data-Analysis-Agent 是一款开源数据分析工具,支持 Excel、CSV、MySQL 和 PostgreSQL。用户可通过自然语言生成 SQL 查询、图表和业务洞察,降低非技术人员使用数据库进行分析的门槛。
𝕏 飞书 CLI 更新 100+ 能力,支持 Bot@Bot 与知识库 Agent 编排
飞书 CLI 过去一个月新增 100+ 项能力,支持通过 Agent 编排画板、妙记、审批和 知识库 等功能。个人和团队可用其实现会议整理自动化、消息过滤、重复任务代跑等工作流,提升办公自动化效率。
🐙 Statewright 用可视化状态机提升 AI Agent 可靠性
Statewright 提供可视化 状态机,用于约束 AI Agent 的执行流程,帮助开发者更清晰地定义状态、转移和边界条件。该项目在 Hacker News 获得 57 分,体现出社区对可控 Agent 架构的关注。
𝕏 Sigma 发布开源私有 AI 浏览器,支持本地 LLM 驱动网页代理
Sigma 推出开源私有 AI 浏览器,将 Web Agent 与 Qwen、Gemma、Nemotron 等本地模型嵌入浏览器。该工具强调本地推理和隐私保护,适合需要在浏览器内运行网页代理任务的用户。
𝕏 schlonk-pad:社交媒体视频抓取与拖拽工具
schlonk-pad 是一款原生素材收集工具,可抓取社交媒体帖子中的 视频内容。用户下载后可直接将视频拖拽到聊天窗口、文件夹或其他应用中,简化视频素材保存、转发和整理流程。
𝕏 Iconize Folder:自定义文件夹图标与颜色管理工具
Iconize Folder 允许用户为文件夹设置颜色和图标,内置 5000+ 符号图标库。它支持调整透明度、大小,添加文字、Emoji 或图片,并可将自定义图标导出为 .icns 格式,方便个性化管理本地文件夹。
𝕏 多仓库 Git 终端面板:一屏查看未推送提交和本地改动
Git 终端面板 可同时监控 多个仓库,集中显示未推送提交和本地改动。用户还能通过快捷键批量拉取、推送或提交,适合需要同时维护多个代码仓库的开发者快速掌握项目状态。
📖 教程攻略
🐙 Paperasse:面向法国行政事务的 AI Agent 技能集
Paperasse 提供专为法国会计、税务、公证等行政事务设计的 AI Agent Skills,覆盖 PCG 会计准则、增值税申报、审计等复杂文书场景。该技能集可集成至 Claude Code、Cursor 等工具中,帮助用户在法国行政流程中更高效地完成资料处理、规则查询与文档生成。
🐙 ARIS:可在睡眠中运行的自主机器学习研究工作流
ARIS 是一套轻量级 Markdown 技能,用于构建自主机器学习研究流程,支持跨模型审查循环、创意发现与实验自动化。它无需绑定特定框架,可直接在 Claude Code、Cursor 中运行,适合让 AI 在长时间任务中持续推进假设生成、实验执行与结果复盘。
🐙 React Doctor:AI 代码质量扫描与修复工具
React Doctor 可通过单条命令扫描代码库,输出 0-100 健康评分与详细诊断报告,覆盖状态管理、性能、架构、安全等维度。它还能直接配置给 Claude Code、Cursor 等 AI 助手,用于约束和修正 AI 生成的 React 代码,降低劣质实现进入项目的风险。
🟩 Gemini API File Search 多模态检索与 LINE Bot 实现教程
该教程介绍 Gemini API File Search 的使用方式,重点展示 Embedding 2 带来的多模态检索能力,并附带开源 LINE Bot 实现示例。内容适合希望将文件搜索、图文理解与聊天机器人结合的开发者参考,用于快速搭建可检索多模态内容的应用原型。
𝕏 教程:在 Claude Code 中集成 Codex 插件
该教程分享在 Claude Code 中调用 Codex 的具体配置步骤:先通过 /plugin marketplace add openai/codex-plugin-cc 添加插件库,再执行 /plugin install codex@openai-codex 安装,最后使用 /reload-plugins 重载并完成登录配置。完成后可在同一工作流中实现双模型协同推理。
𝕏 实战:借鉴 HeavySkill 思路提升 AI 推理质量
该实战介绍基于 HeavySkill 论文的推理增强方案:让多个 AI 先并行生成多条独立推理路径,再由另一轮推理综合得出最终答案。作者计划结合 Claude Code 作为推理引擎、Codex 作为主持人,实测显示这种多路径生成与汇总机制可提升回答质量。
💎 技巧经验
𝕏 独立开发避坑指南:从中介模式切入降低风险
yangyi 提出创业难度分级:中介(信息差套利)难度最低,营销次之,自研产品难度最高。建议新手先做中介或营销积累用户与资金,验证需求后再转型自研,避免直接陷入“地狱模式”。
𝕏 账号安全策略:自建域名邮箱与代理节点
kevinma_dev_zh 分享个人经验,建议用户使用自建域名邮箱并配备自建代理节点,避免过度依赖 Google 登录或手机号。这能有效防止因平台封号或服务中断导致的所有数字资产丢失。
𝕏 程序员成长建议:脱离纯技术视角,多体验生活
kevinma_dev_zh 指出,程序员若想赚钱,不能仅沉迷技术,需多与非技术人员交流,了解业务与生活。这种跨界思维有助于打开视野,发现真正的市场需求,而非闭门造车。
⚡ 工作流
𝕏 美图 RoboNeo 推出四角色 AI 视频制作工作流
美图 RoboNeo 推出 Agent Team 视频制作工作流,将首席编剧、分镜导演、艺术总监和后期合成四个角色纳入协作链路,覆盖品牌叙事框架、画面规划、风格确认到成片剪辑。该流程面向 Vlog 与广告片制作,强调用分工式 AI 代理提升内容生产效率。
𝕏 Garry Tan 团队总结 AI 编码工作流:每次改动同步测试、文档和评测
Garry Tan 团队在 72 小时 内合并 14 个 PR、增加 29000 行 代码,其经验是要求编码 Agent 在每次改动时同步产出测试、文档和 eval。该做法把代码生成从单次提交扩展为可验证、可维护的工程流程,减少后续人工补齐质量保障环节的成本。
𝕏 Flowscope 用 AI 代理自动学习并重构企业流程
Flowscope 部署智能代理,自动学习并文档化企业运营流程,再对流程进行重新设计和自动化。相比传统企业系统常见的数月实施周期,Flowscope 宣称可在 几天内 将 AI 自动化 部署到现有系统中,帮助企业更快落地业务流程改造。
𝕏 Matt Pocock:用 Agent 规划任务前先做原型验证提示词与真实数据
Matt Pocock 分享了用 Agent 为视频自动生成章节的流程:先构建 EffectTS TUI 原型,利用真实数据验证系统提示词与交互逻辑,再交给 Agent 完成后续实现。该方法强调在自动化复杂任务前先用轻量原型降低不确定性。
📚 论文研究
⭐ 金刚石铜复合材料首次规模化用于超算散热
金刚石铜复合材料在郑州国家超算互联网核心节点首次规模化应用,使芯片模组传热能力提升80%、性能提升 10%、温度下降 5℃。
𝕏 RLM 论文更新:深度递归调用带来显著性能提升
a1zhang 分享了 RLM 论文的更新版本,增加了深度=2/3 的递归调用实验。结果显示在 OOLONG-Pairs 和其他基准测试中取得显著性能提升,并新增了长度泛化实验与错误分析,展示了更优的训练结果。
🚀 产品发布
⭐ Anthropic 推出 12 款法律 AI 插件,Claude 接入 DocuSign 和汤森路透
Anthropic发布12 款法律 AI 插件,覆盖合同审查、司法备考,并让 Claude 连接DocuSign、汤森路透和 Harvey。
𝕏 SureThing 在 LongMemEval 声称取得 88.0%总分
SureThing发布 Agent 记忆层工具,称在LongMemEval取得 88.0%总分、91.0%知识更新和 76.7%单会话偏好。
🔵 苹果计划在 iOS 27 升级可自定义相机与 Siri 设计
苹果计划在iOS 27中加入可自定义相机 App,并调整Siri界面设计。
🌍 国际大事
💹 霍尔木兹海峡封锁风险升级,英法推进护航安排
霍尔木兹海峡封锁风险持续升温:伊朗提出新一轮谈判先决条件,包括结束战事、解除制裁、释放冻结资金、赔偿损失,并承认其对海峡的主导权;英国将派无人机、战机及军舰参与多国护航。另据评估,伊朗沿海峡 33 处导弹阵地中仍有30 处具备作战能力。市场避险情绪升温,WTI 原油收于102.18 美元。
💹 英国工党内部分裂加剧,斯塔默面临下台压力
英国首相斯塔默遭多名官员辞职逼宫,工党内部分裂加剧:逾80 名工党议员要求其下台,另有超100 名议员签署声明支持其留任,显示党内围绕领导权的对立正在公开化。
📈 财经市场
𝕏 Isomorphic Labs 完成 21 亿美元融资,加速 AI 药物发现
Isomorphic Labs获得21 亿美元新融资,Demis Hassabis 称资金将用于延续 AlphaFold 路线,推动AI 药物发现研发和商业化进程。
凯文·沃什获确认出任美联储理事,主席确认程序将启动
美国参议院确认凯文·沃什出任美联储理事,任期14 年;现任主席鲍威尔任期将于 5 月 15 日结束,美联储主席确认程序预计随后启动。
美国 4 月 CPI 同比升至 3.8%,半导体板块大幅回调
美国 4 月 CPI同比上涨3.8%,高于 3 月3.3%,引发市场对通胀和利率路径的再定价;美股半导体板块同步承压,费城半导体指数跌超 3%、盘中一度跌近 7%,高通跌 11.46%,英特尔和闪迪跌超 6%,WTI 原油收于 102.18 美元。
🔵 CME 拟创建 AI 算力期货市场,推动算力资产定价
CME Group与Silicon Data合作,计划创建AI 算力期货市场,为人工智能基础设施背后的计算能力设定市场价格,推动算力从基础资源进一步金融化、标准化定价。
💹 银行理财 4 月规模超季节性回升,14 家公司单月增 2.33 万亿元
14 家理财公司4 月存续规模环比增2.33 万亿元,较上年同期多增约4000 亿元,显示银行理财规模在 4 月出现超季节性回升。
💹 MSCI 新兴市场指数新增长飞光纤光缆 A 股等标的
MSCI新兴市场指数新增长飞光纤光缆 A 股等标的,全球ACWI 指数新增49 只证券、剔除 101 只,相关指数调整或影响被动资金配置。
Anthropic 据称洽谈至少 3 亿美元收购开发工具公司 Stainless
Anthropic据称正在洽谈收购开发工具初创公司Stainless,交易金额至少3 亿美元;OpenAI 和谷歌均使用其产品,显示大模型公司对开发者生态和工具链资产的争夺升温。
Cerebras 美国 IPO 定价据称高于 150 至 160 美元指引区间
Cerebras美国 IPO 发行价据称高于150 至 160 美元指引区间,显示投资者对AI 芯片公司上市需求仍然强劲。
美联储 6 月维持利率不变概率升至 97.1%
CME 美联储观察显示,6 月维持利率不变概率为97.1%,7 月维持不变概率为 96%,市场继续押注美联储短期内按兵不动。
🏭 工业能源
💹 台积电核准向亚利桑那子公司增资最高 200 亿美元
台积电董事会决议派发 2026 年一季度每股7 元台币现金股利,并核准向TSMC Arizona增资不超过200 亿美元。该增资将继续支持其美国先进制程制造布局,强化亚利桑那厂区建设与长期产能规划。
𝕏 特斯拉将在柏林工厂投资近 2.5 亿美元扩建 4680 电池产能
特斯拉宣布将在Giga Berlin投资近 2.5 亿美元扩建 4680 电池产线,计划把电池年产能提升至18GWh,并新增雇佣 1500 多名员工。该扩建将强化其欧洲本地电池制造能力,支撑后续电动车产能与供应链布局。
🔵 三星劳资谈判破裂,存储芯片业务面临罢工风险
三星电子与工会未能达成工资协议,罢工风险可能影响这家全球最大存储芯片制造商的运营。若劳资僵局持续,相关生产安排和供应稳定性或受到市场关注,尤其是在存储芯片景气周期变化背景下。
💹 谷歌据称与 SpaceX 洽谈在轨数据中心发射计划
谷歌据称正与SpaceX及其他火箭公司讨论在轨数据中心发射合作,推进轨道计算基础设施计划。该设想将云计算能力与航天发射资源结合,可能为未来太空算力、低延迟数据处理和新型基础设施部署提供路径。
🔵 中国 AI 硬件供应商受组件短缺制约,难以满足旺盛需求
中国 AI 硬件供应商正面临组件短缺压力,难以跟上人工智能产品需求增长。短缺问题可能影响服务器、计算设备及相关硬件交付节奏,并进一步凸显 AI 产业链在关键零部件供应上的瓶颈。
💹 通用与 LG 俄亥俄电池工厂复产时间仍不确定
Ultium Cells俄亥俄电池厂计划在 5 月 25 日当周安排少量员工返岗,但约850 名员工何时全面复工仍取决于电动车需求。该工厂由通用汽车与 LG 能源解决方案合作运营,复产节奏反映北美动力电池产能与终端需求之间的调整压力。
公募基金加码能源全产业链,一季度新能源配置升至 10.15%
公募基金一季度末对电力设备及新能源板块的配置比例上升 0.86 个百分点至10.15%,显示能源主线获得增配。资金关注范围覆盖新能源制造、电力设备及能源产业链相关环节,反映机构对能源转型方向的持续布局。
🧠 深度思考
𝕏 吴忌寒深度思考:AI 时代将从“一人公司”迈向“零人公司”
吴忌寒提出,AI 发展的终极形态可能是 None-Person Company (NPC),即完全自主运转的智能体系统。随着长周期任务能力突破,AI 有望在安全、金融、法律等领域重塑行业;未来操作系统也可能演变为 LLM OS,应用按需生成,并挑战传统 冯·诺依曼架构。
💹 人民日报提醒:AI 智能助手推荐可能被虚假内容操纵
人民日报指出,不法商家可能利用 GEO 向模型投喂虚假软文,影响并扭曲 AI 推荐结果,从而制造消费陷阱。消费者在使用 AI 智能助手做购买决策时,应通过官方渠道和多来源信息交叉核验。
𝕏 Howard Schultz 批评西雅图商业环境,称星巴克岗位转向田纳西
Howard Schultz批评华盛顿州税负和监管环境削弱创业生态,并称 Starbucks 已将数百个企业岗位迁往 田纳西。这一表态反映出企业总部岗位迁移与地方营商环境之间的张力。
𝕏 二三线传统企业或成为 AI 方案商更高利润客户群
作者认为,传统中小企业 往往缺乏 IT 团队,AI 需求也不够清晰;相比北上广深的互联网客户,这类客户与服务商之间存在更明显的 信息不对称,可能为 AI 服务商 带来更高利润空间。
𝕏 李开复辟谣“AI 失业潮”:Andrew Ng 称软件工程师需求仍强
围绕“AI 导致失业潮”的讨论,李开复转述并支持 Andrew Ng 的反驳观点:未来更可能出现 AI 就业狂欢,尤其是 软件工程师 需求仍将保持强劲,AI 工具会扩大开发能力而非简单消灭岗位。
📰 综合新闻
💹 北京要求政府机构每年至少开放 5 个新技术应用场景
北京发布场景培育方案,政府机构每年开放不少于5 项场景资源和需求,覆盖5 方面 18 个建设领域。
📺 我国成功发射千帆极轨 09 组卫星
中国成功发射千帆极轨 09 组卫星,相关话题登上 B 站热搜。
🛡️ 安全隐私
💹 国家安全部提示 App 精准推送背后的个人隐私风险
国家安全部提示多款App存在过度索权、强制获取位置、未公示规则等问题,可能威胁个人信息安全。
由 X-Crawler AI 生成于 2026-05-13 08:02
EVENT-DRIVEN INTELLIGENCE
免费先看重点,Pro 再看速度、深度和可追踪性
这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。