天眼早报

科技|2026年05月13日|34 分钟阅读
来源:475 条推文 + 242 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-12 — 2026-05-13
分享
AI 速读24 条精选
🤖头条Anthropic洽谈300亿美元融资

Anthropic 据称正以超过9000亿美元估值洽谈至少300亿美元融资,最快本月底完成。若落地,将强化其在算力采购、模型研发和企业销售上的弹药,也显示头部大模型竞争已进入超大资本开支阶段,估值和融资规模继续抬高行业门槛。

🔲头条台积电拟向美国厂增资200亿美元

台积电董事会核准向 TSMC Arizona 增资最高200亿美元,并派发一季度每股7元台币现金股利。该投入将继续推进美国先进制程产能建设,关系到英伟达、苹果等客户供应链韧性,也反映全球半导体制造本地化趋势仍在加速。

📰头条霍尔木兹风险推高油价

伊朗就霍尔木兹海峡提出谈判条件,英国将派无人机、战机和军舰参与多国护航;评估称33处导弹阵地仍有30处具备作战能力,WTI 原油收于102.18美元。该海峡承载全球关键能源运输,若冲突升级将冲击通胀、航运和央行利率预期。

🤖头条蚂蚁开源百亿级医疗大模型

蚂蚁集团联合浙江省卫健委发布 AntAngelMed,称为全球首个开源100B参数医疗大模型,6.1B激活参数、推理超200 tokens/s,并在 HealthBench、MedAIBench 排名第一。医疗模型开源有助于医院、药企和开发者低成本验证临床推理应用,但也会放大合规和安全评测压力。

🤖头条Isomorphic融资21亿美元做AI制药

DeepMind 系公司 Isomorphic Labs 获得21亿美元新融资,Demis Hassabis 表示资金将延续 AlphaFold 路线,推动 AI 药物发现研发和商业化。大额融资说明 AI 制药正从蛋白结构预测走向药物管线和商业合作,可能改变早期发现成本结构和药企研发外包格局。

🤖DeepMind发布数学研究智能体
📦Hugging Face数据集破百万
🤖Thinking Machines发布低延迟交互模型
🤖Anthropic推出法律AI插件
📈CME拟推AI算力期货
📰美国CPI升至3.8%冲击芯片股
🏛美联储理事确认引发主席交接关注
🔲三星存储芯片面临罢工风险
🔲Cerebras IPO定价或超指引
💡Anthropic拟收购Stainless
📰特斯拉扩建柏林4680电池
📰谷歌据称洽谈在轨数据中心
🤖中国AI硬件受组件短缺制约
📰金刚石铜材料用于超算散热
📰Meta发布人体视觉模型Sapiens2
🤖Grok Voice客服语音基准领先
📰苹果计划升级iOS 27相机与Siri
🏛北京要求政府开放新技术场景
📰国家安全部提示App隐私风险

🤖 AI 大模型

𝕏 蚂蚁集团发布全球首个开源 100B 医疗大模型 AntAngelMed

蚂蚁集团联合浙江省卫健委推出 AntAngelMed,称其为全球首个开源 100B 参数医疗大模型。该模型在 HealthBench、MedAIBench 等医疗评测榜单排名第一,采用 6.1B 激活参数,推理速度超过 200 tokens/s,并通过 GRPO 强化学习优化临床推理能力与医疗场景中的同理心表达。

𝕏 Hugging Face 公开数据集突破 100 万,AI 构建门槛继续降低

Hugging Face 宣布平台公开数据集数量正式突破 100 万。官方数据显示,自 AI Agent 能力成熟以来,数据集数量在 8 个月 内实现翻倍,而此前达到前 50 万耗时约 4 年。这意味着 Petabytes 级数据已可供数百万开发者使用,本地模型训练和垂直模型构建的数据瓶颈进一步降低。

𝕏 Google DeepMind 发布 AI Co-Mathematician,刷新数学研究基准纪录

Google DeepMind 推出面向数学家的智能体工作台 AI Co-MathematicianFrontierMath Tier 4 基准测试中取得 48% 的高分,刷新 AI 系统纪录。该系统支持异步状态管理、文献发现与定理验证,已解决部分开放性问题,并能为数学研究提供新的推理路径和研究视角。

𝕏 Thinking Machines 发布 276B 实时交互模型 TML-Interaction-Small

Thinking Machines 发布 TML-Interaction-Small,这是一款 276B MoE 模型,采用 12B 激活参数,主打实时自然交互。模型支持 200ms 微轮次 与约 0.40 秒交互延迟,面向更低延迟、更高频反馈的对话式 AI 场景。

🔵 Anthropic 洽谈至少 300 亿美元融资,估值或超过 9000 亿美元

Anthropic 正洽谈以超过 9000 亿美元估值 融资至少 300 亿美元,若完成将成为该公司迄今最大融资轮之一。报道称协议尚未最终敲定,最快可能在本月底完成,显示头部大模型公司在算力、研发与商业化竞争中的资本需求仍在快速上升。

𝕏 LangChain 重新开源 Chat LangChain,展示生产级问答智能体架构

LangChain 团队宣布重新开源 Chat LangChain 项目,用于展示如何构建生产级问答智能体。该实例每周处理近 2T tokens,并包含多项面向稳定性、检索、对话体验和部署实践的改进,为开发者提供企业级 Agent 架构 的参考范本。

𝕏 GPT-5.5 高分版首次解决 ProgramBench 任务,表现优于 Opus 4.7

GPT-5.5 high/xhigh 版本成功解决首个 ProgramBench 任务,并在多项指标上显著优于 Opus 4.7。测试显示,该模型能根据任务需求自动选择 C 或 Python 语言,体现出更强的代码生成、问题分解与逻辑推理能力。

🐙 Needle 将 Gemini 工具调用能力蒸馏到 2600 万参数模型

Needle 项目Gemini 的工具调用能力蒸馏到 2600 万参数 模型中,展示了小模型复现大模型工具使用能力的可行路径。该 GitHub 项目在 Hacker News 获得 229 分与 79 条评论,受到开发者社区关注。

𝕏 语音交互模型基准发布:xAI Grok Voice 在客服场景领先

Artificial Analysis 发布语音转语音模型的代理性能基准测试,覆盖航空、零售和电信等真实客服场景。结果显示,xAIGrok Voice Think Fast 1.0 52.1% 的任务解决率领先,平均对话时长 5.6 分钟;OpenAI 的 GPT-Realtime-2 (High) 以 39.8% 解决率位居其后。

𝕏 Perplexity 公开 Qwen3 235B 在 GB200 NVL72 上的推理服务研究

Perplexity 发布研究,介绍如何在 NVIDIA GB200 NVL72 机架上服务后训练版 Qwen3 235B。研究重点强调大规模 MoE 推理 在高吞吐场景中的优势,对部署超大参数开源模型、优化多卡并行与提升推理效率具有参考价值。

𝕏 姚顺宇长访谈谈 Claude Code、Gemini 与 AI 编程实践

姚顺宇 在 4 小时访谈中谈及 Claude Code、Gemini、Anthropic 文化与 AI 编程实践,并表示自己的 90% 代码 由 AI 生成。访谈内容聚焦前沿模型在真实研发流程中的使用方式,以及 AI 编程对工程师工作习惯的改变。

𝕏 Meta 发布 Sapiens2 高分辨率人体视觉模型家族

Meta Sapiens2 是 Meta 发布的高分辨率人体视觉模型家族,基于 10 亿张人体图像 训练,覆盖姿态估计、人体分割、法线估计和点云预测等任务。模型规模从 0.1B 至 5B 不等,面向更精细的人体理解与生成式视觉应用。


🛠️ AI 工具推荐

𝕏 Claude Code 新增 Agent 视图,支持并行管理与任务编排

Claude Code 更新引入 Agent View 功能,开发者可在统一界面管理多个代码智能体。新视图支持 并行智能体 运行、后台任务监控、状态指示器、行内回复以及待审查的 PR 列表,体现开发者工作流正从直接编码转向智能体编排与监督。

𝕏 Xiaomi MiMo 修复多轮对话工具调用错误,影响 Cursor、TRAE 等框架

Xiaomi 发布 MiMo 系列模型技术公告,指出在多轮对话中,工具调用后若缺失 reasoning_content 字段,会触发 400 错误。受影响框架包括 TRAE、Cursor、Roo Code 等,官方已提供文档指导开发者修复上下文完整性问题。

𝕏 Data-Analysis-Agent:用自然语言查询数据库的开源分析工具

Data-Analysis-Agent 是一款开源数据分析工具,支持 Excel、CSV、MySQL 和 PostgreSQL。用户可通过自然语言生成 SQL 查询、图表和业务洞察,降低非技术人员使用数据库进行分析的门槛。

𝕏 飞书 CLI 更新 100+ 能力,支持 Bot@Bot 与知识库 Agent 编排

飞书 CLI 过去一个月新增 100+ 项能力,支持通过 Agent 编排画板、妙记、审批和 知识库 等功能。个人和团队可用其实现会议整理自动化、消息过滤、重复任务代跑等工作流,提升办公自动化效率。

🐙 Statewright 用可视化状态机提升 AI Agent 可靠性

Statewright 提供可视化 状态机用于约束 AI Agent 的执行流程,帮助开发者更清晰地定义状态、转移和边界条件。该项目在 Hacker News 获得 57 分,体现出社区对可控 Agent 架构的关注。

𝕏 Sigma 发布开源私有 AI 浏览器,支持本地 LLM 驱动网页代理

Sigma 推出开源私有 AI 浏览器,将 Web Agent 与 Qwen、Gemma、Nemotron 等本地模型嵌入浏览器。该工具强调本地推理和隐私保护,适合需要在浏览器内运行网页代理任务的用户。

𝕏 schlonk-pad:社交媒体视频抓取与拖拽工具

schlonk-pad 是一款原生素材收集工具,可抓取社交媒体帖子中的 视频内容。用户下载后可直接将视频拖拽到聊天窗口、文件夹或其他应用中,简化视频素材保存、转发和整理流程。

𝕏 Iconize Folder:自定义文件夹图标与颜色管理工具

Iconize Folder 允许用户为文件夹设置颜色和图标,内置 5000+ 符号图标库。它支持调整透明度、大小,添加文字、Emoji 或图片,并可将自定义图标导出为 .icns 格式,方便个性化管理本地文件夹。

𝕏 多仓库 Git 终端面板:一屏查看未推送提交和本地改动

Git 终端面板 可同时监控 多个仓库集中显示未推送提交和本地改动。用户还能通过快捷键批量拉取、推送或提交,适合需要同时维护多个代码仓库的开发者快速掌握项目状态。


📖 教程攻略

🐙 Paperasse:面向法国行政事务的 AI Agent 技能集

Paperasse 提供专为法国会计、税务、公证等行政事务设计的 AI Agent Skills,覆盖 PCG 会计准则、增值税申报、审计等复杂文书场景。该技能集可集成至 Claude CodeCursor 等工具中,帮助用户在法国行政流程中更高效地完成资料处理、规则查询与文档生成。

🐙 ARIS:可在睡眠中运行的自主机器学习研究工作流

ARIS 是一套轻量级 Markdown 技能,用于构建自主机器学习研究流程,支持跨模型审查循环、创意发现与实验自动化。它无需绑定特定框架,可直接在 Claude CodeCursor 中运行,适合让 AI 在长时间任务中持续推进假设生成、实验执行与结果复盘。

🐙 React Doctor:AI 代码质量扫描与修复工具

React Doctor 可通过单条命令扫描代码库,输出 0-100 健康评分与详细诊断报告,覆盖状态管理、性能、架构、安全等维度。它还能直接配置给 Claude CodeCursor 等 AI 助手,用于约束和修正 AI 生成的 React 代码,降低劣质实现进入项目的风险。

🟩 Gemini API File Search 多模态检索与 LINE Bot 实现教程

该教程介绍 Gemini API File Search 的使用方式,重点展示 Embedding 2 带来的多模态检索能力,并附带开源 LINE Bot 实现示例。内容适合希望将文件搜索、图文理解与聊天机器人结合的开发者参考,用于快速搭建可检索多模态内容的应用原型。

𝕏 教程:在 Claude Code 中集成 Codex 插件

该教程分享Claude Code 中调用 Codex 的具体配置步骤:先通过 /plugin marketplace add openai/codex-plugin-cc 添加插件库,再执行 /plugin install codex@openai-codex 安装,最后使用 /reload-plugins 重载并完成登录配置。完成后可在同一工作流中实现双模型协同推理。

𝕏 实战:借鉴 HeavySkill 思路提升 AI 推理质量

该实战介绍基于 HeavySkill 论文的推理增强方案:让多个 AI 先并行生成多条独立推理路径,再由另一轮推理综合得出最终答案。作者计划结合 Claude Code 作为推理引擎、Codex 作为主持人,实测显示这种多路径生成与汇总机制可提升回答质量。


💎 技巧经验

𝕏 独立开发避坑指南:从中介模式切入降低风险

yangyi 提出创业难度分级中介(信息差套利)难度最低,营销次之,自研产品难度最高。建议新手先做中介或营销积累用户与资金,验证需求后再转型自研,避免直接陷入“地狱模式”。

𝕏 账号安全策略:自建域名邮箱与代理节点

kevinma_dev_zh 分享个人经验,建议用户使用自建域名邮箱并配备自建代理节点,避免过度依赖 Google 登录或手机号。这能有效防止因平台封号或服务中断导致的所有数字资产丢失。

𝕏 程序员成长建议:脱离纯技术视角,多体验生活

kevinma_dev_zh 指出,程序员若想赚钱,不能仅沉迷技术,需多与非技术人员交流,了解业务与生活。这种跨界思维有助于打开视野,发现真正的市场需求,而非闭门造车。


⚡ 工作流

𝕏 美图 RoboNeo 推出四角色 AI 视频制作工作流

美图 RoboNeo 推出 Agent Team 视频制作工作流,将首席编剧、分镜导演、艺术总监和后期合成四个角色纳入协作链路,覆盖品牌叙事框架、画面规划、风格确认到成片剪辑。该流程面向 Vlog 与广告片制作,强调用分工式 AI 代理提升内容生产效率。

𝕏 Garry Tan 团队总结 AI 编码工作流:每次改动同步测试、文档和评测

Garry Tan 团队在 72 小时 内合并 14 个 PR、增加 29000 行 代码,其经验是要求编码 Agent 在每次改动时同步产出测试、文档和 eval。该做法把代码生成从单次提交扩展为可验证、可维护的工程流程,减少后续人工补齐质量保障环节的成本。

𝕏 Flowscope 用 AI 代理自动学习并重构企业流程

Flowscope 部署智能代理,自动学习并文档化企业运营流程,再对流程进行重新设计和自动化。相比传统企业系统常见的数月实施周期,Flowscope 宣称可在 几天内AI 自动化 部署到现有系统中,帮助企业更快落地业务流程改造。

𝕏 Matt Pocock:用 Agent 规划任务前先做原型验证提示词与真实数据

Matt Pocock 分享了用 Agent 为视频自动生成章节的流程:先构建 EffectTS TUI 原型,利用真实数据验证系统提示词与交互逻辑,再交给 Agent 完成后续实现。该方法强调在自动化复杂任务前先用轻量原型降低不确定性。


📚 论文研究

⭐ 金刚石铜复合材料首次规模化用于超算散热

金刚石铜复合材料在郑州国家超算互联网核心节点首次规模化应用,使芯片模组传热能力提升80%、性能提升 10%、温度下降 5℃。

𝕏 RLM 论文更新:深度递归调用带来显著性能提升

a1zhang 分享了 RLM 论文的更新版本,增加了深度=2/3 的递归调用实验。结果显示在 OOLONG-Pairs 和其他基准测试中取得显著性能提升,并新增了长度泛化实验与错误分析,展示了更优的训练结果。


🚀 产品发布

⭐ Anthropic 推出 12 款法律 AI 插件,Claude 接入 DocuSign 和汤森路透

Anthropic发布12 款法律 AI 插件,覆盖合同审查、司法备考,并让 Claude 连接DocuSign、汤森路透和 Harvey。

𝕏 SureThing 在 LongMemEval 声称取得 88.0%总分

SureThing发布 Agent 记忆层工具,称在LongMemEval取得 88.0%总分、91.0%知识更新和 76.7%单会话偏好。

🔵 苹果计划在 iOS 27 升级可自定义相机与 Siri 设计

苹果计划在iOS 27中加入可自定义相机 App,并调整Siri界面设计。


🌍 国际大事

💹 霍尔木兹海峡封锁风险升级,英法推进护航安排

霍尔木兹海峡封锁风险持续升温:伊朗提出新一轮谈判先决条件,包括结束战事、解除制裁、释放冻结资金、赔偿损失,并承认其对海峡的主导权;英国将派无人机、战机及军舰参与多国护航。另据评估,伊朗沿海峡 33 处导弹阵地中仍有30 处具备作战能力。市场避险情绪升温,WTI 原油收于102.18 美元

💹 英国工党内部分裂加剧,斯塔默面临下台压力

英国首相斯塔默遭多名官员辞职逼宫,工党内部分裂加剧:逾80 名工党议员要求其下台,另有超100 名议员签署声明支持其留任,显示党内围绕领导权的对立正在公开化。


📈 财经市场

𝕏 Isomorphic Labs 完成 21 亿美元融资,加速 AI 药物发现

Isomorphic Labs获得21 亿美元新融资,Demis Hassabis 称资金将用于延续 AlphaFold 路线,推动AI 药物发现研发和商业化进程。

凯文·沃什获确认出任美联储理事,主席确认程序将启动

美国参议院确认凯文·沃什出任美联储理事,任期14 年;现任主席鲍威尔任期将于 5 月 15 日结束,美联储主席确认程序预计随后启动。

美国 4 月 CPI 同比升至 3.8%,半导体板块大幅回调

美国 4 月 CPI同比上涨3.8%,高于 3 月3.3%,引发市场对通胀和利率路径的再定价;美股半导体板块同步承压,费城半导体指数跌超 3%、盘中一度跌近 7%,高通跌 11.46%,英特尔和闪迪跌超 6%,WTI 原油收于 102.18 美元。

🔵 CME 拟创建 AI 算力期货市场,推动算力资产定价

CME GroupSilicon Data合作,计划创建AI 算力期货市场,为人工智能基础设施背后的计算能力设定市场价格,推动算力从基础资源进一步金融化、标准化定价。

💹 银行理财 4 月规模超季节性回升,14 家公司单月增 2.33 万亿元

14 家理财公司4 月存续规模环比增2.33 万亿元,较上年同期多增约4000 亿元,显示银行理财规模在 4 月出现超季节性回升。

💹 MSCI 新兴市场指数新增长飞光纤光缆 A 股等标的

MSCI新兴市场指数新增长飞光纤光缆 A 股等标的,全球ACWI 指数新增49 只证券、剔除 101 只,相关指数调整或影响被动资金配置。

Anthropic 据称洽谈至少 3 亿美元收购开发工具公司 Stainless

Anthropic据称正在洽谈收购开发工具初创公司Stainless,交易金额至少3 亿美元;OpenAI 和谷歌均使用其产品,显示大模型公司对开发者生态和工具链资产的争夺升温。

Cerebras 美国 IPO 定价据称高于 150 至 160 美元指引区间

Cerebras美国 IPO 发行价据称高于150 至 160 美元指引区间,显示投资者对AI 芯片公司上市需求仍然强劲。

美联储 6 月维持利率不变概率升至 97.1%

CME 美联储观察显示,6 月维持利率不变概率为97.1%,7 月维持不变概率为 96%,市场继续押注美联储短期内按兵不动。


🏭 工业能源

💹 台积电核准向亚利桑那子公司增资最高 200 亿美元

台积电董事会决议派发 2026 年一季度每股7 元台币现金股利,并核准向TSMC Arizona增资不超过200 亿美元。该增资将继续支持其美国先进制程制造布局,强化亚利桑那厂区建设与长期产能规划。

𝕏 特斯拉将在柏林工厂投资近 2.5 亿美元扩建 4680 电池产能

特斯拉宣布将在Giga Berlin投资近 2.5 亿美元扩建 4680 电池产线,计划把电池年产能提升至18GWh,并新增雇佣 1500 多名员工。该扩建将强化其欧洲本地电池制造能力,支撑后续电动车产能与供应链布局。

🔵 三星劳资谈判破裂,存储芯片业务面临罢工风险

三星电子与工会未能达成工资协议,罢工风险可能影响这家全球最大存储芯片制造商的运营。若劳资僵局持续,相关生产安排和供应稳定性或受到市场关注,尤其是在存储芯片景气周期变化背景下。

💹 谷歌据称与 SpaceX 洽谈在轨数据中心发射计划

谷歌据称正与SpaceX及其他火箭公司讨论在轨数据中心发射合作,推进轨道计算基础设施计划。该设想将云计算能力与航天发射资源结合,可能为未来太空算力、低延迟数据处理和新型基础设施部署提供路径。

🔵 中国 AI 硬件供应商受组件短缺制约,难以满足旺盛需求

中国 AI 硬件供应商面临组件短缺压力,难以跟上人工智能产品需求增长。短缺问题可能影响服务器、计算设备及相关硬件交付节奏,并进一步凸显 AI 产业链在关键零部件供应上的瓶颈。

💹 通用与 LG 俄亥俄电池工厂复产时间仍不确定

Ultium Cells俄亥俄电池厂计划在 5 月 25 日当周安排少量员工返岗,但约850 名员工何时全面复工仍取决于电动车需求。该工厂由通用汽车与 LG 能源解决方案合作运营,复产节奏反映北美动力电池产能与终端需求之间的调整压力。

公募基金加码能源全产业链,一季度新能源配置升至 10.15%

公募基金一季度末对电力设备及新能源板块的配置比例上升 0.86 个百分点至10.15%,显示能源主线获得增配。资金关注范围覆盖新能源制造、电力设备及能源产业链相关环节,反映机构对能源转型方向的持续布局。


🧠 深度思考

𝕏 吴忌寒深度思考:AI 时代将从“一人公司”迈向“零人公司”

吴忌寒提出,AI 发展的终极形态可能是 None-Person Company (NPC),即完全自主运转的智能体系统。随着长周期任务能力突破,AI 有望在安全、金融、法律等领域重塑行业;未来操作系统也可能演变为 LLM OS,应用按需生成,并挑战传统 冯·诺依曼架构

💹 人民日报提醒:AI 智能助手推荐可能被虚假内容操纵

人民日报指出,不法商家可能利用 GEO 向模型投喂虚假软文,影响并扭曲 AI 推荐结果,从而制造消费陷阱。消费者在使用 AI 智能助手做购买决策时,应通过官方渠道和多来源信息交叉核验。

𝕏 Howard Schultz 批评西雅图商业环境,称星巴克岗位转向田纳西

Howard Schultz批评华盛顿州税负和监管环境削弱创业生态,并称 Starbucks 已将数百个企业岗位迁往 田纳西。这一表态反映出企业总部岗位迁移与地方营商环境之间的张力。

𝕏 二三线传统企业或成为 AI 方案商更高利润客户群

作者认为,传统中小企业 往往缺乏 IT 团队,AI 需求也不够清晰;相比北上广深的互联网客户,这类客户与服务商之间存在更明显的 信息不对称,可能为 AI 服务商 带来更高利润空间

𝕏 李开复辟谣“AI 失业潮”:Andrew Ng 称软件工程师需求仍强

围绕“AI 导致失业潮”的讨论,李开复转述并支持 Andrew Ng 的反驳观点:未来更可能出现 AI 就业狂欢,尤其是 软件工程师 需求仍将保持强劲,AI 工具会扩大开发能力而非简单消灭岗位。


📰 综合新闻

💹 北京要求政府机构每年至少开放 5 个新技术应用场景

北京发布场景培育方案,政府机构每年开放不少于5 项场景资源和需求,覆盖5 方面 18 个建设领域。

📺 我国成功发射千帆极轨 09 组卫星

中国成功发射千帆极轨 09 组卫星,相关话题登上 B 站热搜。


🛡️ 安全隐私

💹 国家安全部提示 App 精准推送背后的个人隐私风险

国家安全部提示多款App存在过度索权、强制获取位置、未公示规则等问题,可能威胁个人信息安全


由 X-Crawler AI 生成于 2026-05-13 08:02

EVENT-DRIVEN INTELLIGENCE

免费先看重点,Pro 再看速度、深度和可追踪性

这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件帮你建立复访,再决定是否升级到更深的追踪能力。