天眼日报
科技 · 每日情报2026年03月25日约 62 分钟阅读

AI 速读22 条精选
🤖头条OpenAI关停Sora视频服务
独立App、API及ChatGPT内视频功能将下线,显示OpenAI收缩视频生成战线,行业竞争格局再变。
🤖头条OpenAI设10亿美元AI基金会
首年投入至少10亿美元应对生物威胁、经济冲击等AI风险,标志头部公司加码AI治理。
₿头条Tether启动USDT全面审计
首次对约1840亿美元储备做完整独立审计,若落地将显著影响稳定币透明度与监管预期。
🏛头条稳定币付息限制冲击Circle
美国草案拟禁止平台直接为稳定币余额付息,Circle大跌,或重塑稳定币收益分配模式。
🤖头条Anthropic推Claude自动模式
AI可自主执行写文件、跑命令等低风险操作,提升代理编程能力,也把安全控制推到前台。
📦头条LiteLLM恶意包入侵PyPI
受污染版本含窃取凭证代码,波及大量AI开发者,凸显开源AI基础设施供应链安全风险。
🤖Anthropic开放Claude控电脑
📰Figma开放AI直连设计系统
🤖vLLM发布高吞吐V2内核
📦开源视频音频生成模型发布
🤖Allen AI开源浏览器代理模型
🔲阿里玄铁C950刷新RISC-V纪录
📰Cloudflare推Dynamic Workers
🏛CFTC成立创新特别工作组
📰Invesco接管链上美债基金
📈BMO推出代币化现金存款
📰Lido收入下滑并拟回购LDO
📰Palantir Maven成美军正式项目
🚀SpaceX申请更多Starlink频谱
🤖Hugging Face发布hf-mount
🤖DeepSeek扩招Agentic AI岗位
📰Solana稳定币与RWA齐创新高
🤖 AI 大模型
Anthropic 为 Claude Code 推出自动模式
Anthropic 为 Claude Code 推出自动模式,支持 AI 自主决策权限,如文件写入或 bash 命令,低风险操作自动执行,高风险如批量删除则阻挡。内置分类器和安全层审查提示注入攻击,提升代理编码安全性和独立性。Team 计划提供研究预览,企业版和 API 几天内上线,使用 claude --enable-auto-mode 启用,支持 Claude Sonnet 4.6 与 Opus 4.6。OpenAI 宣布关停 Sora 视频生成工具
OpenAI 宣布关停 Sora App 和 API,上线仅半年即结束,将公布下线时间表和作品保存方案。此前 Sora 2 曾冲 App Store 第一,但 IP 限制后活跃度下滑。该关闭系 OpenAI 打击 Side Quests 行动首例影响,标志视频生成工具社区重大变动,团队转向生产力工具和机器人技术。daVinci-MagiHuman 15B 开源视频音频生成模型发布
SII_GAIR 和 SandAI_HQ 发布 daVinci-MagiHuman,15B 单流 Transformer,支持视频+音频联合生成,单 H100 38 秒出 5 秒 1080p 视频,人评胜率 80%碾压 Ovi 1.1,Apache 2.0 全开源。Anthropic 为 Claude 推出计算机使用功能,支持 macOS 电脑控制
Anthropic 为 Claude Cowork 和 Claude Code 推出计算机使用功能,通过 macOS 屏幕录制和辅助权限实现截图、点击、滚动、输入等操作。用户手机发送任务如导出 PPT 为 PDF,Claude Desktop 执行,支持跨应用操控 Python 运行和可视化输出,仅研究预览,逐应用批准,避免敏感领域。vLLM 发布 Model Runner V2,提升高吞吐性能
vLLM V2 采用模块化设计、GPU 原生输入准备、异步优先、无 CPU-GPU 同步、新 Triton 采样器。在高吞吐和推测解码场景显著提升,使用 VLLM_USE_V2_MODEL_RUNNER=1 启用,重构执行核心。Figma 推出 use_figma MCP 工具,支持 Claude Code 等 AI 代理设计
Figma 发布 use_figma MCP 工具和技能,允许 AI 代理如 Claude Code 直接在画布上设计,支持设计系统上下文,实现设计自动化。公开测试版今日启动。Claude Code 集成 Figma,支持设计系统生成组件
Claude Code 新增 Figma 集成,读取完整设计系统,生成匹配 tokens、styles 和 patterns 的组件,实现设计-代码无缝工作流。Nemotron 模型社区反馈积极,Nemotron 4 开发中
Nemotron-Cascade-2、Nemotron-3-Super 和 Nemotron-3-Nano 在 Hugging Face 趋势榜,团队整合反馈开发 Nemotron 4,Nemotron 3 Ultra 按计划发布。OpenAI 成立基金会,承诺首年投入至少 10 亿美元应对 AI 威胁
OpenAI 成立基金会,Sam Altman 宣布首年投入至少 10 亿美元,聚焦 AI 弹性,包括生物威胁、经济变革和模型 emergent 效应。Wojciech Zaremba 任 AI 弹性负责人,Jacob Tref 任生命科学主管。Anthropic 发布多代理系统,提升 Claude 前端设计和自主软件工程
Anthropic 工程博客介绍多代理框架,用于提升 Claude 的前端设计和长时程自主软件工程,支持复杂任务执行。Allen AI 发布 MolmoWeb 浏览器代理模型
Allen AI 开源 MolmoWeb(4B/8B 参数),支持浏览器导航与任务执行,在 4 大 Web 代理基准测试中创开源 SOTA,甚至超部分闭源模型。Apache 2.0 许可。Hermes Agent v0.4.0 发布,支持 OpenAI Responses API
Hermes Agent v0.4.0 更新包括背景自改进循环、OpenAI 兼容 API 服务器(/v1/chat/completions 及/v1/responses)、CLI 升级(@上下文引用、流式默认)、MCP 服务器管理。本周合并 300 个 PR。阿里玄铁 C950 处理器刷新 RISC-V 性能纪录
阿里新一代旗舰处理器玄铁 C950 采用 5nm 制程,频率达 3.2GHz,单核性能突破 70 分,支持 Qwen3 和 DeepSeek V3 等千亿参数大模型,适用于 AI Agent 时代。HuggingFace 推出 hf-mount 工具,将远程存储挂载本地
HuggingFace 发布 hf-mount,支持将存储桶、模型或数据集挂载为本地文件系统,支持读写 NFS/FUSE 后端。示例:挂载 5TB FineWeb-edu 数据集仅需几秒,适用于 Agentic 存储。Andrés Karpathy 使用 OpenClaw AI 代理实现智能家居自动化
Andrés Karpathy 在 NoPriorsPod 分享,使用 OpenClaw AI 代理自主发现智能家居设备(如 Sonos 音箱、灯光),学习接口并构建统一仪表盘。只需自然语言指令,代理自动执行技术步骤。DeepSeek 招聘 17 个 Agentic AI 岗位,R-1 推理模型即将更新
DeepSeek 发布 17 个 Agentic AI 职位,包括研究、数据评估和基础设施岗位。中国需求推动自主 AI 发展,R-1 推理模型新版即将发布。Claude + TinyFish MCP 实现浏览器自动化 Agent
TinyFish MCP 让 Claude 从静态页面读取升级为主动浏览器操作,支持导航、表单、多步流程。YC Jobs demo:搜索远程 AI/ML 岗位,年薪 10 万美元以上,输出结构化结果。OpenAI 完成新 AI 模型初步开发,Altman 转向数据中心建设
OpenAI 完成💰 加密货币currency
Jump Trading 回应 Terraform Labs 40 亿美元诉讼:称对方在为 UST 崩盘转移责任
Jump Trading 就 Terraform Labs 清算方提起的 40 亿美元诉讼作出回应,称相关指控是在为 UST 崩盘寻找替罪羊并转移责任。诉讼核心围绕 2021 年 UST 脱锚期间,Jump 是否通过市场操作帮助稳定价格。背景是 Terraform Labs 此前已被美国 SEC 处以 44 亿美元罚款,此次追责被视为 UST/LUNA 事件后续清算与责任划分的一部分。该案可能进一步影响市场对做市商角色、稳定币机制设计以及危机期间交易行为合法性的讨论。加拿大 BMO 银行推出 24/7 代币化现金与存款计划
加拿大蒙特利尔银行(BMO)宣布推出全天候运行的代币化现金存款项目,依托 CME Group 与 Google Cloud 相关网络基础设施,实现 24/7 可用的现金与存款代币化服务。该举措显示传统大型银行正加快将区块链和代币化技术引入支付与资金管理场景,以提升结算效率、可编程性和跨时区可用性。对于机构客户而言,此类产品有望成为未来链上结算、抵押品管理和实时资金调度的重要基础设施。CFTC 成立创新特别工作组,为加密、AI 和预测市场制定监管框架
美国商品期货交易委员会(CFTC)成立“创新特别工作组”(Innovation Task Force),拟针对加密资产、人工智能及预测市场等新兴领域构建新的监管框架。相关进展表明,美国监管机构正尝试在鼓励金融创新与控制市场风险之间寻找平衡。与此同时,TD Cowen 认为,围绕预测市场的三项美国立法今年通过概率不高,但到 2028 年大选周期,预测市场监管仍可能成为重要政策议题。整体来看,该工作组的设立或将影响未来美国在加密衍生品与新型数字市场方面的规则走向。Robinhood 董事会批准 15 亿美元股票回购计划
Robinhood 董事会已授权最高 15 亿美元的股票回购计划,显示公司希望通过资本回报方式增强股东价值并稳定市场信心。回购通常被市场解读为管理层对公司长期基本面和现金状况较有信心,也可能对股价形成一定支撑。尽管该消息本身不直接涉及新加密产品,但作为深度参与数字资产交易服务的平台,Robinhood 的资本配置决策仍受到加密市场关注,尤其是在其不断扩展加密交易、钱包和链上服务背景下。Lido 披露 2025 年收入 4050 万美元,同比下降 23%,并计划于 2026 年 Q2 启动 LDO 回购
Lido 公布 2025 年总收入为 4050 万美元,较 2024 年的 5240 万美元下降 23%。收入下滑主要受用户净赎回和质押年化收益率(APR)压缩影响,反映出以太坊质押赛道竞争加剧及市场环境变化。公司同时披露已裁员 15%,并计划在 2026 年第二季度启动 LDO 代币回购,以优化资本配置并提振市场信心。该更新显示,尽管 Lido 仍是流动性质押领域的重要参与者,但其商业模式正面临收益率收缩与用户资金流出的双重挑战。Tether 聘请四大会计师事务所对 1840 亿美元 USDT 储备进行首次全面审计
Tether 已聘请四大会计师事务所之一,对 USDT 约 1840 亿美元储备开展首次全面、独立审计,旨在提升透明度并回应市场长期以来对储备真实性与结构的关注。相较以往披露或鉴证方式,此次完整审计若顺利推进,可能成为稳定币行业透明度建设的重要里程碑。考虑到 USDT 在全球加密交易、跨境结算和链上流动性中的核心地位,审计结果不仅关系 Tether 本身信誉,也将影响监管机构、机构投资者和用户对稳定币风险管理标准的预期。TRON DAO 将 AI 基金从 1 亿美元扩大至 10 亿美元,聚焦支付、身份与 RWA 基础设施
TRON DAO 宣布将其 AI 基金规模由 1 亿美元大幅上调至 10 亿美元,投资方向涵盖链上支付、代理身份、代币化现实世界资产(RWA)以及自治金融工具等领域。该计划建立在其此前关于 AI 与区块链融合的战略判断之上,意在推动“代理经济”相关基础设施建设。此次扩容表明,TRON 希望通过更大规模资本投入抢占 AI 与链上应用结合的早期机会,尤其是在身份、支付和可编程资产等具备商业化潜力的赛道形成生态影响力。以太坊区块构建器 Eureka Labs 完成 670 万美元种子轮融资
专注于以太坊区块构建的 Eureka Labs 宣布完成总计 670 万美元种子轮融资,其中 2025 年 4 月完成 470 万美元,6 月追加 200 万美元。该轮融资由 Spark Capital 和 Collider Ventures 领投。公司目前在相关市场中的份额约为 1.5%,处于较早期阶段。作为区块构建与 MEV 基础设施赛道的新玩家,Eureka Labs 获得资本支持,说明市场仍在关注以太坊交易排序、构建器效率和基础设施去中心化等关键问题,未来其技术路线与市场拓展值得持续观察。CLARITY Act 草案拟禁止稳定币余额直接生息,Circle 股价单日跌超 18%
美国 CLARITY Act 草案提出,交易所等平台不得直接就用户持有的稳定币余额支付收益,允许的激励形式更偏向忠诚度计划等行为奖励,而非类似存款利息的安排。受此影响,Circle 股价单日跌超 18%,市场担忧该政策将冲击 USDC 相关收益分配机制及约 3.5%的补贴模式。该草案凸显监管层对“付息稳定币”边界的重视,若未来落地,可能重塑稳定币发行方、交易平台和用户之间的利益分配结构,并影响稳定币在支付与储值场景中的竞争格局。Solana 稳定币市值创 17 亿美元新高,RWA 规模达 1.82 亿美元纪录
数据显示,Solana 生态稳定币总市值于 3 月 19 日升至 17 亿美元,创下历史新高;与此同时,链上现实世界资产(RWA)规模也达到 1.82 亿美元的新纪录。两项数据同步走强,说明 Solana 不仅在交易活跃度和资金流入方面保持增长,也正吸引更多资产上链与机构化应用尝试。稳定币扩张通常被视为链上支付、交易和 DeFi 活动升温的重要先行指标,而 RWA 增长则意味着生态正从纯投机场景向更广泛金融基础设施延伸。Venus 闪电贷攻击者转移 1743 枚 ETH,价值约 378 万美元
Venus 平台相关闪电贷攻击事件出现新进展,攻击者已转移 1743 枚 ETH,按当时价格计算约值 378 万美元。资金异动再次引发市场对 DeFi 协议安全性、清算机制以及攻击后资产追踪能力的关注。闪电贷攻击通常利用价格预言机、流动性薄弱或合约逻辑漏洞,在短时间内完成复杂套利或操纵操作。此次资金转移意味着追踪、冻结和追回难度进一步增加,也提醒 DeFi 项目方需持续加强风控、监测和应急响应体系。Ledger 完成约 5000 万美元二级股权出售,暂无 IPO 计划
法国硬件钱包公司 Ledger 完成约 5000 万美元的二级股权出售交易,由 CEO Pascal Gauthier 主导,交易于去年第四季度完成。一名早期投资者在本次交易中出售了所持股份,公司未披露最新估值,并表示目前没有推进 IPO 的计划。作为加密资产自托管领域的重要企业,Ledger 的二级交易进展反映出私募市场对头部基础设施公司的持续兴趣,也说明在市场环境尚不完全稳定的情况下,公司更倾向通过私下股权流动满足早期股东退出需求,而非急于公开上市。ZachXBT 披露俄罗斯 OTC 经纪人涉嫌协助洗钱超 470 万美元,涉及 796 枚 BTC 赎金流转
链上调查员 ZachXBT 披露,俄罗斯 OTC 经纪人 Aleksandr Khinkis 自 2025 年 7 月起,疑似通过单一交易所账户协助勒索软件相关资金洗钱,涉案金额超过 470 万美元,并关联 796 枚 BTC 赎金。调查显示,相关资金随后跨链流向 Avalanche 生态,并被存入 Aave 等协议。该案例再次凸显场外经纪商、跨链桥与 DeFi 协议在非法资金流转中的潜在利用风险,也说明链上取证正在成为追踪加密犯罪的重要手段。Invesco 接管 Superstate 旗下 9 亿美元代币化美国国债基金 USTB
资管巨头 Invesco 将接管 Superstate 旗下规模约 9 亿美元的代币化美国国债基金 USTB。根据披露,该基金预计于 2026 年第二季度更名,但将保留现有链上结构。Invesco 管理资产规模约 2.2 万亿美元,此次接手表明传统大型资管机构正更加积极地进入代币化国债与链上基金领域。对市场而言,这不仅提升了代币化基金的品牌背书,也可能推动现实世界资产(RWA)产品在合规化、机构化和分销渠道上的进一步扩张。🛠️ Tool Recommendations
Chatterbox:OpenAI 兼容的 TTS 服务器,内置 Web UI
Chatterbox 是一款提供 OpenAI 兼容接口的文本转语音(TTS)服务器,同时集成 Web UI,方便开发者既可通过 API 接入,也可直接在网页端进行测试与管理。其定位适合需要自建语音能力、兼容现有 OpenAI 风格调用方式的场景,可用于应用原型、语音助手或内容生成工作流。Omma:用 AI 聊天生成 3D 网页、视觉效果与小游戏
Spline 发布的 Omma 允许用户通过自然语言聊天方式创建 3D 网页、交互效果甚至小游戏。系统可借助 AI 自动生成代码与 3D 模型,降低了非专业开发者和设计师制作交互式 3D 内容的门槛。该工具更偏向“对话式创作平台”,适合快速原型、营销页面和创意实验。Paper Snapshot:将实时网站捕获为可编辑的 HTML/CSS 图层
Paper 推出的 Snapshot 功能可直接从实时网站抓取页面结构,并将其转换为可编辑图层,而不是传统的静态截图。这意味着设计师或前端团队可以基于真实网页内容继续编辑、拆分和复用视觉元素,减少从线上页面回收到设计稿时的信息损失,适合设计审查、改版和页面资产提取。179 个 AI 模型安全探测工具发布,用于系统化红队测试
该项目发布了 179 个 probes,用于对 AI 模型进行安全测试与行为探测,帮助开发者和研究人员系统化评估模型在越狱、敏感输出、对抗提示等方面的风险。这类工具适合安全审计、模型上线前评估以及持续红队演练,可作为构建 AI 安全测试流水线的重要基础组件。Obsidian 插件集成 Claude Code,在笔记中支持代码执行与可视化输出
这款 Obsidian 插件将 Claude Code 嵌入到笔记工作流中,使用户可以在知识管理环境里直接进行 AI 辅助编程、代码执行以及结果可视化。它适合把笔记、实验记录与代码探索整合到同一空间,尤其适用于研究型开发、技术写作和边记边编程的场景。Hugging Face 推出 hf-mount:将 Hub 资源挂载为本地文件系统
Hugging Face 发布 hf-mount,可将远程存储桶、模型和数据集直接挂载为本地文件系统使用。它支持对存储桶进行读写,对模型和数据集进行只读访问,适合超大规模数据集查询、模型推理、团队共享和代理型应用的存储抽象。相关介绍指出,该工具可应对 TB 级数据访问需求,让开发者以接近本地文件操作的方式处理远程 Hub 资源,显著降低数据搬运与存储管理成本。AgentScope:阿里巴巴开源可视化 AI 代理框架,支持 MCP、RAG 与多代理协作
Alibaba DAMO Academy 发布开源 AI 代理框架 AgentScope,提供可视化代理设计能力,并集成 MCP 工具、记忆、RAG 与推理模块,支持构建多代理协作系统。该项目采用 Apache 2.0 许可,适合企业和开发者快速搭建具备工具调用、知识检索和协同执行能力的智能体应用。Vite 插件注册中心上线,支持按版本兼容性筛选
Vite 正式推出插件注册中心,覆盖 @vite_js、@rolldown_rs 和 @RollupJS 生态插件,并支持按照版本兼容性进行过滤,帮助开发者更快找到适配当前项目的扩展。对插件维护者而言,添加与维护收录信息也更加轻松,有望提升 Vite 周边工具发现效率与生态整合度。Accomplish_ai:开源本地 AI 代理工具,无需 API 密钥
Accomplish_ai 是一款强调本地运行的开源 AI 代理工具,内置免费模型,可执行读取文件、创建文档、生成演示等知识工作自动化任务。其特点是不依赖外部 API 密钥,适合注重隐私、离线能力和成本控制的用户,也适用于希望在本地环境中部署个人生产力代理的场景。git-agent:开源 CLI 工具,可分析改动并自动生成 Conventional Commits
git-agent 是用 Go 编写、采用 MIT 许可的开源命令行工具,可分析代码改动、拆分原子提交,并自动生成符合 Conventional Commits 规范的提交信息。它支持任意 OpenAI 兼容 API,且可在无需密钥的情况下使用相关能力,适合希望提升提交质量、规范化团队协作流程的开发者。Figma 推出 MCP 工具与技能,支持 AI 代理访问设计系统并直接创建设计组件
Figma 发布 use_figma MCP 工具与相关技能,使 AI 代理能够访问设计系统上下文,包括组件、变量与设计令牌,并可直接在画布中执行设计操作。该能力还支持与 Cursor 等开发工具联动,帮助从设计到前端实现形成更顺畅的工作流。相比单纯的插件集成,这一发布更强调 AI 代理对设计系统的结构化访问与操作能力。Warp 推出 Figma 技能,支持 AI 访问设计令牌、创建组件并与代码同步
Warp 发布 Figma 技能,可通过命令安装后为 AI 提供与 Figma 交互的能力,包括读取设计令牌、创建组件以及帮助维持设计与代码的一致性。它更像是面向 Warp 使用场景的技能扩展,适合希望在终端或 AI 工作流中连接设计资产与开发实现的团队。LiteLLM 1.82.7/1.82.8 PyPI 包遭入侵,内含窃取凭证的恶意代码
LiteLLM 作者的 PyPI 密钥被 trivy 窃取后,受影响的 1.82.7 和 1.82.8 版本被植入恶意文件 litellm_init.pth。相关代码通过编码指令尝试窃取 SSH 等凭证,并具备自复制特征。PyPI 已对恶意包进行隔离,Docker Proxy 不受影响。该事件提醒开发者加强包版本审查、供应链安全监控与凭证轮换处理。CSPR.trade MCP:让 Claude 在本地签名下进行 Casper DEX 交易
CSPR.trade MCP 服务器为 Claude 提供了去中心化交易能力:服务器负责构建未签名交易,用户在本地完成签名后再提交到 Casper DEX,从而避免托管私钥风险。该方案提供 14 个工具,如 get_quote 与 build_swap,可支持从报价查询到交易构建的完整流程,适合探索 AI 代理参与链上操作但仍保留用户密钥控制权的场景。TokenBar:实时追踪 LLM Token 消耗与 API 成本的 macOS 菜单栏工具
TokenBar 是一款 macOS 菜单栏工具,用于实时显示 LLM API 的 token 使用量及对应成本,帮助开发者在提示词测试和功能开发过程中精确掌握费用变化。它适用于成本优化、预算沟通和调用行为审查,尤其适合频繁迭代提示词或多模型对比测试的个人开发者与小团队。Cloudflare 推出 Dynamic Workers:在隔离环境中高速执行 AI 生成代码
Cloudflare 发布 Dynamic Workers,主打在安全、轻量的隔离环境中执行 AI 生成代码,官方称其速度可比传统容器方案快 100 倍。这项能力面向需要动态生成并运行代码的 AI 应用场景,如智能代理、沙箱执行和自动化工作流,有助于在性能与安全之间取得更好的平衡。Alexandria Audiobook Generator:开源 AI 有声书生成器,支持多角色配音与本地部署
Alexandria 是一款开源 AI 有声书生成器,利用大模型解析书籍文本并自动生成适合朗读的脚本,可进行多角色配音,且支持本地部署与导出 M4B 格式。该项目适合独立创作者、出版实验项目和无障碍内容生产,能显著降低从电子文本到有声内容的制作门槛。龙虾导航:聚合 OpenClaw 高质量资源的一站式导航站
龙虾导航围绕 OpenClaw 生态聚合部署方案、教程、Skills 市场与 Agent 相关资源,帮助用户快速了解工具链和社区内容。它更偏向资源整合与信息分发平台,适合希望系统梳理 OpenClaw 学习路径、减少搜索成本的新用户与实践者。XCrawl 为 OpenClaw 提供网页搜索、抓取、解析与浏览器自动化技能
XCrawl 集成了 4 个 OpenClaw 技能,包括搜索、抓取、解析和浏览器操作,并支持通过 ClawHub 一键安装。其能力适用于 SEO 调研、竞品分析、网页数据提取和落地页生成等自动化场景,是 OpenClaw 生态中偏执行层的网页操作组件。TypeNo:macOS 极简语音输入法开源,支持本地模型
TypeNo 是一款免费开源的 macOS 极简语音输入工具,支持基于本地模型进行语音转录,用户按下 Control 键即可完成语音输入并粘贴到当前文本位置。它无需账号和订阅,基于 coli ASR 项目构建,适合追求轻量、低干扰和隐私友好输入体验的用户。📖 教程攻略
⭐ 从零构建 Tokenizer:FSM 解析器理论与代码实现
使用Claude Opus对话构建FSM tokenizer,支持ab*c正则和text
HTML 标签识别。7 个原语操作(READ、CMP等)模拟汇编,完整伪代码和状态机图。扩展 10 操作处理范围比较。8 种 Python 模式删除 40%代码:dataclasses、早返回等
dataclasses替换手动__init__;早返回扁平化嵌套if;defaultdict消除键检查;any/all简化循环。示例从循环压缩到一行,支持ServBay环境管理。⚡ 工作流
Claude Code 高级工作流:CLI + plan.md + 语音输入
分享 Claude Code 工作流:80% 时间规划(/ce:plan 生成 plan.md),20% 执行;语音输入、多会话并行、/last30days 实时研究、配置绕过权限。Claude Code 加速 PHP 测试套件 20 分钟降至 3 分钟
Claude Code配置并行测试、调整MySQL连接限、改写 mocks,从20+分钟降至3 分钟,支持 agentic 工程全套件运行。🧠 深度思考
Sequoia:硬件革命先行于软件革命
Sequoia Shaun Maguire 称未来 25 年 财富在硬件:每个软件革命前有硬件革命,如 iPhone 前置 App Store;AI 受硬件限,未来分支人形机器人、光子硅、轨道数据中心。博鳌论坛:中国创新转向水平型分工,GDP目标4.5%-5%
林毅夫称中国2035 年潜力8%增长;江小娟指传统产业升级,新三样出口突起,与发达国家从互补转竞争。📰 Industry News
SpaceX 寻求更多频谱提升 Starlink 上行速度
SpaceX FCC 文件显示计划利用更多无线电频谱提升 Starlink 上行速度。Palantir Maven 成为 DoD 正式项目
Palantir Maven 成 DoD 正式项目,由陆军负责未来合同,推动国防和工业 AI 代理采用。PLTR Maven 成为 DoD Program of Record,陆军负责未来合同,推动 AI 代理在国防和工业工作流部署。【重磅】OpenAI 关停 Sora,独立 App 和 API 下线存活仅半年
OpenAI Sora 团队官方宣布关闭独立 App、开发者版和 ChatGPT 内视频功能,将公布下线时间表和作品保存方案。上线 2024 年 9 月后活跃度下滑,Disney 取消 10 亿美元投资合作。OpenAI 将停止 Sora AI 视频服务,非营利部门 2026 年开支 10 亿美元,聚焦商业与编程功能。Y Combinator W26 Demo Day:3 倍公司达 100 万美元年化收入,平均周增长 14%
Y Combinator W26 批次近 200 家初创,周收入增长 14% 为历史最快,3 倍于 W25 公司达 100 万美元 年化收入。焦点包括 crypto/fintech、硬件/机器人公司。Spade Data 获 4000 万美元 B 轮融资,每日处理 19 亿笔交易
Y Combinator 公司 Spade Data 获 4000 万美元 B 轮,处理每日 19 亿笔交易,覆盖率 99.9%、准确率 99%+、延迟 <40ms,年收入增长 470%。工程职位空缺达 3 年最高,全球超 6.7 万个
科技公司全球工程职位 67,000 个,美国 26,000 个,为 3 年峰值。今年以来增长加速,AI 或推动更多岗位。Arm 推出首款自研数据中心 AGI CPU,与 Meta 合作
Arm 推出首款自研芯片,标志公司从 IP 授权转向自产硬件。首推自研 AGI CPU,针对 agentic AI 基础设施,Meta 为首发伙伴,从计算平台设计扩展至硅产品。Arm 推出 ArmAGICPU 系列,首次自研量产芯片进入数据中心,瞄准代理型 AI 工作负载。合作伙伴包括 Meta、OpenAI、Cerebras 和 Cloudflare。该芯片标志 Arm 从 IP 授权转向自产,与 Meta 开发,后者为首批客户。【重磅】LiteLLM PyPI 供应链攻击,窃取凭证
LiteLLM 1.82.8 版本被入侵,包含 litellm_init.pth 窃取 SSH 密钥、AWS/GCP/Azure 凭证、API 密钥 等,月下载 9700 万次,影响依赖项目如 dspy。深圳发布 AI 服务器产业链计划,到 2028 年产能出货量跨越式增长
深圳市工信局《AI 服务器产业链行动计划(2026-2028)》目标:核心芯片、存储、PCB 等全球份额提升,支持国产 GPU/NPU 迭代和 1.6T 光模块量产。SpaceX 计划本周提交 IPO 申请,拟筹资超 750 亿美元
SpaceX 最早本周向 SEC 秘密提交 IPO 招股书,目标 6 月挂牌,预计募资超 750 亿美元(高于此前 500 亿美元),最新估值 1.25 万亿美元。SK 海力士秘密提交 SEC 文件,计划年内美国 ADR 上市
SK 海力士 3 月 25 日向 SEC 提交文件,拟发行 ADR 上市,筹资约 100-150 亿美元扩先进存储芯片产能。股价涨 3.7% 至 102.2 万韩元。存储芯片厂商 SK 海力士向 SEC 提交 F-1 表格申请美国上市,尚未决定细节。OpenAI 基金会拟投 10 亿美元,任命德勤前高管 CFO
OpenAI 基金会未来一年至少投资 10 亿美元于生命科学、就业影响、AI 韧性等领域。Robert Kaiden(德勤前高管)任 CFO。小米集团 2025 年营收 4573 亿元创历史新高
小米集团 2025 年营收 4573 亿元,经调整净利 392 亿元增 44%,汽车业务交付 41.1 万辆首度全年盈利,未来三年 AI 投入 600 亿元。中国电信 2025 年营收 5295.6 亿元
中国电信 2025 年营收 5295.6 亿元,净利润 331.8 亿元,智算规模达 91 EFLOPS,聚焦 AI 服务商。沪电股份 2025 年营收增 42% 至 189.45 亿元
沪电股份 2025 年营收 189.45 亿元增 42%,净利 38.22 亿元增 47.74%,AI 交换机业务翻倍。微软租下甲骨文与 OpenAI 放弃的数据中心
微软接盘德克萨斯 700 兆瓦数据中心,投资约 500 亿美元,与英伟达合作核能 AI。微软同意租用得州阿比林 700 兆瓦数据中心,原为甲骨文和 OpenAI 开发。毗邻 Stargate 园区,谈判后微软与 Crusoe 达成协议。存储芯片价格暴涨席卷消费电子产业链
小米总裁卢伟冰表示内存涨价超预期,影响手机/PC/云📚 前沿研究 & Papers
Cursor 发布 Composer 2 训练技术报告:通过强化学习与自定义环境提升代码生成 pass@k 和 pass@1
Cursor 发布 Composer 2 的训练技术报告,系统介绍其如何将强化学习用于代码生成模型优化。报告重点说明了 pass@k 与 pass@1 等核心评测指标的提升方式,包括构建自定义训练环境、设计更贴近真实编程任务的评估体系,以及在训练和验证流程中引入更细粒度的反馈机制。这份报告的价值在于,它不仅展示了结果,还披露了训练方法论与评估思路,对于研究代码智能体、编程助手和 RL 在软件工程场景中的应用具有较强参考意义。AutoGaze:让 VLM 仅关注视频关键区域,实现 4-100 倍 token 节省并支持 4K 长视频理解
AutoGaze 提出一种面向视频理解的高效视觉处理方法,使 ViT 与 VLM 不再均匀处理整段视频画面,而是像“注视”一样聚焦关键区域。该方法可实现 4 至 100 倍的 token 节省,并带来最高约 19 倍的推理加速,同时支持 4K 分辨率、最长约 1000 帧的视频输入。相关 arXiv 论文与 Hugging Face 模型均已发布。该工作对于降低多模态模型处理长视频时的计算与上下文成本尤其重要,也为高分辨率视频问答、视频检索和复杂场景理解提供了更可扩展的路径。Google Research 发布 TurboQuant:将 LLM KV 缓存压缩至少 6 倍并实现最高 8 倍加速
Google Research 推出 TurboQuant,一种面向大语言模型推理阶段键值缓存(KV cache)的压缩算法。该方法声称可在几乎不损失精度的前提下,将 KV 缓存内存占用压缩至少 6 倍,并带来最高约 8 倍的运行加速。由于长上下文推理的瓶颈往往来自 KV 缓存的显存和带宽开销,TurboQuant 的意义不只在于降低成本,也有助于提升部署密度和延长可处理上下文长度。对于关注推理优化、低成本部署和长上下文服务的研究者与工程团队,这是一项非常有代表性的效率研究进展。Gemini Deep Think 科学发现案例研究:以“研究者引导 + 模型检验”模式协助解决开放问题
一项关于 Gemini Deep Think 的案例研究展示了其在科学研究中的协作潜力。论文介绍了模型如何与研究人员共同探索开放性问题,覆盖理论计算机科学、经济学、优化和物理等方向。其核心方法不是让模型完全替代研究者,而是采用“人类提出方向、模型生成候选思路、再由人类与模型共同检查”的工作流,从而提升假设生成与验证效率。这类研究的价值在于,它为通用模型参与严肃科研提供了更现实的路径:强调可审查、可交互和人类主导,而非简单追求自动化结论输出。Anthropic 经济指数:Claude 使用模式持续分散,个人查询占比上升,美国采用率趋于一致
Anthropic 发布最新经济指数,分析 Claude 在真实世界中的使用结构变化。数据显示,自 2025 年 11 月以来,前 10 大任务的使用占比已下降至 19%,说明用户需求正从少数高频场景向更多元的长尾任务扩散。同时,个人查询的比重持续上升,表明 AI 正从企业或专业用途进一步渗透到个人层面的日常工作与信息需求。此外,美国不同地区或群体之间的采用率差异也在缩小,呈现更趋同的扩散趋势。这份指数对理解生成式 AI 的产业化路径、用户行为演变和实际渗透深度具有参考价值。Latent Space 播客讨论 AI 材料科学:为何尚未出现“材料领域的 AlphaFold”
在一期 Latent Space 播客中,Kulik Group 的 Heather Kulik 讨论了 AI 在材料科学中的应用前景,以及为什么该领域至今仍未出现类似 AlphaFold 那样的标志性突破。讨论涉及材料发现中的数据稀缺、实验验证难度高、问题空间复杂以及物理约束强等现实挑战。节目还提到使用 Opus 4.6、GPT 5.4 等模型进行预测和推理测试的体验,并强调计算工具、仿真体系与数据建模协同推进的重要性。该内容更偏研究观点与方法论反思,对于理解 AI 在科学发现中的边界与机会很有价值。中国开源 AI 模型扩散加速:阿里、Moonshot、MiniMax 被指对美国领先地位构成压力
路透社报道称,中国开源 AI 模型的快速传播正在对美国在人工智能领域的领先优势形成现实压力。报道提到,阿里、Moonshot、MiniMax 等公司推出的低成本开源模型在更广泛的开发者和产业场景中被采用,并可能借此形成更强的数据飞轮与应用反馈循环。文章还将这种扩散能力与未来“实体 AI”发展联系起来,认为模型成本、开源策略和产业适配能力正在重新塑造全球竞争格局。这条信息属于产业研究与趋势观察,重点不在单一论文,而在开源生态对技术领先地位的长期影响。存算分离架构演进与 AI 驱动的存储涨价:从对象存储到 RDMA 网络成为关键基础设施
这篇文章系统梳理了存算分离架构的演进路径,从早期存算一体到如今以对象存储配合独立计算集群为主的基础设施模式,并分析了其背后的成本、扩展性与资源调度逻辑。文章同时解释了近期 DRAM 与 NAND 价格上涨 40% 至 90% 的原因,指出 AI 服务器对 HBM 产能的挤占,以及单台 AI 服务器 2 至 4TB 内存需求对整体供应链带来的冲击。在此背景下,高性能网络、RDMA 与无损网络能力成为支撑大规模训练与推理系统的关键。该文更像一篇基础设施研究解读,适合从系统层面理解 AI 时代的数据与算力架构变化。Paged Attention:通过分页式 KV 缓存管理将 LLM 缓存利用率提升至 98.5%
Paged Attention 通过将大语言模型的 KV 缓存切分为固定大小的页,并按需分配显存,显著提升了缓存利用率与系统弹性。文中介绍,每页可容纳 16 个 token,并支持 Copy-on-Write 机制,从而允许多个请求高效共享系统提示等公共前缀。在模拟最大序列长度 2048、平均响应长度 500 的场景中,该方法将 KV 缓存利用率提升至 98.5%,相比朴素方案的 24% 有巨大改善。Paged Attention 对高并发推理系统尤其关键,因为它直接影响吞吐量、显存碎片率和服务成本,也是后续许多高性能推理框架的重要基础思想。Meta V-JEPA 从视频中自学物理概念:在 IntPhys 上最高达 98% 准确率
Meta 发布的 V-JEPA 模型展示了从视频中自监督学习物理世界规律的能力。根据介绍,该模型无需显式注入物理先验知识,便能通过观察视频学习诸如物体恒存、重力、运动连续性等概念,并在 IntPhys 测试集上达到最高 98% 的准确率。即便是仅 1.15 亿参数的版本,也能取得约 85% 的表现。该研究的重要性在于,它表明世界模型可以通过视频预测与表征学习逐步形成对现实规律的抽象理解,为机器人、具身智能和可泛化的视频理解系统提供了更扎实的表征基础。音视频生成两项开源进展:GAIR 发布 daVinci-MagiHuman,阿里开源 PrismAudio 视频到音效模型
两项开源工作展示了生成式多媒体领域在“视频生成”与“视频配音/音效生成”两个方向的推进。其一,GAIR 实验室发布 daVinci-MagiHuman,这是一款 150 亿参数的音视频生成模型,可生成带音频的视频内容,并支持中文、英文和日语,已提供在线体验。其二,阿里开源 PrismAudio,一款 5.18 亿参数的视频到音效生成模型,可根据输入视频自动生成匹配音效,并在 VGGSound 基准上取得 SOTA,单次推理约 0.63 秒。二者虽方向不同,但都体现了视频与声音联合建模正在快速成熟。摩根大通解析台积电十大关键问题:预计 2026 年营收增长约 30%,资本开支达 520-560 亿美元
摩根大通在一份研究报告中围绕台积电给出“十大问题”解析,重点讨论其先进制程扩产、AI 需求拉动与资本开支规划。报告预计台积电 2026 年营收将增长约 30%,资本开支达到 520 亿至 560 亿美元,并将 AI 相关营收复合增速上调至 50% 的中高区间。产能方面,N3 月产能预计约 16.5 万至 17 万片,N2 到年底有望达到约 10 万片/月;先进封装方面,报告提到 CoWoS 部分产能将外包给 ASE。该报告对于理解 AI 热潮下晶圆代工与先进封装的供给格局具有较强参考意义。🚀 Product Launches
苹果计划在 WWDC 2026 推出独立版 Siri 应用,作为 iOS 27 AI 重构核心
苹果正在重构 Siri,并计划于 2026 年 6 月 8 日的 WWDC 上正式展示新版本,作为 iOS 27 的重要 AI 更新之一。新版 Siri 据称将以独立应用形态出现,提供更接近聊天机器人的交互界面,并加入“Ask Siri”按钮,强化跨应用执行任务、调用个人数据以及网页内容总结等能力。其底层预计结合 Apple Foundation Models,并可能引入 Google Gemini 等外部模型支持。这一调整被视为 Apple Intelligence 体系升级的重要一步。Perplexity 搜索嵌入模型下载量一个月突破 100 万次
Perplexity 表示,其搜索嵌入模型在发布后 1 个月内下载量已超过 100 万次。该模型支持 int8 精度,可在每 GB 存储空间中容纳更多网页内容,从而提升部署与检索效率。官方同时强调,该模型在搜索嵌入任务上仍保持当前最先进水平,显示出开发者与企业用户对高效检索基础模型的持续需求。Google TV 集成 Gemini 新功能,增强体育、教程与知识问答体验
Google TV 正在引入新的 Gemini 功能,以提升电视端的信息获取与交互体验。新能力包括视觉化帮助内容,例如实时体育比分、食谱与操作教程,以及围绕健康、经济等主题的更深入知识讲解。同时,体育简报功能将覆盖 NBA、NHL 等多个联赛,让用户在客厅场景下更便捷地获取赛事与信息服务。这表明 Gemini 正进一步向家庭娱乐设备渗透。Neuralink 展示脑机接口恢复失语者言语能力
Neuralink 展示了一项脑机接口应用成果:帮助失语者恢复言语表达能力。根据 Elon Musk 发布的演示,这项技术通过脑信号解码与输出系统,使患者重新获得一定程度的沟通能力。该案例凸显了脑机接口在医疗康复领域,尤其是语言障碍辅助方面的潜在价值,也进一步说明 Neuralink 正在从基础研发走向更具体的临床应用场景。Moda 推出面向非设计师的 AI 设计代理平台,并获 750 万美元融资
Moda 发布了一款以 Deep Agents 为核心的设计代理平台,目标是让非设计背景用户也能完成更复杂的设计工作。平台借助 LangSmith 提供可观测性与工作流管理能力,帮助团队追踪代理执行过程与结果质量。与此同时,公司宣布完成 750 万美元融资,投资方包括 General Catalyst 以及 Dropbox 创始人等。该产品试图将 AI 设计工具从单点生成扩展到更完整的代理式协作流程。Smallest AI 发布 Lightning v3.1 语音合成模型,主打实时对话与多语言克隆
Smallest AI 推出 Lightning v3.1 文本转语音模型,重点优化实时对话场景。官方称其 MOS 达到 3.89,表现超过 OpenAI 与 ElevenLabs 的同类方案,并支持 15 秒语音克隆、15 种语言以及中英代码混合等复杂输入。该模型面向低延迟、高自然度的语音交互需求,适用于实时助手、语音代理和多语言对话应用。Inworld TTS-1.5 Max 上线 fal.ai,支持 15 种语言且延迟低于 200ms
Inworld 的 TTS-1.5 Max 已上线 fal.ai,面向实时语音应用提供更高表现力与稳定性的文本转语音能力。该模型支持 15 种语言、增强版语音克隆,并将延迟控制在 200 毫秒以内,适合游戏、虚拟角色、客服代理和实时互动场景。其核心卖点在于兼顾自然表达、克隆效果与推理速度。Cursor 集成 Figma 设计系统,可直接用 AI 生成组件与前端代码
Cursor 推出与 Figma 设计系统的集成功能,允许开发团队直接利用设计变量、设计令牌和命名约定,通过 AI 生成新组件及对应前端实现。该功能还结合 MCP 工具开放测试,目标是打通设计到开发的交付流程,减少手动还原设计稿的工作量。对于采用统一设计系统的团队而言,这有望提升组件开发效率和一致性。Oxlint 周下载量达 360 万次,Oxfmt 达 250 万次
Rust 生态中的代码质量工具持续增长。Oxlint 的周下载量已达到 360 万次,而格式化工具 Oxfmt 的周下载量也达到 250 万次。两者的快速增长反映出开发者社区对高性能静态检查与格式化工具的强烈需求,也显示 Rust 正在通过更完善的工具链提升工程可用性与代码质量治理能力。daVinci-MagiHuman 开源 15B 视频音频生成模型,支持 6 种语言
SII_GAIR 与 SandAI 联合发布并开源 15B 参数的 daVinci-MagiHuman,这是一个同时覆盖视频与音频生成的人形内容生成模型。官方称,使用单张 H100 生成 5 秒 1080p 视频仅需 38 秒;在对比测试中,对 Ovi 1.1 的胜率达到 80%,对 LTX 2.3 的胜率为 60.9%。项目采用 Apache 2.0 许可证,覆盖完整技术栈开源,支持 6 种语言,利于学术研究和商业落地。小米公布 Q4 营收 4573 亿元,研发投入 331 亿元并持续押注“人车家”生态
小米披露第四季度业绩:营收达到 4573 亿元,同比增长 25%;调整后净利润 392 亿元,同比增长 43.8%。同期研发投入为 331 亿元,同比增长 37.8%,研发人员规模达到 2.5457 万人。公司继续围绕“人车家全生态”进行投入,显示其在硬件、汽车与智能生态协同上的长期战略仍在加速推进。Solana 推出面向企业的 Developer Platform,覆盖发行、支付与交易 API
Solana 基金会发布 Solana Developer Platform(SDP),面向企业提供更完整的 API 开发基础设施。平台包括资产发行、支付和交易三大模块,可支持 RWA、稳定币等发行需求。官方披露,Mastercard、Worldpay 等已成为首批用户,其中交易模块计划于 2026 年底上线。该平台意在降低企业接入 Solana 生态的门槛,扩大链上金融和支付场景落地。Google DeepMind 与 Agile Robots 合作,将 Gemini 模型集成到机器人硬件
Google DeepMind 宣布与 Agile Robots 建立研究合作关系,双方将把 Gemini 基础模型集成到机器人硬件系统中,用于构建下一代智能机器人。该合作体现出大模型能力正从软件助手进一步扩展到实体智能场景,未来有望在工业、服务和自动化任务中提升机器人的理解、规划与交互能力。Arm 首次推出自研量产 AGI CPU,采用 3nm 工艺并配备 136 个 Neoverse V3 内核
Arm 宣布推出其首款自研量产 AGI CPU,采用 3nm 制程,单芯片集成 136 个 Neoverse V3 内核,面向数据中心中的代理式 AI 工作负载。该产品显示 Arm 正进一步切入高性能 AI 基础设施市场,不仅强调通用算力,也瞄准面向智能代理和大规模推理服务的新型服务器需求。苹果发布 iOS 26.4 和 iPadOS 26.4 正式版更新
苹果已向用户推送 iOS 26.4 和 iPadOS 26.4 正式版系统更新,距离上一版本 iOS 26.3 约六周。支持设备可通过 OTA 方式直接下载并安装。本次信息主要涉及正式版发布节点与升级可用性,属于苹果移动系统的常规版本更新。Akai MPC Sample 便携式 beat maker 评测:回归采样本质的随身音乐设备
Akai MPC Sample 被评价为一款回归采样本质的便携式 beat maker,配备 2.4 英寸彩色屏幕并支持电池供电,强调随身创作体验。产品瞄准便携音乐设备市场,与 Teenage Engineering 等品牌形成竞争。报道更偏向评测与产品定位分析,突出其在轻量化、移动化音乐制作上的特色。🛡️ 安全事件
litellm PyPI 供应链攻击,窃取 SSH 密钥和 API 密钥等凭证
litellm 1.82.8 版本攻击通过 `pip install` 窃取 SSH 密钥、AWS/GCP/Azure 凭证、Kubernetes 配置、API 密钥 等。97 百万 月下载,影响 dspy 等依赖项目,持续不到 1 小时。🔥【重磅】LiteLLM PyPI 供应链攻击窃取海量凭证
LiteLLM v1.82.7/1.82.8(2026-03-24)被TeamPCP投毒,.pth文件自动执行,窃取SSH 密钥、AWS/GCP凭证、K8s配置等。月下载9700 万次,影响DSPy等2000+包。经Trivy入侵窃取发布令牌,存活3 小时。litellm PyPI 供应链攻击,46 分钟窃取 SSH/AWS 凭证
litellm 1.82.8(97M月下载)遭TeamPCP攻击,窃取SSH 密钥/AWS 凭证/API 密钥等,影响DSPy/MLflow等 1400 包,持续46 分钟。由 X-Crawler AI 生成于 2026-03-25 09:10
每日精选 · 直送邮箱
订阅天眼日报
AI 精选科技要闻摘要,每天一封,免费无广告。