天眼日报
科技 · 每日情报2026年03月21日约 50 分钟阅读

AI 速读22 条精选
🚗头条Waymo公布自动驾驶安全数据
累计1.7亿英里后称严重伤害事故比人类司机少13倍,显著影响自动驾驶商业化与监管信心。
🚗头条特斯拉FSD或将获荷兰批准
若4月在荷兰落地,可能成为特斯拉FSD进入欧洲市场的关键突破,并带动其他国家审批。
🤖头条英伟达将向AWS供100万GPU
至2027年供应100万GPU,显示AI算力军备竞赛继续升级,也强化AWS与英伟达的产业主导地位。
📰头条Reddit年营收增至22亿美元
营收同比增69%、日活1.21亿,证明社区平台在广告与AI数据授权上的商业价值快速提升。
🏛头条白宫发布国家AI政策框架
美国推动联邦层面统一AI规则,覆盖儿童、能源、知识产权等,可能深刻影响产业监管方向。
🤖AlphaProof登上Nature
🤖Cursor承认Composer 2基于Kimi
📦Mistral发布Small 4开源模型
📦英伟达开源Nemotron-Cascade 2
📰Google Drive升级文档扫描
🤖Google AI Studio支持多人协作
🦾迪士尼等开源Newton引擎
🚀SpaceX接手GPS国家安全发射
🤖Google Cloud签下1GW电力合同
₿Ledger为IPO筹备更换CFO
🏛稳定币立法谈判出现进展
₿Hyperliquid标普永续量破亿美元
🤖PyTorch强化英特尔AI PC支持
📰Notion会议笔记支持后台运行
🦾Niantic用宝可梦图像训练机器人
🚀SpaceX反击亚马逊卫星反对意见
📰Cloudflare预警AI流量将超人类
🤖 AI 大模型
Claude Code 2.1.81 发布:新增 --bare 标志、优化针对性文件读取,并包含多项 CLI 与系统提示更新
ClaudeCodeLog 报告 Claude Code 2.1.81 已发布。此次更新新增 --bare 标志,可跳过钩子、LSP 和插件同步,以提升自动化场景下的启动与执行速度;同时改进读取工具,优先对已知文件进行局部读取,减少返回内容体积。更新还提到助手会遵守“无记忆”请求,不存储相关记忆。整体版本包含 27 项 CLI 变更与 2 项系统提示更新。另有预告称该版本还将增强桌面 DOM 元素选择、React 组件名与 props 识别能力。Cursor Composer 2 被确认基于 Kimi K2.5:从争议曝光到官方澄清,Fireworks AI 提供合作基础设施
围绕 Cursor Composer 2 的底层模型来源,多条信息已相互印证并形成完整脉络:最初有开发者通过模型路径与分词器线索,怀疑其基于 Moonshot AI 的 Kimi K2.5,且未充分披露,甚至引发许可证合规争议;随后 Cursor 团队与 Lee Robinson 出面确认,Composer 2 的确以 Kimi K2.5 为基座模型,在此基础上进行了持续预训练与更大规模强化学习,算力规模约为基座阶段的 4 倍,并通过 Fireworks AI 的授权合作与推理基础设施接入。Moonshot AI 方面也公开祝贺并确认商业合作关系。该事件因此从“未披露争议”演变为“官方承认合作与技术路线”的完整公告链路。Poe 上线小米 MiMo V2 系列模型:覆盖快速任务、多模态分析与 100 万 Token 长上下文
Poe 已上线小米 MiMo V2 系列模型,包括 MiMo-V2-Flash、MiMo-V2-Omni 和 MiMo-V2-Pro。Flash 面向快速文档总结与代码重构场景;Omni 支持混合媒体分析;Pro 则主打超长上下文能力,提供 100 万 token 上下文窗口,适用于长代码库分析、多步代理和复杂长文档处理。该系列目前已在 Poe 应用与 API 中可用,意味着小米模型生态正在进一步扩大其在通用 AI 平台上的分发覆盖面。Ollama 支持本地运行 NVIDIA Nemotron-Cascade 2,NVIDIA 同步发布该开源 30B MoE 模型
NVIDIA 已在 Hugging Face 发布 Nemotron-Cascade 2,随后 Ollama 也宣布支持本地运行该模型,可通过 `ollama run nemotron-cascade-2` 直接调用,或结合 OpenClaw 启动。该模型为 30B 级 MoE 架构,实际激活约 3B 参数,支持多模态生成,并被称在推理与代理能力上可媲美参数量高出约 20 倍的模型。相关宣传还提到其在 IMO 与 IOI 2025 任务上达到金牌级表现。整体上,这一事件兼具“模型开源发布”与“本地部署支持落地”两层意义。PyTorch 2.10 优化 Intel Core Ultra Series 3 与 Arc B 系列 GPU,本地推理与视觉训练性能提升
PyTorch 2.10 宣布针对 Intel Core Ultra Series 3 处理器和 Arc B 系列 GPU 做出优化,平台性能可达 120 XMX TOPs。在示例中,Llama 3.2 3B 模型的首 token 延迟约为 242.29ms,后续 token 延迟约 27.24ms;视觉模型训练则可获得约 1.4 至 1.7 倍加速。这表明 PyTorch 正持续强化对新一代 Intel AI PC 与消费级图形硬件的适配能力,为端侧与本地 AI 工作负载提供更实用的性能基础。LlamaParse 推出官方 Agent Skill:支持 40 多种代理解析复杂文档
LlamaIndex 为 LlamaParse 推出官方 Agent Skill,旨在让代理系统更方便地处理复杂文档内容。该能力支持表格、图表、图像等非纯文本信息解析,并已提供演示与文档,适配 40 多种代理框架或代理形态。此举强化了文档理解链路中的结构化抽取与多模态解析能力,有助于提升企业知识库、报告分析、研究助手等场景的自动化水平。小米 MiMo V2 持续扩展能力与影响力:Pro 在 Arena 排名靠前,Omni 上线 Vision Arena 测试
小米 MiMo V2 系列近期出现两项独立但相关的进展。其一,MiMo V2 Pro 在 Code Arena 的代理 Web 开发任务中进入前 6,总榜第 13,在 Arena Expert 中排名第 10,并在物理、社会科学和商业等类别进入前 20,显示出较强的综合与代码能力。其二,MiMo V2 Omni 已上线 Vision Arena,可在 Battle Mode 中接受开发者投票测试,用于评估视觉推理表现。两项信息共同表明 MiMo V2 正同时推进代码、通用推理与视觉多模态能力验证。Claude Code 权限确认可通过 alias 永久跳过,适合自动化执行场景
有用户分享 Claude Code 的权限确认配置技巧:可通过在 `~/.bashrc` 中添加 `alias claude='claude --dangerously-skip-permissions'`,并执行 `source ~/.bashrc` 使之生效,从而避免每次启动时重复确认工具调用权限。该方法主要面向自动化执行、脚本化工作流和高频使用场景,但由于参数本身涉及跳过权限确认,使用时仍需结合本地环境安全策略谨慎评估。Claude 桌面应用新增 Projects 功能:在 Cowork 中支持本地项目导入与管理
Anthropic 更新 Claude 桌面应用,在 Cowork 中引入 Projects 功能。用户可一键导入现有项目,也可新建项目进行组织管理;相关文件与指令保存在本地电脑中。该更新进一步增强了 Claude 桌面端围绕项目级上下文的使用体验,更适合持续性协作、代码或文档工作流,以及需要在本地维护资料与指令的用户。BioReason Pro 发布:面向蛋白质功能预测的多模态推理模型
Bo Wang 团队联合 ARC Institute 和 Genophoria 发布 BioReason Pro,多模态推理模型聚焦蛋白质功能预测任务。相关介绍称,该模型试图在 AlphaFold 之后进一步补足“从蛋白质序列到功能理解”的关键空白。此类模型若能在结构、序列与实验信息之间建立更可靠的推理链路,将对生物医学研究、蛋白质工程和药物研发带来重要应用价值。Google DeepMind 的 AlphaProof 论文登上 Nature:与 AlphaGeometry 结合达到 IMO 银牌水平
Google DeepMind 的 AlphaProof 相关研究论文已发表于 Nature。论文介绍了 AlphaProof 与 AlphaGeometry 结合后,在国际数学奥林匹克(IMO)题目上达到银牌级表现的技术路径。核心创新在于利用强化学习循环,将自然语言表述与符号推理过程更有效地桥接起来,为形式化数学证明与自动定理证明系统提供了新的可扩展方案。谢赛宁谈世界模型与 LLM:世界模型更接近真实推演,语言模型受制于监督与数据叙事
在一次播客访谈中,谢赛宁围绕世界模型与大型语言模型的差异表达了鲜明观点。他认为世界模型关注的是对“下一状态”的预测,更接近真实物理与环境反馈,例如手放到火上会痛;而 LLM 本质上服务于沟通与语言生成,高度依赖监督信号与海量数据扩展。按照这一观点,当前硅谷对 LLM 的叙事过于强势,可能遮蔽了世界模型这一更具长期潜力但仍处于探索阶段的方向。MidBrain 开源 SmartSearch:面向长时记忆检索的 SOTA 方法,CPU 可运行且无需 LLM
MidBrain 开源 SmartSearch,定位于 AI 代理的长时程记忆检索。该方法在 LoCoMo 上达到 93.5%、在 LongMemEval-S 上达到 88.4%,达到当前最优水平。其特点包括 CPU-only、无需 LLM,并可将 token 消耗减少约 8.5 倍。论文重点描述了记忆检索如何从传统检索方式演进为更具学习能力的系统,对需要持续记忆、多轮上下文保持和低成本部署的代理应用具有实际意义。Mistral Small 4 发布:119B MoE 模型支持混合推理、图像输入与 256K 上下文
Mistral AI 推出 Mistral Small 4。该模型为 119B MoE 架构,活跃参数约 6.5B,支持混合推理模式、图像输入以及 256K 上下文窗口。在 Artificial Analysis Intelligence Index 中,其推理模式得分为 27,超过 Mistral Large 3 的 23 分;在 MMMU-Pro 上得分 57%。模型采用 Apache 2.0 许可,显示出 Mistral 在兼顾性能、开放性与多模态能力上的持续推进。💰 加密货币currency
⭐ Hyperliquid S&P 500 永续合约 24 小时交易量超 1 亿美元
Hyperliquid S&P 500 永续市场上线两天后,24 小时交易量达 1 亿美元,显示传统资产与加密衍生品融合加速。Grayscale 提交 HYPE ETF S-1 注册声明
Grayscale 向 SEC 提交 HYPE ETF S-1,拟在 Nasdaq 以 GHYP 代码上市,支持 HYPE 质押收益。白宫与参议员就稳定币收益达成初步协议
Politico 报道,白宫和参议员就稳定币收益辩论达成暂定协议,推动加密立法前进。CFTC 发布加密资产 FAQs,细化保证金估值原则
CFTC 更新 FAQs(25-39、26-05),明确比特币、以太坊、支付稳定币保证金估值、风险折扣,与 SEC 一致。强调流动性、托管隔离、风控。Binance 3 月 23 日上线 PayPay 股票永续合约,最高 10 倍杠杆
Binance 上线 PAYPUSDT USDⓈ保证金永续合约,标的 PayPay(Nasdaq: PAYP),支持 10 倍 杠杆及 24/7 交易。BitFuFu 2025 全年营收 4.758 亿美元,云算力占比 73.7%
BitFuFu 未经审计 2025 财报:营收 4.758 亿美元(同比+2.7%),云算力 3.506 亿美元(+29.4%);净亏损 5740 万美元(2024 盈利 5400 万),管理算力 26.1 EH/s,持 1778 枚 BTC。⭐ Ledger 聘请前 Circle 高管任 CFO,准备 IPO 估值超 40 亿美元
Ledger 聘请 John Andrews(前 Circle 高管)任 CFO,负责资本市场和 IPO 准备,在纽约设办公室,与投行接洽,IPO 估值或超 40 亿美元。市场波动或推迟计划。比特币现货 ETF 净流出 9019 万美元,以太坊 ETF 净流出 1.36 亿美元
3 月 19 日比特币现货 ETF 总净流出 9018.96 万美元,Grayscale BTC 流入 466.27 万美元;以太坊现货 ETF 总净流出 1.36 亿美元,Blackrock ETHB 流入 771.97 万美元。14 年休眠 Mt.Gox 2100 BTC 钱包苏醒
2012 年 7 月从 Mt.Gox 提取的 2100 枚 BTC 钱包结束 14 年休眠,半小时前测试转账$55 至新钱包。14 年前价值$13,839,现值$1.48 亿,增长 1.07 万倍。🛠️ Tool Recommendations
Claude Code 支持云端定时任务和 DOM 元素选择
Claude Code 桌面版新增直接选择 DOM 元素功能,提供标签/类名/样式/HTML/截图(React 应用含源文件/组件名/props);支持云端定时任务,无需本地运行。Google Drive 文档扫描器重大升级
Google Drive 新扫描器支持多页实时扫描、自动连续捕获、重复页检测和重设计 Beta UI,提升文档数字化效率。macOS Sandbox LLM 编码代理工具
macOS 沙盒工具支持 LLM 编码代理,提供 Python 运行和可视化输出,适用于安全代码执行环境。Rust 向量相似性搜索引擎发布
开源 Rust 向量相似性搜索工具,支持高效查询。Poe API 新增 API Key 管理,支持多工具独立密钥
Poe 推出 API Key 管理,支持 OpenClaw、Claude Code 等工具独立密钥。Firecrawl 插件集成 OpenCode 终端爬虫
Firecrawl 插件现支持 OpenCode,通过 npm install -g firecrawl-cli 安装。代理可实时抓取、搜索网页,提供终端内上下文。libghostty C API 重大更新支持终端状态
libghostty C API 新增完整终端状态访问、高性能渲染 API,以及 CMake 集成只需 10 行 代码。⭐ Google AI Studio 升级,支持多人协作和实时服务
Google AI Studio 新增多人协作构建实时游戏与工具、连接实时数据、持久构建和专业 UI(shadcn、Framer Motion、npm 支持)。Notion AI 会议笔记支持后台运行
Notion 更新 AI Meeting Notes,iOS 和 Android 上后台运行,切换应用或锁屏笔记继续生成。Perplexity Computer 支持内联文档创建与编辑
Perplexity 新功能:直接内联创建文档、拖拽部分并语音指示编辑,即时修改。LlamaIndex 发布 LiteParse:免费高速文档解析器,支持 46+代理
LlamaIndex 开源 LiteParse,免费高速文档解析器,支持 46+代理如 Claude Code、Cursor 等。一命令集成:`npx skills add run-llama/llamaparse-agent-skills --skill liteparse`。兼容编码代理,本地处理文档,支持直接任务或代码上下文。Warp 支持 Kitty 键盘协议,修复编码代理输入问题
Warp 在 OpenCode 输入框新增 Shift-Enter 支持,兼容 kitty 键盘协议,修复交互 CLI 包括编码代理的键盘输入问题。Claude HUD 插件:三行命令安装实时状态栏
Claude Code 插件 claude-hud,三行命令安装:/plugin marketplace add jarrodwatts/claude-hud 等,提供实时状态显示。Transpiler 将 Python 转 Rust/C++/Go
工具将 Python 代码转译为 Rust、C++ 和 Go,支持高效跨语言转换。Scripts 转 Workflows 和 UI 工具
工具将脚本转换为 workflows 和 UI,简化自动化流程构建。⭐ 迪士尼/DeepMind/英伟达开源 Newton:GPU 物理仿真引擎
Newton 基于 NVIDIA Warp,GPU 加速机器人仿真,支持 Linux/Windows/macOS,示例涵盖机械臂/柔性体/流体/线缆;Linux 基金会托管,海量代码实用。GStack:MIT 开源 Claude Code 工作流,Markdown 即代码
GStack MIT 许可,利用 LLM 将 Markdown 转行动,支持 Claude Code 智能代理。⭐ Mistral Vibe:官方开源 CLI AI 编码代理,支持 subagent/MCP
Mistral Vibe Apache 2.0,双循环架构,工具包括 read_file/bash/grep;支持 MCP/语音,Pydantic 类型安全,uv 工具链。📖 教程攻略
Austen 推出 35 模块 Vibe Coder 转工程师课程
Austen 发布涵盖 35 模块、250+ 课时的系统课程,专为 vibe coder 设计,帮助其理解软件底层原理,包含丰富的交互实践项目,旨在将 vibe coder 培养为具备扎实基础的工程师。LangChain Academy 新课:构建可靠 Agent 从原型到生产
LangChain 推出免费新课程,系统讲解如何将 AI 代理从原型推进到生产环境,涵盖多步推理、工具使用、用户流量处理,并结合 LangSmith 进行观察、评估与部署。小龙虾完整图片渲染流程分享
manateelazycat 分享小龙虾渲染图片的完整方案:内部通过 0.0.0.0:8899 进行渲染,前端采用 React + Markdown img 标签展示,后端负责缓存图片,同时支持无 HTTP 环境下查看历史聊天图片。世界首台 SwitchClaw:Nintendo Switch 运行 Claw 教程即将发布
passluo 展示全球首台 SwitchClaw,实现在 Nintendo Switch 上运行 Claw,由 Childless Cat Lady 进行演示,免费教程次日发布,引发广泛关注。Claude Code 与 OpenClaw 实战最佳实践:Skills 防护、持久化与内容流水线演示
两场直播分享 Claude Code 与 OpenClaw 的实战优化经验。Claude Code 方面:Skills 编写优先列出 Gotchas 防止常见错误,拆分子文件管理细节,通过 /careful/freeze Hooks 加强保护,数据目录维护持久状态,并与 SkillNote 市场同步。OpenClaw 方面:使用 memory.md 实现持久化,配置 OAuth 支持多模型备份,Telegram 多群隔离管理;并演示了从 YouTube 抓取内容到自动发布视频的完整闭环,以及基于 Sheet/Gmail 的 CRM 工作流。两者均聚焦于提升 AI 代理的稳定性与生产可用性。💎 技巧经验
⭐ 编码代理简单设置提升性能,附 starter prompt
mattshumer_分享编码代理优化设置,用户可立即复制starter prompt大幅提升性能。namespacelabs 赞助 CI:Mac 测试 5.4m→1.5m,Linux3.6m→2.1m
namespacelabs CI 机器,Mac 测试-72%(5.4m→1.5m),Linux-42%(3.6m→2.1m)。⚡ 工作流
快手柯南 AI:亿级 DAU 前端性能 Agent 诊断+Ekko 兜底
柯南 AI Agent 框架+MCP,Holmes采集 UI/运行时,火焰图压缩定位源码;Ekko崩溃恢复,生成兜底配置。🧠 深度思考
Solugen 用酶+催化剂重塑化工,月赚 1.2 万美元
Solugen 将酶与金属催化剂结合,反应效率从 60% 升至 96%,原料从石油换玉米糖浆,第一台 Home Depot PVC 反应器月赚 1.2 万美元,从胰腺癌研究启发。API 优于 CLI 适配 Agent 时代
lifesinger 分析 CLI 参数爆炸问题,云端 API 更易用且商业可持续。优秀 SaaS 公司核心资产即 API,Agent 擅长调用。OpenClaw 过度炒作:90%用户难落地,非确定性+维护难题
OpenClaw演示易但边缘场景/维护难,建议混合 LLM 脚本+cron;预测垂直 SaaS 爆发,如WordPress向Shopify演进。📰 Industry News
⭐ SpaceX 接手 ULA 的 GPS III-8 国家安全发射任务
美国太空系统司令部将即将 GPS III-8 发射从 ULA Vulcan 火箭重新分配给 SpaceX Falcon 9,因 Vulcan 异常调查中,确保关键 GPS 卫星可靠及时部署。⭐ Waymo 安全数据:1.7 亿英里行驶,严重事故少 13 倍
Waymo Driver 截至 2025 年 12 月行驶 1.7 亿英里,严重伤害事故比同城人类司机少 13 倍,Sundar Pichai 官方发布。SpaceX Falcon 9 从加州发射 25 颗 Starlink 卫星
SpaceX Falcon 9 火箭从加州发射 25 颗 Starlink 卫星,直播链接提供。⭐ Tesla FSD Supervised 荷兰 4 月 10 日获批,或开启欧洲其他国家批准
荷兰 RDW 回应 Tesla,确认 FSD Supervised 评估进入最终阶段,18 个月前启动联合测试,现审查所有数据和结果,优先考虑交通安全。Tesla 表示 RDW 确认 FSD (Supervised) 将于 4 月 10 日在荷兰获批,过去数月完成 13,000+ 客户试乘、4,500+ 赛道测试、400+ 合规文档及数十项安全研究,或开启欧洲其他国家批准。MLB 任命 Polymarket 为官方预测市场交易所
3 月 19 日,MLB 指定 Polymarket 为官方预测市场,获 Sportradar 数据和标志使用权;3 月 17 日,亚利桑那州对 Kalshi 提起 20 项 刑事指控。白宫发布国家 AI 政策框架,获 pmarca 赞扬
白宫今日发布国家 AI 政策框架,确保每位美国人受益于 AI,避免 50 州 碎片化政策。POTUS 强调需单一联邦政策,与国会合作立法。特朗普发布 National AI Legislative Framework,涵盖保护儿童、能源基础设施、知识产权、言论自由、创新及劳动力培训六大重点方向。Marc Andreessen 称白宫 AI 领导者 David Sacks 和 Sriramk 等发布的框架是重大进步,合理保护民众并鼓励构建者。⭐ SpaceX 向 FCC 提交文件,反击 Amazon 反对其 100 万卫星提案
SpaceX 正式致函 FCC,称 Amazon 反对其 100 万卫星 轨道数据中心提案的标准也适用于 Blue Origin 的 51,600 AI 卫星提案,要求平等对待。Cloudflare CEO 预测 2027 年 AI 机器人流量超人类
Cloudflare CEO Matthew Prince 预测 2027 年 机器人流量将超人类网页流量,AI 代理访问网站量为人 1000 倍,生成 AI 前机器人仅占 20%。Veo 3.1 和 Gemini 图像兼容 OpenAI API
Google Veo 3.1 视频和 Nano Banana 图像通过 OpenAI 兼容层 可用,仅改 3 行代码 切换 SDK。端点 /v1/videos 和 images.generate。⭐ Google Cloud 首家整合 1GW 灵活需求至公用事业合同
Google 成为首家云提供商,将 1GW 灵活需求整合进长期公用事业合同,帮助平衡供需、规划容量,降低社区成本,支持数据中心增长。Blue Origin 进入太空数据中心领域
Jeff Bezos 的 Blue Origin 推出太空数据中心计划,TechCrunch 报道。Niantic Spatial 用 Pokémon Go 30 亿 图像训练送货机器人
Niantic 衍生 Niantic Spatial 用 Pokémon Go 30 亿 玩家图像训练视觉定位系统,Coco Robotics 在 LA、Chicago、Miami 部署数千机器人,GPS 精度达 50 米 内。英国航空 完成首架搭载 Starlink 的航班
British Airways 今日完成配备 Starlink 的航班,乘客可在飞行中流媒体、工作或保持联系。正向机队逐步 rollout。NHTSA 拒绝召回所有 Tesla 车辆的意外加速请愿
NHTSA 正式拒绝 2023 年 3 月提交的请愿,该请愿要求召回自 2013 年起 所有 Tesla 车型,指再生制动和单踏板驾驶增加踏板误操作 风险。⭐ Reddit FY25 营收 2.2B 美元 +69% YoY,121M DAU
Reddit FY25 年营收 2.2B 美元(+69% YoY),24B+ 帖子评论,121M DAU、471M WAU,与 OpenAI/Google 数据合作。NVDA 确认向 AWS 供应 100 万 GPU 至 2027 年
NVIDIA 与 Amazon AWS 协议供应 100 万 GPU 至 2027,包含 Spectrum 网络和 ConnectX 基础设施,扩展 AI 全栈支出。美光中期仅满足关键客户 50-67% 内存需求
美光 财报显示中期仅满足超大数据中心客户 50-67% 需求,AI 计算增速超 3-5 年 内存产能扩建。⭐ Super Micro 三人涉嫌走私数十亿美元 NVIDIA 服务器至中国
Super Micro 联合创始人 廖益贤 等三人违反出口管制,欺骗检查走私英伟达芯片服务器价值数十亿美元至中国。SMCI 股价跌 27%,检察官指联合创始人利用东南亚壳公司、假服务器及吹风机换序列号,走📚 前沿研究 & Papers
Stanza-Wikitext-2 数据集上线 Hugging Face:Stanford Stanza 全量增强 Wikitext-2,提供 Parquet 格式
Stanford Stanza 发布并上线了增强版 Stanza-Wikitext-2 数据集,对经典 Wikitext-2 语料进行了更完整的整理与扩展,并以 Parquet 格式提供,便于在现代 NLP 数据处理与训练管道中直接使用。该数据集适合用于语言模型训练、评测、数据预处理实验及批处理分析,对研究者和工程团队在 Hugging Face 生态中快速接入语料具有较高实用价值。NVIDIA 发布 Nemotron-Cascade 2:30B MoE 多模态生成模型,论文公开并在 IMO/IOI/ICPC 2025 获金牌级成绩
NVIDIA 发布了 Nemotron-Cascade 2 的论文与模型。这是一套级联式多模态生成系统,采用 30B MoE 架构、约 3B 活跃参数,结合 Cascade RL 与多领域蒸馏方法,在 IMO 2025、IOI 2025 与 ICPC 2025 等高难度竞赛任务中取得金牌级表现,整体成绩超过 Qwen3.5-35B-A3B。相关信息同时强调了模型与数据的开放性,显示其不仅面向多模态生成,也在复杂推理与竞赛类任务上具备较强能力。EverMind 提出 MSA 架构:支持 1 亿 token 推理,记忆衰减仅 9%,4B 参数可胜 235B RAG 系统
EverMind 提出的 MSA 架构通过 document-wise RoPE 与 Memory Interleaving 设计,大幅提升长上下文建模能力,据称可支持 1 亿 token 级别推理,同时将记忆衰减控制在仅 9%。该方案在参数规模仅 4B 的情况下,表现超过一个 235B 级 RAG 系统,并且仅需 2 张 A800 即可运行,显示出在长上下文推理、低成本部署与高效记忆机制方面的研究潜力。InSpatio-World:将视频实时转换为可探索的 3D 世界模型
InSpatio-World 项目探索将输入视频直接转换为可交互、可探索的 3D 场景世界模型,使系统不只是生成视频内容,而是进一步构建用户能够在其中浏览和探索的空间表示。虽然目前效果仍未达到 Genie 3 的水平,但该方向展示了从视频理解迈向可导航世界建模的重要路径。项目已提供 GitHub 链接,具备较强的研究与实验参考价值。Google 提出 Bayesian Teaching:训练 LLM 模仿贝叶斯概率模型逐步更新用户偏好信念
Google 的 Bayesian Teaching 研究尝试让大语言模型模仿贝叶斯概率模型,在与用户交互过程中逐步更新对用户偏好的信念表示。该方法在航班预订模拟任务中显著提升了偏好预测准确率,说明 LLM 可以通过显式或近似的概率式信念更新,更稳定地完成个性化推断与决策支持。论文编号为 arXiv:2503.17523,对可解释偏好建模与交互式推荐研究具有启发意义。微信采用 NVIDIA Cagra 优化 GPU 向量检索:建库提速 30 倍、成本下降 50%
微信在向量检索基础设施中引入 NVIDIA Cagra,并围绕 Streaming、Growing、Sealed 三层存储架构进行优化,同时对图结构与 Pinned Memory 进行了改进,并结合 CPU/GPU 链式广播机制提升整体系统效率。结果显示,该方案可实现建库速度提升约 30 倍、成本下降 50%,吞吐进一步提升 65%。这表明 GPU 加速向量检索在大规模工业场景中的系统设计与工程优化已取得显著进展。Meta 发布 V-JEPA 2.1 解释性研究:视频世界模型展现脑状群体编码与高维行为表示
Meta AI 发布了针对 V-JEPA 2 系列的视频世界模型解释性研究,展示模型内部可能形成类似“脑状群体编码”的表征结构,以及与高维转向行为相关的动态表示特征。研究指出,V-JEPA 2.1 能够同时学习全局语义信息与密集时空结构,为理解视频世界模型如何形成抽象认知、动作感知与可解释内部机制提供了新证据。这项工作兼具模型分析价值与认知启发意义。🚀 Product Launches
微软宣布改进 Windows 11 更新与任务栏:支持无限期暂停更新并恢复任务栏位置调整
微软宣布对 Windows 11 多项体验进行调整:用户将可无限期暂停系统更新,不再受此前最长 5 周的限制;同时,系统也不再强制在 OOBE 初始设置阶段下载更新。微软还承认此前对任务栏位置限制是错误决策,重新支持将任务栏放置在顶部、左侧或右侧。此外,本次更新还涉及启动速度优化以及文件操作可靠性提升,整体方向是减少强制性、提升可控性与系统稳定性。Warp 终端预览代理 PR 查看功能,可在终端内实时审查拉取请求
Warp 发布终端能力预览,允许用户直接在终端中实时查看代理生成或处理的 PR(拉取请求)。该功能适用于 Warp 自家的代理,也兼容其他编码代理工作流,目标是减少开发者在终端、代码托管平台与审查界面之间来回切换的成本。对于依赖 AI 编码助手的团队而言,这一更新有助于把代码生成、修改与审查过程进一步整合到统一开发环境中。Vercel 发布 Next.js 16.2,强化代理原生开发能力
Vercel 推出 Next.js 16.2,定位为更适合 AI 代理协作的框架版本。新版本集成 AGENTS.md 与捆绑文档能力,并支持通过 Vercel/next-browser 工具调试前端应用,使代理能够更好理解项目结构、框架约定与调试上下文。官方强调,代理可借助更深层的 React 与 Next.js 能力优化用户体验,进一步推动“代理原生”前端开发模式。LTX-2.3 视频模型推出生产级 API,支持构建开源视频 AI 产品
LTX-2.3 正式推出生产级 API,两条信息均指向同一产品发布:这一模型被描述为当前最强或下载量领先的开源多模态视频引擎之一,现已可通过 API 直接调用,无需本地 GPU。其能力包括支持复杂提示词生成、4K 纹理保留等,可用于构建自有视频 AI 产品与服务。相较于本地部署方案,生产 API 的推出降低了接入门槛,也让开发者更容易把开源视频生成能力落地到商业产品中。Replit 推出限时活动:赠送 Agent 4 并提供 1 个月 Core 免费或 20 美元积分
Replit 发起限时促销活动,用户可向朋友赠送 1 个月 Agent 4 体验,活动双方都可获得 1 个月 Core 免费资格,或 20 美元平台积分。这类拉新与促活机制有助于推动其 AI 编程代理产品的传播,并降低用户首次尝试门槛。对有意体验 Replit Agent 工作流的开发者来说,这是一次较低成本试用其代理能力和付费订阅体系的机会。OpenAI 面向美加大学生推出 Codex for Students,赠送 100 美元积分
OpenAI 推出 Codex for Students 计划,向美国和加拿大大学生提供 100 美元 Codex 积分,用于编写、调试和学习代码。该计划意在覆盖数百万学生用户,降低 AI 编程工具进入教育场景的门槛,并推动编程学习方式从传统搜索与文档查阅,逐步转向更互动式的生成式辅导。对学生开发者而言,这一补贴能显著降低实验新工具和完成课程项目的成本。Perplexity Computer 接入 PitchBook、Statista 和 CB Insights,增强专业研究数据能力
Perplexity Computer 新增对 PitchBook、Statista、CB Insights 等专业数据库的连接能力,使其可访问更多面向 VC、PE 和市场研究的高价值信息源。这意味着该产品正从通用问答与信息检索工具,进一步扩展为面向知识工作者的研究工作台。对于投资、咨询、行业分析等场景,接入权威商业数据后,Perplexity 的结论支撑能力与信息密度都将明显提升。Magnific Precision Video 上线 4K 视频增强功能,支持纹理保留与多参数控制
Magnific Precision 推出视频版增强能力,重点包括 4K 纹理保留、12 帧预览,以及对锐度、颗粒感和 FPS 的细粒度控制。该产品还与 Freepik 等平台集成,方便创作者在现有设计与内容生产流程中调用。整体来看,这次更新面向高质量视频增强和视觉风格控制需求,适用于希望在 AI 处理后仍保持丰富纹理细节的专业创作场景。Tempo 主网上线:由 Stripe 孵化,面向真实世界支付与稳定币原生费用
Tempo 宣布主网正式启动,定位为支持真实世界支付的新型网络。项目由 Stripe 孵化,强调 stablecoin 原生费用、高吞吐、低延迟和本地批处理能力,并提供 TempoAndantino(开发环境)与 TempoModerato(生产环境)两类运行模式。其产品方向表明,Tempo 试图面向支付基础设施场景提供更贴近实际业务需求的链上网络能力,尤其适合对性能与结算效率敏感的支付应用。Google AI Studio 更新全栈 Vibe Coding 功能,新增 Antigravity Coding Agent 与 Firebase 集成
Google AI Studio 推出面向全栈开发的 Vibe Coding 更新,新增 Antigravity Coding Agent,并集成 Firebase 后端能力,包括数据库与用户认证等模块,同时支持多人协作构建。这意味着开发者不仅能借助 AI 生成前端界面,还能更顺畅地打通后端服务与协作流程。此次更新也让 Google AI Studio 更直接地对标 v0、Bolt 等 AI 应用搭建平台,强化其在快速原型和全栈生成式开发领域的竞争力。戴尔发布 AI 数据平台:向量索引最高提速 12 倍,GPU 数据供给达 150GB/s
Dell 推出 AI Data Platform,主打面向 AI 工作负载的数据处理与存储能力提升。官方称其可实现最高 12 倍向量索引加速、3 倍处理提速,并通过 Lightning FS 文件系统提供每机架 150GB/s 的 GPU 数据馈送能力。该平台明显针对高性能检索、训练和推理等基础设施场景,强调把存储、向量数据处理与 GPU 吞吐统一优化,以支撑更大规模的企业级 AI 部署。AMD Versal SoC 将用于日本首个光学通信卫星星座
NEC 将采用 AMD Versal 自适应 SoC 构建日本首个光学通信卫星星座,用于支持太空中的高速路由与信号处理。该进展体现出 AMD 在航天与高可靠嵌入式通信领域的进一步渗透。相较传统电子通信链路,光学通信在带宽和传输效率上具有显著优势,而 Versal SoC 的自适应计算能力则可帮助卫星系统处理复杂通信与数据交换任务。开发者使用 GPT-5.4 补全 MySQL 入门教程,完成拖延 10 年的内容更新
开发者 jaywcjlove 表示,借助 GPT-5.4 补全了一套多年未完成的 MySQL 入门教程,弥补了这份教程 10 年来未完善的内容缺口。虽然这更偏向个人项目更新而非大型产品正式发布,但它反映出新一代 AI 工具正在改变技术写作与教程维护方式。对独立开发者和内容作者而言,模型能力的提升正在显著降低长期文档补全、结构整理与知识更新的成本。宇树科技披露招股书:2025 年前 9 个月收入 11.6 亿元,人形机器人占比过半
宇树科技发布招股书信息显示,公司在 2025 年 1 至 9 月实现收入 11.6 亿元人民币、净利润 1 亿元人民币。其中,人形机器人销售额占比升至 51.53%,较此前 27.6% 显著提高,表明其业务结构正在向更高关注度的人形机器人方向倾斜。招股书还披露创始人王欣欣持股 23.8%。这份数据为外界观察宇树商业化进展、盈利能力和产品结构变化提供了更具体依据。亚马逊据称开发代号“Transformer”的新手机,试图以 Alexa 打造 AI 中心
消息称,亚马逊正在开发一款代号为“Transformer”的新手机,这将是其自 2014 年 Fire Phone 之后再次尝试智能手机硬件。新设备据称将围绕 Alexa 打造个性化 AI 中心,试图把语音助手与更广泛的生成式 AI 能力深度整合到终端设备中。如果属实,这意味着亚马逊可能重新进入手机赛道,并以 AI 而非传统硬件参数作为核心差异化卖点。🔒 安全提醒
Google 披露 DarkSword iOS 攻击链,窃取加密钱包数据
DarkSword iOS 攻击工具自2025 年 11 月复用,利用6 个漏洞控制iOS 18.4-18.7设备,GHOSTBLADE窃取加密钱包私钥/助记词/交易记录。由 X-Crawler AI 生成于 2026-03-21 19:51
每日精选 · 直送邮箱
订阅天眼日报
AI 精选科技要闻摘要,每天一封,免费无广告。