天眼日报

科技 · 每日情报2026年02月25日49 分钟阅读
来源:2530 条精选推文·Lanyun·DeepSeek 生成·2026-02-24 — 2026-02-25
分享
科技 日报封面
AI 速读23 条精选
🔲头条Meta豪赌AMD AI芯片

超1000亿美元、5年6GW采购协议若属实,将重塑AI算力供应链格局,显著利好AMD并削弱英伟达独占地位。

📰头条微软推主权云离线AI

Sovereign Cloud支持AI模型在完全断网环境运行,直击政府、金融等强监管行业的合规与数据主权需求。

🚗头条Waymo新增4城无人叫车

单日扩至4座新城、商业运营城市达10个,标志Robotaxi从试点走向规模化落地,行业领先优势继续扩大。

🤖头条Qwen3.5中型开源模型发布

阿里一次推出多款1M上下文模型,兼顾性能、成本与单GPU推理,进一步加剧开源大模型竞争。

头条Meta重启稳定币支付

Meta拟于下半年接入稳定币支付并引入新钱包,若落地将把加密支付重新带入主流互联网平台场景。

🤖Anthropic遭遇蒸馏攻击指控
🤖Claude Code上线远程控制
🤖OpenAI开放Codex 5.3 API
🤖Mercury 2主打超高速推理
🤖Anthropic推企业代理Cowork
🏛五角大楼施压Anthropic
Stripe披露稳定币交易激增
💡Cerebras秘密递交IPO
🔲苹果扩大美国芯片采购
📰苹果转移Mac Mini产能
📦Cloudflare开源vinext
Kraken上线代币化股指永续
Binance上线代币化美股ETF
🦾SONIC开源人形机器人模型
📰微软联手Starlink扩网
🤖CoreWeave拟再融90亿美元
💡Nimble获4700万美元融资
📰AI发现25种新磁体材料

🤖 AI 大模型

大模型 Bullshit Benchmark 评测:Claude Sonnet 4.6 识别率 94.55%领跑

Anthropic 的 Claude Sonnet 4.6 在 Bullshit Benchmark 中以 94.55%绿色率(直接指出胡说八道)夺冠,Claude 系列包揽前 8;Qwen 3.5-397B 第 9(65.45%),GPT-5.2 仅 27.27%;Mistral Large 2512 垫底 3.64%。

Claude Code 迎来一周年:开发者用于生产应用和火星漫游车规划

Anthropic 的 Claude Code 发布一周年,开发者用于周末项目、生产应用、世界最大公司代码编写及火星漫游车路径规划。

Claude Code 新增远程控制功能

Anthropic 为 Claude Code 推出 Remote Control,用户可在手机上控制终端任务,Claude 继续在本地机器运行,支持散步或会议中接管会话。从本地终端启动会话后可在手机继续,支持 Max 用户研究预览。

阿里 Qwen 发布 Qwen3.5 中型模型系列

Alibaba_Qwen 推出 Qwen3.5-Flash、Qwen3.5-35B-A3B、Qwen3.5-122B-A10B 和 Qwen3.5-27B,其中 Qwen3.5-35B-A3B 使用 3B 活跃参数/令牌,优于 Qwen3-235B,采用混合注意力层(3:1 线性与标准)、超稀疏专家路由及强化学习,单 GPU 运行前沿推理,支持 100 万 token 上下文。Flash 支持 1M 上下文和内置工具,已在 Hugging Face 和 ModelScope 开源。Qwen 团队今日发布 Qwen 3.5 122B-A10B (MoE)、Qwen 3.5 35B-A3B (MoE)和 Qwen 3.5 27B (Dense)三个新开源模型,支持多模态和高效推理。

Warp 宣布 OpenAI Codex 5.3 正式可用并开放给开发者

Warp 与 OpenAI 合作调优 Codex 5.3,提升智能边界,响应迅速,将复杂问题分解为可管理块,现已通用可用。OpenAI 宣布 GPT-5.3-Codex 在 Responses API 中可用,开发者可立即构建应用,定价输入$1.75、输出$14.0/百万 token。基准测试:在 Terminal Bench 2 排名第 2、IOI 第 2、LiveCodeBench 第 3、Vibe Code Bench 第 4,使用 xhigh 推理。

Mercury 2 发布:首款推理扩散 LLM 输出速度达 1000+ tokens/s

Inception Labs 推出 Mercury 2 扩散 LLM,采用扩散架构,同时精炼整个响应,实现 1000 token/s 速度,匹配 70-90 token/s 自回归模型质量,支持多步代理和实时代码编辑。在 Terminal-Bench Hard 和 IFBench 上媲美 Claude 4.5 Haiku,代理编码和指令跟随得分 70%。创始人来自斯坦福等,支持生产部署。

Wan2.6-t2v 成视频竞技场中文模型第一

Alibaba Wan 的 Wan2.6-t2v 在 Video Arena 文本到视频排名第 1,得分 1346,图像到视频第 12,得分 1292,接近 Seedance v1.5 pro 和 Kling 2.6 pro。

SONIC:42M 参数 Transformer 控制人形机器人

DrJimFan 团队训练 42M SONIC 模型,使用 1 亿+ mocap 帧和 50 万+并行机器人在 128 GPUs 上训练,零样本转移到真实 G1 机器人,100%成功率支持 50 种动作序列,支持 VR、视频、文本和音乐输入,已开源代码和权重。

Arena 新增 Qwen3.5-397B-A17B 多文件 React 能力

Arena 支持 Qwen3.5-397B-A17B 测试 web 开发任务,并新增多文件 React 能力,YouTube 演示可用。

Perplexity 发布 4 款 SOTA 扩散嵌入模型

Perplexity AI 上周发布 4 款 SOTA 扩散嵌入模型(600M 和 4B 参数),支持 SBERT 和 ONNX 格式,可用于技术报告。

Anthropic 推出 Cowork 企业代理,支持 Excel-PowerPoint 端到端协作

Anthropic 发布 Cowork 和插件更新,支持 Google Workspace、Docusign、Apollo 等 10+连接器,以及 HR、设计、工程、投资银行等插件。Claude 可在 Excel 分析数据并生成 PowerPoint 演示,现向付费计划用户开放。

LiquidAI 发布 LFM2-24B-A2B,本地设备最大模型

LiquidAI 推出 LFM2-24B-A2B 模型,训练于 17T tokens,适用于 32GB 统一内存设备,通过 ollama 运行,支持快速本地推理。

GeminiCLI 推出 Hooks 功能

Google 官方宣布 GeminiCLI 新增 Hooks 功能,支持自定义代理循环、添加上下文、验证动作和执行策略。

Anthropic 更新 Responsible Scaling Policy 至 3.0 版

Anthropic 发布 RSP 3.0,自 2023 年实施以来优化政策,提升透明度,提供所有相关文档链接。

Anthropic 指控 DeepSeek、Moonshot AI、MiniMax 对 Claude 实施工业级蒸馏攻击

Anthropic 指控 DeepSeek、Moonshot AI、MiniMax 创建超 24,000 个欺诈账户,生成 1,600 万+次交互,系统性提取 Claude 的 Agent 推理、工具使用、编码等核心能力。MiniMax 攻击最活跃,新模型发布后 24 小时内转向。

OpenAI 认为 SWE-bench Verified 基准已失效,建议使用 SWE-bench Pro

OpenAI 审计显示 SWE-bench Verified 测试用例缺陷达 59.4%,训练数据污染严重,前沿模型依赖记忆高分通过。Claude Opus 4.6 用 Verified(80.8%),GPT-5.3-Codex 用 Pro(56.8%)。

Qwen3.5-397B-A17B 登顶 Hugging Face 最热模型

通义千问旗舰开源模型 Qwen3.5-397B-A17B 成为 Hugging Face#1 趋势模型,支持高性能推理和复杂推理,现已在平台开放试用。

fal.ai 发布 Seedream 5.0 Lite 多模态图像生成模型

fal.ai 推出 Seedream 5.0 Lite,统一多模态图像生成,内置在线搜索实时生成新闻趋势,支持精确风格布局控制和意图理解。


💰 加密货币currency

Meta 计划 2026 下半年推出稳定币支付,Stripe 为潜在伙伴

Meta 拟在 2026 年下半年集成稳定币支付,Stripe 作为试点伙伴,据 CoinDesk 报道。Meta 计划整合第三方供应商推出稳定币支付和新钱包,Stripe 为潜在合作伙伴,此前 Libra/Diem 项目于 2022 年关停。该计划标志着 Meta 重启稳定币支付布局。

Binance 与 Ondo Finance 合作上线代币化美股及 ETF

Binance 在 Alpha 平台上线 Ondo Finance 代币化美股/ETF,包括 Apple、Tesla、Nvidia 等。Binance 与 Ondo Finance 合作重推代币化美股及 ETF,如 AAPLon、GOOGLon、TSLAon、NVDAon 及 QQQon,不适用于美国用户。该合作扩展了代币化传统资产交易。

Stripe 年度信:稳定币支付规模达 4000 亿美元

Stripe 披露 2025 年稳定币支付同比翻倍至 4000 亿美元,60%为 B2B,收购 Bridge 交易量增长超 4 倍,稳定币使用与加密价格周期分化。该报告凸显稳定币在支付领域的快速增长和实际应用。

Vitalik 详述 Ethereum Foundation DeFi 愿景

Vitalik Buterin 发文阐述 EF 对 DeFi 支持:强调开源、隐私、安全,改善审计、预言机、AI 验证等,推动无许可全球金融。该愿景旨在通过技术提升 DeFi 生态的可靠性和包容性。

Kraken 推出首个受监管代币化股票永续期货

Kraken 推出代币化股票永续期货,首批包括标普 500、纳斯达克 100、苹果、英伟达、特斯拉及 SPDR 黄金 ETF,面向 110+国家非美用户,基于 xStocks 全额抵押。该产品为受监管的创新衍生品交易工具。

Canaan 以 3975 万美元收购 Cipher Mining 49%股份

Canaan 收购 Cipher Mining 德州三矿场 49%股权,3975 万美元,新增 120MW 电力容量和 4.4 EH/s 哈希率。该交易增强了 Canaan 在比特币挖矿领域的产能布局。

Blockchain Association 发布数字资产税收原则

Blockchain Association 提出小额交易免税额、稳定币视为现金、挖矿质押奖励处置时征税、不确认规则适用于未变经济敞口交易,支持退休账户投资数字资产。该原则旨在优化数字资产税收政策,促进行业发展。

Glassnode 数据显示比特币 60,000-70,000 美元区间积累超 40 万枚 BTC

Glassnode 数据显示,比特币下跌中 60,000-70,000 美元区间供应从 1 月 1 日 99.7 万枚增至 143 万枚,增幅 43%,占非交易所流通供应 8%以上。该数据反映投资者在该价位的大量积累行为。

YZi Labs 清仓 1354 万枚 AI 和 1111 万枚 WOO

YZi Labs5 小时前将 1354 万枚 AI(约 27.8 万美元)和 1111 万枚 WOO(约 17.6 万美元)转入 Binance,均为解锁代币。该清仓行动可能影响相关代币的市场供应。


🛠️ Tool Recommendations

Firecrawl 支持 8 种输出格式

Firecrawl /scrape 默认返回干净 Markdown,支持 Typed JSON、截图、原始 HTML、链接等 8 种格式,单请求可组合任意格式。

Claude Code 会话自动清理 30 天不活跃

Claude Code 默认删除 30 天不活跃会话,可通过设置 ~/.claude/settings.json 中的 cleanupPeriodDays: 99999 禁用。

Cloudflare 发布 vinext:无锁入 Next.js 替代方案

Cloudflare 推出 vinext,基于 Vite 保留 Next.js DX,支持多提供商部署,第一站点为联邦政府项目,FCP 降至 396ms

Cursor 云代理新增视频演示和验证功能

Cursor 代理可使用软件、发送视频证明、并行运行,支持 /repro 修复 bug 并生成视频。

OpenClawHugging Face 集成,支持本地数千模型

PiOpenClaw 代理集成 Hugging Face,无需离开电脑运行数千模型,已达 50 万用户9600 API 调用。

本地网页一键外网分享:cloudflared 隧道教程

安装 cloudflared 后运行 cloudflared tunnel --url http://localhost:3000,即可将 3000 端口服务快速暴露外网,支持 OpenClaw 等本地网页。

Toad 6.0.2 模糊文件搜索加速

willmcgugan 发布 Toad 6.0.2,模糊搜索在 Microsoft TypeScript 84K 文件仓库中实时过滤,通用 AI 终端支持 Markdown、多会话和恢复。

Mac Mini 上 OpenClaw 系列教程更新

Pluvio9yte 启动 OpenClaw Mac Mini 教程系列,覆盖安装、网络配置、浏览器自动化、刷推、生活助手等实战。

Distillate:终端研究炼金工具

DistillatearXiv 论文 转为 Zotero 库reMarkable 高亮Obsidian 笔记,GitHub 开源。

Firecrawl 推出 Browser Sandbox

Firecrawl Browser Sandbox 为 AI 代理提供零配置安全浏览器环境,支持 Claude CodeCodex 等,一键集成 web 流程。

apple-silicon-accelerometer 挖掘 Mac 传感器数据

GitHub 项目 apple-silicon-accelerometer 调用 IOKit 接口读取 M3 MacBook Pro 内置加速度计、陀螺仪和环境光数据,支持心跳检测。

Claude Code GSD 模式:亚马逊谷歌工程师用于解决上下文退化

Claude CodeGSD 模式通过 /gsd:new-project 命令,生成原子任务计划、并行子代理执行,保持主上下文 30-40% 利用率,支持 git 自动提交。

⭐ Review Loop 开源插件为 Claude Code 添加自动化代码审查

Review Loop 插件集成 Claude Code 工作流,自动调用 Codex 审查代码差异、结构、安全性和配置,支持并行 Agent 检查和反馈修复闭环。

Downdetector 网站故障实时监控平台

Ookla 旗下 Downdetector 聚合用户上报,地图显示 YouTubeX 等平台宕机分布,支持主流应用故障追踪。


📖 教程攻略

GitHub 3D 打印品牌模型教程

GitHub分享Universe活动 3D 打印流程:准备数字资产、嵌入磁铁处理重心、复杂悬垂处理。仓库提供完整资源。

Lizzieyzy 客户端围棋开狗教程

使用Lizzieyzy“同步-棋盘同步工具”选择对弈平台启用双向同步,即加载KataGO引擎实现“开狗”,野狐 AI 9D 不如开源KataGO


💎 技巧经验

Mac Mini 跑本地大模型配置推荐

Mac Mini至少24GB内存跑Llama 3.1 13B (Q4)Qwen 2.5 14BMixtral 8x7B64GB版跑Llama 3.3 70B8-12 tokens/s)、Qwen 2.5 72B


⚡ 工作流

⭐ 独立开发者 levelsio 分享 10 步无资金初创工作流

levelsio 10 年经验:选个人问题、周末发货、日收费、用 PHP/SQLite/VPS、自支持、自动化、公开构建、零烧钱率,拒绝股权交换。


🧠 深度思考

karpathy:CLI 是 AI 代理原生接口,结合终端工具构建仪表盘

Andrej Karpathy强调 CLI 作为“遗留技术”易被 AI 代理使用,如安装Polymarket CLI生成仪表盘。建议产品支持 CLI/MCP、Markdown 文档和 Skills 以适配代理。

AI 用户渗透率图表:全球 84% 人口未使用 AI

81 亿人口中84%(68 亿)从未用 AI,16%(13 亿)免费聊天机器人用户,0.3%(15-25 百万)付费20 美元/月0.04%(2-5 百万)用于编码。


📰 Industry News

xAI 对 OpenAI 商业机密诉讼被驳回:可于 3 月 17 日前修正投诉

旧金山联邦法官驳回 xAI 对 OpenAI 窃取 Grok 源代码诉讼,称未证明 OpenAI 诱导或使用机密;xAI 可至 3 月 17 日修正。

Cloudflare 一周内用 AI 重写 Next.js 为 vinext:构建快 4 倍、包小 57%

Cloudflare 用 AI 一周重构 Next.js 为 vinext(基于 Vite),构建加速 4 倍、包体积减 57%,一键部署 Workers,支持 ISR 和预渲染。将 Next.js 原生移植至 Workers,消除 Node.js 依赖,支持边缘优先架构,现已开源。

🔥【重磅】Meta 与 AMD 达成超 1000 亿美元 AI 芯片协议

Meta 与 AMD 达成 6GW 系统协议,首 1GW 2026 下半年交付,每 GW 营收数十亿美元,附 1.6 亿股认股权证(价值 10%股权);定制 MI450 加速器,无需额外流片,针对高容量内部工作负载。Meta 同意未来 5 年从 AMD 购买 6GW AI 芯片,包括 MI450 系列,使用 chiplet 设计优化推理。若 AMD 股价达 600 美元,Meta 获 1.6 亿股认股权证。AMD 授予 Meta 1.6 亿股(公司 10%),条件部署 6GW AMD GPU,超越客户关系。最高 1000 亿美元芯片协议,追逐个人超级智能。首 GW 产能 2026 年底上线,OpenAI 有类似协议。

Lucid 2026 年产量目标 2.5-2.7 万辆

Lucid Q4 营收 5.23 亿美元(超预期 4.68 亿),净亏 11.7 亿美元,2026 产量 2.5-2.7 万辆(+45%),低于分析师 3.3 万 预期。

SpaceX 从佛罗里达发射 Falcon 9,搭载 29 颗 Starlink 卫星入轨。

⭐ 五角大楼与 Anthropic AI 争端升级

Pentagon 要求 Anthropic 移除 Claude 防护栏,提供无限制军事访问,否则动用国防生产法强制开发 WarClaude。Anthropic 拒绝用于大规模监视或自主武器,截止日期周五。

Stripe 年处理量达 1.9 万亿美元,增长 34%

Stripe 2025 年总处理量 1.9 万亿美元,同比增长 34%。CEO Patrickc 预测软件转向即时定制,2026 Q1 或为奇点首季。

Cerebras 保密提交美国 IPO,目标 2026 Q2

Cerebras 估值 230 亿美元,与 OpenAI 签 100 亿美元多年协议,提供 750MW 推理算力至 2028 年。此前撤回 IPO 因依赖 G42。

CarGurus 数据泄露影响 1250 万账户

CarGurus 数据泄露波及 1250 万账户。

CoreWeave 寻求 90 亿美元 贷款,以 Meta 计算协议担保

CoreWeave($CRWV)寻求 90 亿美元 银行贷款,由与 Meta 长期计算协议担保。

⭐ 特斯拉 Cybertruck 双电机版价格将于 2 月 28 日后上涨

Tesla 宣布 Cybertruck Dual-Motor AWD($59,990)价格将于 2 月 28 日后上调,仅剩 4 天以当前价订购。

NHTSA 将于 3 月 10 日举办自动驾驶车辆重大活动

NHTSA 宣布 3 月 10 日自动驾驶研讨会,包括 DOT 领导演讲和行业面板,收集 ADS 车辆开发测试指导意见。

Profound 18 个月估值达 10 亿美元完成 C 轮 9600 万美元融资

Profound 获 Sequoia 等投资$96M C 轮,服务 700+企业包括 Walmart、Target,覆盖 10%财富 500 强,每员工估值$8.3M。

PyTorch 基金会新增 9 成员,代理 AI 需求推动增长

PyTorch 基金会自 2025 年 12 月新增 5 银牌(Clockwork Systems 等)和 4 准成员(Carnegie Mellon 等),强调开源 AI 栈如 vLLM 和 DeepSpeed 支持代理 AI。

Microsoft 与 Starlink 合作,在肯尼亚等农村部署,连接 450 社区中心,已超 2.99 亿人连接目标(原 2.5 亿)。针对 22 亿离线人口,构建 AI-ready 社区。

Qwen3.5-397B-A17B 登 Code Arena 开源模型前 7

Qwen3.5-397B-A17B 在 Code Arena 开源模型排名前 7,整体第 17,媲美 GPT-5.2 和 Gemini-3-Flash,测试真实 web 开发任务。

⭐ Waymo 在 4 新城市开启无人驾驶叫车服务

Waymo 今日起在达拉斯、休斯顿、圣安东尼奥及奥兰多向公众开放全无人驾驶叫车,总商业城市达 10 个,深化德州和佛罗里达布局。

⭐ Tesla Brookshire Megapack 工厂推进

Tesla 在德州 Brookshire 的 Megapack 工厂两大建筑(165 万平方英尺)售予机构投资者,100%长期租赁给 Tesla,用于 Megapack 电池系统制造。

Cybertruck 新订单交付延至 2026 年 9-10 月

民调 950 人(10.5%选民)订购 5.999 万美元 Cybertruck,总营收超 5700 万美元,美版交付日期昨晚更新为 2026 年 9-10 月,需求强劲。

Red Hat 与 NVIDIA 推出 AI Factory

Red Hat 与 NVIDIA 合作推出 AI Factory,整合 Red Hat AI Enterprise 与 NVIDIA AI Enterprise 软件,加速企业 AI 开发部署于 NVIDIA 加速基础设施。

SpaceX 与 Daka、Multimax、Soytechno 合作在委内瑞拉销售 Starlink 天线,标准套件 469 美元。

⭐ Nimble Way 获 4700 万美元融资

Nimble Way 完成 4700 万美元融资,为 AI 代理提供实时网页数据访问。

中国人民银行开展 6000 亿元 MLF 操作

中国人民银行 2 月 25 日开展 6000 亿元 1 年期 MLF 操作,连续 12 个月加量续做,保持流动性充裕。

苹果计划 2026 年从 TSMC 亚利桑那工厂采购超 1 亿枚先进芯片

苹果计划 2026 年从 TSMC 亚利桑那工厂采购超 1 亿枚先进芯片,并扩展休斯顿工厂 AI 服务器制造。这是 Mac mini 首次在美国生产。

阿联酋国民银行探索将比特币纳入投资组合

Emirates NBD 集团首席投资官 Maurice Gravier 表示,将 BTC 视为“数字黄金”,探索纳入组合,但市场波动下估值具挑战性。

🔥【重磅】微软 Sovereign Cloud 支持 AI 模型完全断开主权环境

Satya Nadella 在伦敦宣布 Microsoft Sovereign Cloud 新能力,允许客户将核心生产力工作负载和 AI 模型部署到完全断开环境中,提供本地控制和监管合规。

⭐ 苹果将部分 Mac Mini 生产转移至美国休斯敦富士康工厂

苹果计划今年晚些时候在休斯敦富士康工厂启动 Mac Mini 台式电脑生产,从亚洲转移部分产能。

中国首个人形机器人 Xueba 01 入学上海戏剧学院读博

学霸 01 成为上海戏剧学院戏剧与影视学全日制博士生,中国首例人形机器人攻读博士。


📚 前沿研究 & Papers

AI 构建 6 万种磁性材料数据库,发现 25 种高温稳定新型磁体

团队用 AI 创建包含 6 万种磁性材料的数据库,从中发掘 25 种高温稳定新型磁体候选材料,可降低电动车电机稀土依赖,提升供应链安全。

OmniDocBench 基准饱和:GLM-OCR 等达 94.6-95%但复杂文档仍失败,需注重语义正确性

GLM-OCR 在 OmniDocBench 达 94.6%准确率,Gemini 3、Kimi 5.2、GPT-5.2 等 VLMs 文档理解达 95%,基准已饱和。但复杂财务报告、法律文件等领域仍失败,基准忽略语义正确性,仅强调格式匹配。llama_index 分析指出需新基准注重语义评估,LlamaParse 可处理边缘案例。

AMD 与 Qwen 合作优化 MI300X 延迟

AMD 和 Alibaba Qwen 博客详述 Qwen3-235B TTFT 提升 1.67×、TPOT 2.12×;Qwen3-VL-235B TTFT 1.62×、TPOT 1.90×,采用 PTPC FP8(优于 BlockScale 15-30%)、TP8 并行、KV-cache 优化(15-20% 解码增益)。

Black Forest Labs 第三方风险评估:漏洞少 10 倍

Black Forest Labs 模型在发布前后缓解措施有效,漏洞比其他开源模型少 10 倍以上。

东京大学开发生物混合机器人皮肤

东京大学用穿孔锚固定实验室培养人类皮肤于机器人,支持愈合、伸展,形成表情,用于医疗和测试,未来加神经和汗腺。

EntelligenceAI 基准测试 8 款 AI 代码审查工具 F1 分数差距 34%

EntelligenceAI 在真实 PR 上测试 8 款 AI 代码审查工具,EntelligenceAI F1 47.2% 第一,Copilot 仅 22.6%,Graphite 垫底 13.4%。完整代码库开源。

Artificial Analysis 发布 2025 AI 年度报告

Artificial Analysis 发布 2025 AI 状态报告,总结推理模型主导、编码代理生产化、竞争加剧、图像/视频生成主流、语音到语音模型进步等 5 大趋势。

SWE-bench 多语言排行榜更新

SWE-bench Multilingual 排行榜比较 9 种语言软件工程性能,使用 mini-SWE-agent v2 评估,模型排名因语言差异显著。

AGENTS.md 文件研究:LLM 生成上下文降低编码代理成功率

新研究测试 Claude Code (Sonnet-4.5)、Codex (GPT-5.2/5.1 mini)、Qwen Code 在 SWE-bench 和 AGENTbench (138 实例) 上,LLM 生成 AGENTS.md 文件使成功率降 0.5-2%,推理成本升 20% 以上。建议省略 LLM 生成文件。

Standard Intelligence 发布 FDM-1,从 1100 万小时视频学习计算机控制

Standard Intelligence 发布 FDM-1,使用 1100 万小时互联网视频自动标注训练,支持 2 小时连续高分辨率视频,预测鼠标动作用于 3D 建模等视觉任务。

McKinsey 2025 报告:88% 组织使用 AI,股权投资达 1243 亿美元

McKinsey 报告显示,至 2025 年中,88% 组织至少一业务函数用 AI,较 2021 年超一半增长;AI 相关职位帖增 35%,股权投资 1243 亿美元。

OpenClaw 生态全景调研报告

涵盖 OpenClaw 从诞生到国内外平替生态全景,提供概念脑图和生态分析。


🚀 Product Launches

阿里千问发布 Qwen3.5 系列 4 款新模型:激活参数 3B 至 17B 全线覆盖

阿里千问发布 Qwen3.5 系列 4 款新模型,包括 Qwen3.5-122B-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B 及基模,原生多模态支持文本/图像/视频,上下文从 262K 扩展至 1M,Qwen3.5-35B-A3B 在安卓操控任务中得分 71.1%最高。同时推出 Qwen3.5-Flash,强调通过架构优化、数据提升和 RL 训练显著提高智能水平,中型模型系列全线覆盖激活参数 3B 至 17B,适用于多种场景。

🔥【重磅】Cursor 推出云端代理与演示视频功能

Cursor 重大升级推出云端代理计算机使用功能,支持代理接入代码库、使用云电脑修改代码,并发送视频演示而非 diff。超过一半 PR 来自网页,1/3 PR 已自主生成,支持 Slack/API 启动,低延迟远程桌面。新增 Demos 功能,代理支持云电脑修改代码并发送视频演示,CEO 确认远程桌面低延迟。同时举办 2/25 kentcdodds 工作坊。

⭐ Notion 推出 Custom Agents 自主 AI 团队

NotionHQ 发布 Custom Agents,支持自主任务执行、触发器/调度、全团队自动化,无需编码、数分钟设置,云端托管,支持 24/7 自主运行与业务应用集成,如 Linear 等,可切换最新 LLM(Claude 和 OpenAI 模型),多人协作、模型无关,适用于所有团队,包括 Engineering 和 Leadership。内部团队已使用,企业用户免费至 5 月 4 日,Ramp 代理已处理 4000 问题节省 2000 小时,可路由 bug、更新文档、起草周报。

⭐ Cognition 推出 Devin 2.2 云代理

Cognition 推出 Devin 2.2,支持代码测试、UI 点击验证、并行沙盒会话、会话录制,速度提升 200%,免费起步。重设计界面、VM 启动加速 70%、单步入驻、高分辨率虚拟桌面,修复数百 bug,支持计算机使用、自验证和自动修复。

Claude Code 新增 Remote Control:终端任务手机/浏览器无缝接管

Claude Code 支持 Remote Control,终端启动任务后用 App 或浏览器控制,本地保持运行,支持 Pro/Max 用户,多端同步对话和状态。

Claude Code 新增 Slack 插件:搜索消息、文档创建注入上下文

Claude Code 集成 Slack 插件,支持搜索、消息、文档创建,将 Slack 上下文注入 Claude Code,用于项目更新和问题解决。

🔥【重磅】MatX One LLM 芯片获 5 亿美元 B 轮融资,吞吐量超所有已公布系统

MatX 发布 MatX One 芯片,基于可分割脉动阵列结合 SRAM 低延迟和 HBM 长上下文,支持 LLM 更高吞吐和最低延迟。获 Jane Street 领投 5 亿美元 B 轮,100 人团队,一年内流片。投资者包括 karpathy 和 Marvell。

LiquidAI 发布 LFM2-24B-A2B 混合 MoE 模型

LFM2-24B-A2B 仅 2.3B 活跃参数,优化多代理管道,Together AI 提供 99.9% SLA、32K 上下文,支持 9 语言。

⭐ Google Opal 添加代理步骤与新工具

Google Labs 升级 Opal 无代码 AI 工作流构建器,新代理步骤自动调用 Veo 视频或搜索工具,新增记忆、动态路由和交互聊天。

SpaceX 公布 Starlink 蜂窝服务计划,用户峰值速度达 150Mbps,接近地面 5G 中位数(T-Mobile 309Mbps、AT&T 172Mbps)。

⭐ Notion 推出自定义 AI 代理,支持 Claude 和 OpenAI 模型

NotionHQ 发布 Custom Agents,基于触发器、指令和工具自主运行,集成 Linear 等,支持 OpenAI 和 Anthropic 最新模型。企业用户免费至 5 月 4 日,Ramp 代理已处理 4000 问题节省 2000 小时。

Tim Cook 宣布 Mac mini 年内首次美国本土生产

Apple 作为 6000 亿美元美国投资承诺一部分,Mac mini 将于 2026 年内在美国 Houston 工厂生产,同时扩产 AI 服务器并开设先进制造培训中心。

⭐ Coinbase 现支持股票交易

Coinbase 宣布用户可交易股票,向代币化权益愿景迈进,支持交易 8000+股票和 ETF,24/5 免佣,使用美元或 USDC,含碎股交易,与 Yahoo Finance 合作提供按钮。Brian Armstrong 称这是成为全球第一金融 App 的一步。

Perplexity 和 Comet 语音模式升级上线

Perplexity 和 Comet 今日推送语音模式升级,所有用户可用,支持完全免手动浏览器控制。

Vercel AI Gateway 支持视频生成

Vercel AI Gateway 新增 Grok Imagine 视频和图像免费生成至明日,开源 Creative Studio 使用 Next.js 和 v0,支持工作流可靠生成和向量搜索。

⭐ AMD 与 Meta 扩展合作部署 6GW Instinct GPU

AMD 与 Meta 战略合作扩展,部署 6GW Instinct GPU,涵盖硅片、系统和软件,帮助 Meta 大规模推进 AI 边界。

⭐ Runway 支持 AI 室内设计

Runway 用 Nano Banana Pro、Kling 3.0 及 Gen-4.5 将任意房间照片转为自定义设计,即日可用。

Oura 推出女性健康专属 AI 模型

Oura 推出专有 AI 模型专注女性健康。

Waymo 无人驾驶出租车扩展至达拉斯、休斯顿等 4 城

Waymo 在达拉斯、休斯顿、圣安东尼奥、奥兰多启动乘车服务,总计 10 个美国城市运营,用户可下载 App 报名。

🔥【重磅】Stripe 发布 2025 年度信,估值达 1590 亿美元

Stripe 平台 2025 年交易总额达 1.9 万亿美元(同比增长 34%),Revenue 套件年化收入 10 亿美元;公司以 1590 亿美元估值进行要约收购,提供员工流动性。

⭐ ProducerAI 正式加入 Google Labs

Google Labs 宣布 ProducerAI 正式加入,作为创意协作工具,支持音乐制作等场景。

⭐ MindPocket 开源 AI 书签系统

MindPocket 支持 RAG 知识库、私有部署,自动抓取正文生成摘要和标签;兼容 Vercel+Neon 一键部署,浏览器插件和多端 App。

Google DeepMind 推出欧洲机器人加速器,提供至多 35 万美元云信用

Google DeepMind 机器人加速器针对初创,提供 3 个月技术深潜、导师支持及至多 35 万美元 Google Cloud 信用,聚焦制造、健康等领域。

Claude Code CLI 2.1.52 更新修复 Windows VS Code 崩溃

Claude Code CLI 2.1.52 修复 Windows 下 VS Code 扩展崩溃问题(command 'claude-vscode.editor.openLast' not found)。


由 X-Crawler AI 生成于 2026-02-25 09:51

订阅天眼 · 掌握先机

解锁完整情报系统

登录后可访问全部历史日报、智能推文搜索、深度行业分析等高级功能。

分享

每日精选 · 直送邮箱

订阅天眼日报

AI 精选科技要闻摘要,每天一封,免费无广告。