天眼日报

科技 · 每日情报2026年02月06日57 分钟阅读
来源:3239 条精选推文·Lanyun·DeepSeek 生成·2026-02-05 — 2026-02-06
分享
科技 日报封面
AI 速读24 条精选
🤖头条Anthropic发布Opus 4.6

1M上下文与代理团队能力大幅提升长程编码和复杂任务处理,刷新多项基准,直接改写AI开发工具竞争格局。

🤖头条OpenAI推GPT-5.3-Codex

编码基准显著领先并提升速度和成本效率,还强化网络安全能力,巩固OpenAI在AI编程赛道的头部优势。

🤖头条OpenAI上线Frontier企业平台

将AI代理团队接入CRM和数据系统,瞄准企业级生产部署,意味着AI从聊天工具进一步走向组织级协作基础设施。

📰头条亚马逊拟投2000亿美元扩AI

超预期资本开支几乎重塑云与AI基础设施军备竞赛,显示巨头正以前所未有规模押注算力与AWS增长。

🤖头条GPT-5接入实验室降本40%

AI闭环驱动自动化实验把蛋白生产成本压低40%,证明大模型正从数字世界深入改造生物研发流程。

头条比特币跌破6.1万美元

加密市场受科技股与风险偏好冲击剧烈下杀,24小时爆仓超20亿美元,反映高波动已外溢至更广泛风险资产。

📦OpenBMB开源全双工语音模型
Tether收购Bitdeer约12%
🏛Gemini退出欧洲和澳洲
📰Tether用户破5.3亿
MicroStrategy持币超71万枚
Bitwise申请Uniswap ETF
🤖Google披露1月AI更新
🤖ChatGPT下载和月活回升
🤖Perplexity推三模型并行推理
🤖Kling 3.0升级多镜头视频
🤖Cursor展示长程代理实验
🛠Laravel发布AI SDK
📦微软开源LiteBox沙箱系统
📰Cloudflare支持向机器人收费
📰Reddit四季度业绩超预期
📰Tesla进入非洲市场
🦾马斯克详述Optimus训练计划
🦾Tesla称Optimus手部达人类级

🤖 AI 大模型

Anthropic 发布 Claude Opus 4.6,支持 1M token 上下文、Agent Teams 和多项基准 SOTA

Anthropic 推出 Claude Opus 4.6,核心升级包括 1M token 上下文(Beta)、128k 输出、更严谨逻辑规划、代码自我纠错、长时 agent 任务支持和大代码库操作。新增 Agent Teams 功能,支持多个代理实例并行协作、互发消息,适用于 PR 审查、bug 排查和大型代码库任务(如 Claude Code 中通过 CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 启用)。在 Terminal-Bench 2.0 得分 65.4%、GDPval-AA 达 1606 Elo(领先 GPT-5.2 144 Elo)、BrowseComp 84.0%、ARC AGI 2 68.8%、SWE-Bench Pro 等基准领先。工程博客详述使用代理团队自主构建 C 编译器,两周后成功编译 Linux 内核,展示自主软件开发潜力。Cursor 集成优化长任务代码审查,峰值 1000+ commits/小时;OpenRouter 上线提供高可靠性;集成 GitHub Copilot、Figma、Notion、Excel/PowerPoint;Claude Code 新增/insights 命令生成使用报告。SemiAnalysis 称其为拐点,改变开发格局。定价$5/$25 每百万 Token,现已在 Claude.ai、开发者平台和云平台开放。

OpenAI 发布 GPT-5.3-Codex,Terminal-Bench 2.0 达 77.3%、SWE-Bench Pro 57%

OpenAI 推出 GPT-5.3-Codex 编码模型,Terminal-Bench 2.0 得分 77.3%(超 GPT-5.2 64.0%和 Opus 4.6 65.4%)、OSWorld-Verified 64.7%、SWE-Bench Pro SOTA 57%。支持实时交互协作、任务中途转向、从零构建复杂游戏;token 消耗减半、速度提升 25%-40%(总 2.93 倍)。首个网络安全 High 能力模型,直接识别软件漏洞,承诺 1000 万美元 API 信用。Zed 通过 Codex ACP 适配器支持 Zed Pro 用户。企业首批客户包括 Uber、Intuit;用于自身开发调试,支持所有付费 ChatGPT 计划,API 即将上线。发布后 Anthropic 迅速推出竞品。

OpenBMB 发布 MiniCPM-o 4.5,支持非阻塞全双工语音对话

OpenBMB 推出 MiniCPM-o 4.5 大模型,首个开源全双工全模态 LLM,支持一边回答一边收听的实时语音交互,同时处理视觉、听觉和语音。可本地部署于 RTX 4090,C++高效版可用;OpenCompass 平均得分 77.6,多模态性能第一梯队。海外开发者好评,项目地址 https://t.co/DL4h3aNCPr。

OpenAI GPT-5 连接自主实验室,蛋白质生产成本降 40%

OpenAI 与 Ginkgo 合作,将 GPT-5 接入自主实验室,设计实验、执行 36,000+反应组合、跨越 580 自动化板,进行 6 次迭代闭环优化。将细胞游离蛋白合成成本降低 40%,识别人类未测试的低成本反应组合,推动生物工作流加速。

Kaggle 2026 游戏竞技场结果:GPT-5.2 赢扑克,Gemini 3 Pro 称霸狼人杀与象棋

Kaggle 首届 2026 游戏竞技场结束,GPT-5.2 获扑克冠军,Gemini 3 Pro Preview 赢得狼人杀与象棋。发布完整数据集、环境代码与日志,支持分析模型决策与自定义基准。

Cursor 发布长运行编码代理研究,峰值每小时 1000+提交

Cursor 分享长时编码代理实验,一周运行中峰值达数百代理每小时超 1000 次提交。系统模拟软件团队结构,包括规划者和工作者;强调实验性高成本,但预示软件开发变革。提供早期研究预览,支持 Cursor 内测试。

Laravel AI SDK 正式发布,支持代理、图像、音频等多功能

Taylor Otwell 发布 Laravel AI SDK,支持 agents、图像生成、音频转录、嵌入和 pg_vector,简化 Laravel 应用集成 AI 功能。4 周内稳定版发布,欢迎开源贡献。

Remote Labor Index:Opus 4.5 自动化 3.75%远程劳动项目

CAIS 发布 Remote Labor Index,Opus 4.5 自动化 3.75%远程劳动项目,GPT-5.2 位列第二。评估 AI 代理自动化数字劳动能力。

LlamaIndex 启动 Document Agent Olympics 竞赛,总奖池 600 美元

LlamaIndex 举办 Document Agent Olympics,构建文档代理处理 PDF、发票、简历等,3 周内最佳代理获 200 美元 x3。需部署 LlamaCloud。

OpenAI 推出 Frontier 平台,支持企业构建 AI 代理团队

OpenAI 发布 Frontier 平台,帮助企业构建、部署和管理 AI coworker,支持 Codex 驱动代理访问企业工具、共享上下文、持续学习和权限控制。整合 CRM、数据仓库等系统,缩短 POC 到生产时间。合作伙伴包括 Oracle、Uber、State Farm、Thermo Fisher、Intuit、HP;首批采用者有 T-Mobile、Cisco、BBVA。制造商称 6 周工作缩短至 1 天。

Perplexity 推出 Model Council,支持三模型并行推理

Perplexity 发布 Model Council,同时运行三个前沿模型,比较输出并合成更准确答案。现向 Max 订阅用户开放,仅限网页版。

VoyageAI 发布 voyage-4-nano 开源嵌入模型

VoyageAI 推出首款开源权重 voyage-4-nano 嵌入模型,与 voyage-4-large 共享嵌入空间,支持 MRL 和 int8 量化。Apache 2.0 许可,现于 Hugging Face 可用。

Skywork Desktop 推出本地 AI 协作者,支持多模型路由和 100+技能

Skywork_ai 发布 Windows 桌面应用,构建本地语义索引,支持 PDF/Docs/Slides 等文件查询。集成 Anthropic/Google 前沿模型,100+技能覆盖文档/网页/图像/视频生成,本地沙箱运行无云泄露风险。

Kling AI 3.0 正式发布,支持多镜头和原生音频

Kling AI 推出 3.0 版本和 Omni 3.0,支持 3-15 秒多镜头序列、多角色原生音频、视频角色参考和一致声音。Ultra 订阅用户立即可用,Higgsfield AI 平台提供访问。

ChatGPT 2026 年首月下载与月活双增长

ChatGPT 结束 2026 年 1 月,App 下载首现增长(此前三月连降),MAU 连续第二月增长。

mlx-lm 最新版支持 DeepSeek v3 加速,长上下文提升 2.5 倍

mlx-lm 更新添加 Kimi K2.5、Step3.5 flash 模型,支持分布式推理;DeepSeek v3 长上下文加速超 2.5 倍,内存效率更高。

10 种策略减少 MCP 令牌膨胀

Merge CTO Gil Feig 分享 MCP 工具膨胀优化策略:设计专注工具、最小化上下文、渐进披露、子代理等。Merge 团队观察工具元数据占 40-50%上下文,优化后令牌使用降 30-60%,提升响应速度。

Anthropic 工程博客:量化代理编码评估中的基础设施噪声

Anthropic 博客分析基础设施配置导致代理编码基准波动数个百分点,有时超过顶级模型间差距。Opus 4.6 展示自适应思考,减少延迟提升质量。


💰 加密货币currency

疑似特朗普家族 DeFi 项目 WLFI 出售 73 WBTC 还贷

WLFI 关联地址于 21:43 UTC+8 出售 73 枚 WBTC504 万美元),偿还 Aave 贷款,现持 1.33 万 WETH267 WBTC 担保及 2518.4 万 USDC 债务。

⭐ 科技股崩跌波及亚太,比特币暴跌至 6.1 万美元以下,24h 爆仓 23 亿美元

比特币受美股科技股及 AI 支出担忧影响,亚太时段暴跌至 6.1 万美元以下,日内最大跌幅 12%至 6.3 万美元,最低触及 6 万美元,较 2025 年 10 月高点 12.6 万美元下跌超 52%,自高点回撤 40%。24 小时全网爆仓规模达 17-23 亿美元,多单爆仓 15 亿美元为主,清算区间 1574-1681 美元,40 万人爆仓。易老板将 8000 ETH(1480 万美元)转入币安减仓,比特币跌破 70k、65k 等多重支撑,期权隐含波动率飙升至 100%(年初翻倍)。韩国综合指数暴跌 5%,CryptoQuant 显示美国比特币 ETF 转为净卖出。MicroStrategy 持仓 713502 枚 BTC 浮亏超 46 亿美元,市场恐慌加剧。

Tether1.5 亿美元收购Bitdeer12%股权

Tether Investments宣布1.5 亿美元收购Bitdeer12%股权,建立长期合作,将XAU₮黄金稳定币接入平台,并探索USD₮/USA₮购买实物黄金。

Gemini关闭英国、欧洲和澳大利亚账户

Gemini将于2026 年 3 月 5 日起关闭英国、欧洲经济区和澳大利亚客户账户,转为仅提现模式,一个月后全面关闭。除英国外影响所有欧洲和澳洲用户。

Tether Q4 新增 3520 万用户,总数达 5.345 亿,USDT 市值创 1873 亿美元纪录

Tether2025 年 Q4 新增3520 万用户,全球总数5.345 亿USDT市值达1873 亿美元纪录高点,尽管市场下行。

Aster 完成 S4+S5 阶段 100% 回购代币销毁

Aster 执行 98,400,345.46 枚 ASTER 永久销毁(S4 53,920,060.26 枚、S5 44,480,285.20 枚),销毁地址 0x…dEaD,S6 回购进行中。

MicroStrategy持有713502 枚 BTC,成本542.6 亿美元

MicroStrategy Inc.截至2026 年 2 月 1 日持有713502 枚 BTC,总成本542.6 亿美元,均价76052 美元。2025 年融资253 亿美元,Q4 净亏损124 亿美元

比特币 hash price 跌至历史低0.03 美元/TH,难度下调超13%

彭博社报道,比特币矿业hash price降至历史最低0.03 美元/THLuxor数据),双周挖矿难度下调逾13%。比特币跌破7 万美元、能源成本升及冬季风暴致多矿企关机,美股矿企股价走弱。

币安 Alpha 将于 2 月 5 日上线 Rainbow (RNBW),支持 Alpha 积分空投

Binance官方宣布Alpha 平台首发Rainbow (RNBW),交易开放后符合条件用户使用Alpha 积分领取空投,详情即将公布。

不丹转移2230 万美元比特币,持仓降至5700 BTC

不丹本周向QCP Capital转移2230 万美元比特币,持仓从 2024 年 10 月13295 BTC降至5700 BTC

Bitwise提交Uniswap ETF S-1,由Coinbase托管

BitwiseSEC提交Uniswap (UNI)现货ETF注册,由Bitwise Investment Advisers管理、Coinbase Custody托管。目前不质押,未来可能修订引入。

Kraken推出xStocks:银$SLVx、铜$COPx等商品曝光

Kraken新增Silver $SLVxCopper $COPxPlatinum $PPLTxPalladium $PALLx,支持通胀对冲和 AI 基础设施。

Kraken 上线 Rainbow (RNBW)现货交易

Kraken上线$RNBW现货,支持Rainbow.me Web3 钱包;RNBW-USD交易对待流动性条件开放。

Tempo 支持任意稳定币支付交易费,无需波动 gas 代币

Tempo支持USD计价TIP-20 稳定币支付交易费,集成BridgeFraxMetaMask等基础设施。费用在交易或账户级选择,支持Fee AMM自动转换。

Bullish 2025 财年数字资产销售额 2448 亿美元,四季度净亏损 5.64 亿美元

Bullish财报显示2025 年销售额2448 亿美元(同比降2%),Q4销售额643 亿美元GAAP 净亏损 5.64 亿美元调整后 EBITDA 4450 万美元

币安上线 5 个股票永续合约

币安将于2026 年 2 月 9 日 22:30(UTC+8)上线MSTRUSDTAMZNUSDT5 个股票 U 本位永续合约,最高10 倍杠杆。

TetherAnchorage Digital投资1 亿美元股权

Tether Investments投资1 亿美元Anchorage Digital Bank,支持托管、质押、稳定币发行,美国首家联邦监管数字资产银行。


🛠️ Tool Recommendations

⭐ OpenClaw 和 Pi:极简 AI 编程代理及其 Agent 哲学

Pi 是 OpenClaw 背后的极简 AI 编程代理,核心提示词极短,仅四个工具(读/写/编辑/运行 Bash),支持扩展状态持久化、树状会话、热重载。不支持 MCP,可用 mcporter 转换 CLI,鼓励代理自我扩展。OpenClaw 基于 Pi 构建 Telegram 机器人。作者深度对谈 Agent 哲学:强调最小系统(LLM+工具)、Bash 优先、安全风险如 prompt injection。记忆对编码 Agent 非必需,脚本优于 MCP,支持热更新和自愈。

自托管客服台单二进制部署

自托管客服工具单二进制,支持快速部署。

⭐ Loupe:面向 AI 开发者的 Mac UI 探测器

Loupe 将 Mac 软件界面转换为 Claude、GPT-4、Cursor 等 AI 可读结构化代码数据,支持 AI Agent UI 分析。

Thaw:Ice 分支的 macOS 菜单栏图标管理工具

Thaw 开源 macOS 菜单栏图标管理,支持拖拽排序、隐藏图标,Ice 维护不活跃后新分支。

Windsurf 添加 Opus 4.6 支持和免费 Arena 模式

Windsurf 集成 Opus 4.6 自适应思考,修复 Opus 4.5 无法处理 bug,Arena 模式免费至周日,支持 Frontier、Hybrid、Fast 组。

Obsidian 1.11.7 更新:移动端全屏、浮动导航和滑动侧边栏

Obsidian 1.11.7 新增移动设置:全屏阅读隐藏界面、浮动导航按钮、滑动侧边栏,桌面和移动均可用。

nanobot:超轻量开源个人 AI 助手,支持多 LLM 和渠道接入

HKUDS 开源 nanobot,仅 4000 行代码,支持 OpenRouter/Anthropic/OpenAI/DeepSeek/Gemini/Groq 等多 LLM、本地 vLLM、多渠道(Telegram/WhatsApp/飞书)、网页搜索、定时任务、持久记忆。pip 安装+JSON 配置即可部署,适用于市场分析/开发辅助。

微软开源 LiteBox:基于 Rust 的沙箱库操作系统

微软开源 LiteBox,Rust 实现的沙箱库操作系统,用于安全隔离执行。

Cloudflare x402 模板更新,支持向机器人收费保护网站

Cloudflare 更新 x402 模板,使用 bot score 区分人类与机器人,允许 oai-searchbot、claude-searchbot 免费访问,其他机器人收费。支持自定义允许列表。

Acontext 开源 AI Agent 上下文平台

Acontext 统一存储对话历史、文件系统、技能包和沙箱。支持上下文工程(摘要/编辑)、监控仪表盘。技能来自 agentskills.io 和 Anthropic 官方。

⭐ Dokie 一键生成可编辑 PPT

Dokie 支持上传文档输入要求,选择页数/模板/动画,一键生成大纲及完整 PPT,导出 pptx/PDF/PNG,含动画效果。

ViteLand 1 月更新:vite 达 30 亿 npm 下载

Vite 突破 30 亿 npm 下载,Rolldown 达 RC 状态,支持 Lazy Barrel Optimization,Oxfmt 100% Prettier 兼容。

Proxify:进程流量重定向至代理,支持 CLI 配置

Proxify 工具将进程流量通过代理重定向,CLI 操作简单,支持自定义配置。

⭐ Claude Skills 工作流分享

yaohui12138 分享 7 个 Claude Skills:基建(skill-creator)、开发(UI UX Pro Max、Planning-with-files)、内容(seo-review、content-creator),含自定义 ai-image-generator。强调从工作流沉淀 Skills,提供创建路径。

Codag 可视化 AI 工作流

Codag 无需配置可视化代码库中 AI/LLM 工作流,映射 LLM 调用、决策分支和数据处理。

ForgetUrl:AI 助力开发的在线书签管理工具

支持 GitHub/谷歌 登录、Chrome 书签导入、子链接 聚合过滤(如服务多环境)、拖拽移动、多种搜索。特色:子链接选中替换地址,ForgetURL 原创功能。


📖 教程攻略

GPT-5.3-Codex 升级教程:npm 安装 0.98.0 版并切换模型

升级Codex0.98.0npm install -g @openai/codex@latest;执行/model命令选择gpt-5.3-codex即可使用。

Kling 3.0 提示词指南:多镜头生成、音频对话控制

Kling 3.0指南:镜头思维生成6 镜头序列,早锚定主体保一致,明确运动描述+原生音频对话控制,提升结果质量。


💎 技巧经验

普通人靠 AI 逆袭:4 位创业者案例分享工具和工作流

文科生用CodeBuddy11 万行代码建 APP;用元宝+Suno+Vidu朱牛马IP;Creaibo腾讯云 ESAI 创作;导演用混元+Nano Banana特效。

MoveSpeed 400GB TF 卡二手 150 元性价比高

MoveSpeed(奥海子公司)400GB U3卡,实为闪迪 SC400 TLC,顺序写50MB/s、随机读1900 IOPS,达A1级。闲鱼150-185 元,适合非重要存储。


⚡ 工作流

Claude Opus 4.6 提升 AI 开发工作流,从 200K 到 1M 上下文

Claude Opus 4.6Cursor上支持1M token上下文,一次加载80 文件代码库,发现16 个 bug并修复14 个,总耗时20 分钟,无需分任务交接文档。


🧠 深度思考

Figma CEO Dylan Field 分享创始人 6 大建议

Figma CEO Dylan Field建议:1.独特洞见勿复制;2.自我觉察;3.谦逊面对挫折;4.适应变化;5.选择 10-20 年长期问题;6.立即启动。

技术债积累成企业危机,需固定容量优先处理

Ghostinit0x分析技术债模式:临时解决方案成永久,优先级总被新功能挤占。建议每冲刺固定20%产能维护技术健康,避免系统崩溃。

LLM 算法进步大图景

Steven Byrnes拆解 LLM 进步:Transformer优化3-5 倍、优化20 倍上限、数据改进、RLHF 等非效率变化;质疑Epoch AI/Dario指数训练效率声明。


💡 Life Advice

7 种快速恢复能量方法:散步、AI 聊天、5 分钟放松等

低能量时散步 15 分钟改善大脑缺氧;AI 聊天查漏补缺、头脑风暴;5 分钟听声音放松;维护回血清单;建立正向社交;去自然中;制作奖励日历


📰 Industry News

亚马逊 Q4 营收 2134 亿美元超预期,2026 年资本开支达 2000 亿美元投 AWS AI

亚马逊 Q4 营收 2134 亿美元(预期 2113 亿),EPS 1.95 美元(预期 1.96),AWS 销售 356 亿美元(预期 349 亿),广告 213 亿美元。2026 年资本开支预计 2000 亿美元,超分析师预期 1500 亿,主要用于 AWS AI 基础设施。AWS 过去一年新增 3.9GW 容量(相当于 4 个核电站),Q4 单季 1.2GW,积压订单 2440 亿美元(同比增 40%),AI 基础设施需求超供应,Trainium 年化营收数十亿美元全订阅,Trainium2 交付 140 万颗,Trainium3 性价比提升 40%。财报后股价盘后跌 10%。

大厂 2026 年 capex 总计 6330 亿美元超瑞典 GDP

亚马逊 2000 亿、Alphabet 1850 亿、Meta 1250 亿、微软 1100 亿、苹果 130 亿,总计 6330 亿美元,超过瑞典 GDP。

BYD 市值蒸发 600 亿美元,中国 EV 需求冷却

BYD 股价本周跌 7%,5 月来市值损失超 600 亿,每车额外成本 1000 美元,CLSA 警告盈利下调。

Google 2026 年 1 月 AI 重大更新:Gemini 3、Veo 3.1 等

Google 1 月 AI 更新包括:Gemini App 个人智能、Gmail 升级、Chrome 集成 Gemini 3、Search AI 模式跟进问答、Veo 3.1 提升一致性。扩展 Google AI Plus 至 35 国,包括美国。

Reddit Q4 营收 7.26 亿美元超预期,DAU 1.214 亿

Reddit Q4 营收 7.26 亿美元(预期 6.67 亿),EPS 1.24 美元(预期 0.93),EBITDA 3.27 亿美元,DAU 1.214 亿(预期 1.202 亿)。授权 10 亿美元回购。

OpenAI Frontier 平台上线,企业 AI 协作者连接 CRM 工具

OpenAI Frontier 连接 CRM/数据/工具,AI 代理支持推理/代码/文件操作,自带身份/权限。客户:HP(6 周→1 天)、Intuit(销售时间+90%)、能源公司(输出+5%=$10 亿)。启动客户 HP/Intuit/Oracle/State Farm/Uber。

Tesla 中国版新增 Hey Tesla 唤醒词,支持空间感知

Tesla 中国版添加 Hey Tesla 唤醒,全舱监听+智能定位语音来源。

Tesla 首次进军非洲市场,摩洛哥开启 Model 3/Y 销售

Tesla 正式在摩洛哥开启 Model 3 和 Model Y 销售,2026 年 7 月开始交付,标志非洲市场首入。

Elon Musk 详述 Tesla Optimus 训练计划:1 万-3 万机器人自玩

Tesla 建 Optimus Academy,部署 10,000-30,000 机器人现实自玩,结合物理准确模拟器关闭仿真-现实差距。

Tesla Optimus 机器人手部实现人类级自由度

Elon Musk 采访透露,Tesla Optimus 手部具备人类级自由度,使用定制执行器、电机、齿轮、电源电子与传感器。未见其他演示机器人达到此水平。

央行开展 315 亿元 7 天期+3000 亿元 14 天期逆回购

中国人民银行 2 月 6 日开展 315 亿元 7 天期逆回购(利率 1.40%)、3000 亿元 14 天期逆回购。

美团拟 7.17 亿美元收购叮咚买菜中国业务,最高 9.97 亿美元

美团与叮咚买菜签订协议,收购其中国业务 100%股权,初始对价 7.17 亿美元,最高 9.97 亿美元。叮咚 2025Q3 营收 66.6 亿元,连续 7 季盈利,全年实现盈利。交易提升美团华东市场和供应链,获 1000 个前置仓和 700 万用户。

小马智行与摩尔线程战略合作,推进 L4 自动驾驶

小马智行与摩尔线程合作,基于 MTT S5000 智算卡和夸娥集群,训练世界模型和车端模型,实现算法-数据-算力-应用全链路协同。

Y Combinator 恢复投资加拿大公司

Y Combinator 恢复接受加拿大公司,投资范围包括美国、加拿大、开曼、新加坡公司。

Steam Machine 延期发售,因内存存储涨价

Valve 宣布 Steam Machine、Frame 头显、Controller 延期至 2026 上半年,因内存和存储价格上涨,无法锁定原定价。

苹果收缩虚拟健康教练 Mulberry 项目

苹果叫停 Mulberry AI 健康教练项目,将功能整合至现有健康 App。

三星扩大 HBM4 用 DRAM 产能,2026Q1 月产 10-12 万片晶圆

三星计划 2026 年将 10nm 1c DRAM(HBM4 用)产能提升 170%,韩国平泽工厂 Q1 月产 10-12 万片,当前产能 7 万片。

李飞飞:大语言模型无法通往 AGI,空间智能是关键

李飞飞称语言仅 50 万年进化史,空间智能源于 5 亿年前;World Labs 首款 Marble 模型生成可导航 3D 世界,用于游戏、机器人训练。

NVIDIA 警告出口管制风险破坏 H200 需求

NVIDIA 警告特朗普政府,中国芯片出口规则过严,可能摧毁 H200 AI 芯片需求。合规要求对阿里/字节过重,或利好华为。

Substack 确认 2025 年 10 月数据泄露,影响用户邮箱和手机号

Substack CEO Chris Best 确认 2025 年 10 月数据泄露,影响用户邮箱地址和手机号,未涉及信用卡或密码。黑客在 BreachForums 泄露 697313 条记录。

Waymo 扩展至 Boston 与 Sacramento

Waymo 进驻 Boston 和 Sacramento,铺设自动驾驶叫车服务基础。

美国至 1 月 31 日当周初请失业金人数 23.1 万超预期

初请失业金升至 23.1 万人(预期 21.2 万,前值 20.9 万),持续申请达 184 万,受冬季天气影响。

欧洲央行维持三大利率不变

存款机制利率 2%、主要再融资利率 2.15%、边际贷款利率 2.40%不变,连续第五次会议按兵不动。

Google Q4 订阅收入增长,YouTube 2025 年营收达 600 亿美元

Google 订阅服务 Q4 增长,YouTube 2025 年营收 600 亿美元。

OpenAI 计算资源从 2023 年 0.2GW 激增至 2025 年 1.9GW

OpenAI 计算从 2023 年 0.2GW 增至 2025 年 1.9GW,世界需数量级更多计算。

Wintermute CEO:公链争论无意义,行业仍乐观

Wintermute CEO Evgeny Gaevoy 称 SOL 与 ETH 争论无意义,无链上重要事件;稳定币中心化;永续合约无法扩展;比特币迷失币价上涨;代币设计崩溃,但行业乐观。

全球内存短缺,高通 Arm 齐发预警,DDR5 64GB 涨至 790 美元

高通 CEO Cristiano Amon 警告 HBM 短缺将限制 2026 智能手机产量,部分客户下调出货 20%。TrendForce 预测 70%高端内存被数据中心吸纳,英特尔 CEO 陈立武称短缺持续。DDR5 64GB 内存条价从 145 美元涨至 790 美元。

Conduent 数据泄露影响数百万美国人个人信息和健康数据

Conduent 勒索软件攻击窃取数百万美国人个人信息和健康数据,该公司处理 1 亿人数据。

沃尔玛市值突破 1 万亿美元

沃尔玛股价今年涨幅超标普 500,周二市值达 1 万亿美元,成为科技巨头外少数成员。全球门店近 1.1 万家,跻身英伟达、苹果等俱乐部。

NASA 将 Artemis II 发射推迟至 3 月,因液氢泄漏

NASA 原计划 2 月 5 日发射 Artemis II 绕月任务,因燃料加注时液氢泄漏问题推迟至 3 月。工程师排查接口泄漏未果。


📚 前沿研究 & Papers

Kaggle Game Arena 测试 AI 软技能

Google/Kaggle 推出 Kaggle Game Arena,使用扑克和 Werewolf 游戏作为基准测试 AI 软技能,创建沙盒环境评估 AI 能力。结果分析包括扑克中的诈唬行为等软技能表现。

Anthropic Claude 4.6 Opus 系统卡:生产力提升 30%-700%,均值 152%

Anthropic 发布 Claude 4.6 Opus 系统卡,估算生产力提升幅度为 30%-700%,均值 152%、中位数 100%,支持 1M token 上下文长度。该系统卡详细评估了模型在各种任务中的性能提升。

Pacific Fusion 开发更廉价聚变反应堆技术

Pacific Fusion 找到更廉价的聚变反应堆方案,通过创新技术降低聚变能开发的成本,推动聚变能源的商业化进程。

Linch:AI 灾难最简案例,四点论证超级智能风险

Linch 在 LessWrong 上发布文章,以四点论证超级智能风险:超级 AI 将优于人类所有任务,成为真实世界目标追求者;无法精确指定目标,仅靠塑造过程;可能导致人类灭绝作为预防措施或副作用。OpenAI、DeepMind 等公司 CEO 确认相关目标对齐挑战。

ChipBook 监测全球光刻机交付,中国增幅最大

ChipBook 追踪全球光刻设备流动数据显示,中国最近交付量增幅最大,超过台湾和韩国,反映半导体制造产能扩张趋势。

AI 代理经济 BOTEC:半衰期 5 小时下长任务成本指数爆炸

LessWrong 文章结合 Ord 半衰期模型与推理成本进行 BOTEC 分析:在 5 小时半衰期下,8 小时任务 AI 代理成本 597 美元(人类 1200 美元),40 小时任务飙升至 243K 美元(人类 6K 美元)。成本降低呈线性,而半衰期效应指数主导,强调需持续学习机制突破瓶颈。

ByteDance Protenix-v1 开源模型超越 AlphaFold3

ByteDance 发布 Protenix-v1,这是首款完全开源蛋白质结构预测模型,在多样基准测试中超越 AlphaFold3,同时遵守相同的训练数据截止日期、模型规模和推理预算。

限制蛋白质摄入增强线粒体自噬,延缓肥胖心脏衰老

路易斯安那州立大学研究发表于《衰老细胞》期刊,发现饮食蛋白质限制(DPR)无需减少总热量摄入,即可激活心肌线粒体自噬、降低慢性炎症,维护肥胖模型心脏结构和功能,延缓衰老过程。

小 LLM 团队匹敌大模型:Mixture-of-Models 论文

arXiv 论文 Mixture-of-Models 提出小 LLM 通过 N-Way Self-Evaluating Deliberation 循环互评改进共享答案,使消费级小模型性能匹敌顶级大模型。

LLM 光谱与负责任使用

Martin Janiczek 讨论 LLM 光谱概念及其与负责任使用相关的含义,探索不同 LLM 能力水平下的部署和伦理考虑。

准备预警射击:AI 安全预警机制探讨

Noah Birnbaum 在 LessWrong 上探讨 AI 安全预警射击:迭代开发、锯齿状能力曲线、缓慢起飞等因素削弱无预警灾难假设。强调政治重要性,模糊预警可能引发过度或不足反应,建议预先承诺机制、预测研究和政策备忘录。

Horizon-LM:RAM 中心架构支持单 GPU 训练 120B 参数 LLM

Horizon-LM 架构将主机 RAM 作为参数存储,GPU 仅负责瞬态计算。在单 H200 GPU + 1.5TB RAM 下训练 120B 模型;单 A100 机器上吞吐量超过 DeepSpeed ZeRO-3 12.2 倍。arXiv:2602.04816。

Notepad++去年供应链攻击影响多国机构

卡巴斯基报告显示,Notepad++在 2025 年 7-10 月遭受三条感染链供应链攻击,受害者包括越南 IT 公司、菲律宾政府和萨尔瓦多金融机构。恶意 GUP.exe 发送心跳包触发第二阶段载荷。

ZetaSQL 开源项目更名为 GoogleSQL

Google 将开源项目 ZetaSQL 更名为 GoogleSQL,以统一命名。代码、功能和团队不变,继续用于 BigQuery 和 Spanner,内部一直称为 GoogleSQL。

LibreOffice 26.2 版本发布

LibreOffice 26.2 发布,取消社区版品牌区分。Writer 优化拼写检查,Calc 增强 Excel 2007+格式支持和性能,Base 新增多用户支持。


🚀 Product Launches

VISI0 上线,一键将小说转为视频

VISI0 故事渲染平台用 AI 分析人物、场景,一键生成分镜、视频、对白、配乐,保持一致性。Claude Code 实现 49,646 行代码,开发 11 天。

Tesla 申请 Cybercar 和 Cybervehicle 商标,Cybertruck 获 V2G 支持

Tesla 提交 Cybercar 和 Cybervehicle 商标,用于禁“Cab/Taxi”州推出 Cybercab。德州/加州 Cybertruck 即将支持 V2G(Powershare),高需求时回馈电网获能源账单抵扣。

Together AI 发布 Python SDK v2.0

Together AI 推出 Python SDK v2.0,pip 安装,支持类型安全、OpenAPI 驱动、更快 HTTP 客户端。现代化架构、未来特性优先。

Anthropic Claude Opus 4.6 上线,支持金融研究和 Vertex AI 通用可用

Google Vertex AI 扩展模型库,Anthropic Claude Opus 4.6 现 GA,提供最强模型访问。Anthropic 发布 Claude Opus 4.6,专注金融研究,审查公司数据/监管文件/市场信息,生成分析;编程能力提升,支持 Excel/PowerPoint。Finance Agent 基准第一。

KISS 多代理进化框架,简化 LLM 代理构建

KISS 库用纯 Python+类型提示转工具,支持 ReAct 循环、多代理串行、轨迹日志。AgentEvolver 自动优化成功率/成本,GEPA 遗传 Pareto 提示改进。

Y Combinator 推出 Autumn AI 实时 GTM 信号情报平台

Autumn AI 为 GTM 团队提供实时 ICP 信号馈送,支持意图过滤,@VishnuSampathk1 和 @shiv_kampani 发布。

Cloudflare Workers 免费计划新增 Queues 支持

Cloudflare 免费计划每日 10k 队列操作,优化 Workers 性能。

Linear 推出 MCP 产品管理升级,支持项目里程碑和更新

Linear MCP 新增创建/编辑倡议/项目里程碑/更新、标签管理、图像加载支持。

Goodfire 完成 1.5 亿美元 B 轮融资,估值 12.5 亿美元

Goodfire 获 1.5 亿美元 B 轮融资,估值 12.5 亿美元,专注机制解释性技术,由 Anthropic、DeepMind、OpenAI 研究者创办。Menlo Ventures 领投。

Google Gemini 2.5 Pro 构建 AR 应用,支持物体识别和实时指导

Gemini 2.5 Pro 多模态视觉和音效提示能力,用于 LEGO Smart Bricks 和 Snap Spectacles 创建沉浸式 AR 体验,支持物理物体识别和实时空间指导。

阿童木机器人港股 IPO,估值 25 亿元全球并联第二

阿童木机器人递表港交所,2025Q3 营收 8174.7 万元(并联占 52%),毛利率 31.9%;从 400 万估值增至 25 亿,获深创投等投资。

Kling 3.0 发布,支持多角色全动作场景

Kling 3.0 高度写实、光滑视频,支持多角色复杂动作、真实物理。Higgsfield 提供无限生成 70% 折扣。

NVIDIA 2026 无新游戏 GPU,因内存短缺

NVIDIA 因全球内存短缺,2026 不发布新游戏 GPU,削减 RTX 50 系列产量。优先 HBM 和高级 DRAM 用于 AI 数据中心。

Nintendo Switch 自 2025 年 6 月发售销量 1737 万台

Nintendo 确认 Switch 自 2025 年 6 月发售销量达 1737 万台,总裁考虑 Switch 2 涨价应对内存成本上升。

HIMS 推出多癌早筛服务使用 Galleri 血液测试

HIMS 推出筛查 50+ 癌症的 Galleri 血液测试,Hims & Hers Labs 会员享 250 美元折扣。

OpenAI GPT-5.3-Codex 自助构建

OpenAI 推出 GPT-5.3-Codex,结合 GPT-5.2-Codex 编码与 GPT-5.2 推理,25% 更快;TerminalBench 2.0 77.3%、SWE-Bench Pro 56.8%;自助调试训练/部署。

Fundamental 获 2.55 亿美元 A 轮融资

Fundamental 推出企业结构化数据基础模型,获 2.55 亿美元 A 轮融资,解决大数据分析难题。

ElevenLabs CEO:语音是 AI 下一代接口

ElevenLabs CEO 在 Web Summit Qatar 称语音是 AI 下一接口,OpenAI、Google、Apple 正推对话系统至可穿戴设备。

8K 电视时代尚未到来

LG Display 停产 8K 面板,LG/索尼/TCL 停推新款。Omdia 报告 4K 销量近 10 亿台,8K 仅 160 万台;8K Association 成员减至 16 家。


🛡️️ 安全漏洞

⭐ 微软发布检测休眠代理后门的扫描方法

Microsoft研究人员发布The Trigger in the Haystack方法,检测中毒模型,无需知触发器或结果。测试47个模型,检测率88%,零假阳性。


由 X-Crawler AI 生成于 2026-02-06 13:48

订阅天眼 · 掌握先机

解锁完整情报系统

登录后可访问全部历史日报、智能推文搜索、深度行业分析等高级功能。

分享

每日精选 · 直送邮箱

订阅天眼日报

AI 精选科技要闻摘要,每天一封,免费无广告。