天眼日报

科技 · 每日情报2026年02月06日72 分钟阅读
来源:2622 条精选推文·Lanyun·DeepSeek 生成·2026-02-06
分享
科技 日报封面
AI 速读20 条精选
🤖头条Anthropic发布Opus 4.6

首个1M上下文Opus级模型落地,多代理协作和代码代理能力大幅增强,推动AI编程与智能体竞争升级。

🤖头条OpenAI发布GPT-5.3-Codex

编码基准再创新高,效率和速度同步提升,并开放App、CLI、API,开发者工具链竞争进入新阶段。

🛠头条GitHub接入Claude与Codex

面向1.8亿开发者统一接入多家顶级AI编程模型,AI原生开发平台格局进一步成型。

头条比特币跌破6万美元

加密市场剧烈回撤并触发超23亿美元爆仓,风险偏好骤降,冲击交易所、矿企与相关ETF情绪。

🤖头条OpenAI将GPT接入实验室

AI直接参与实验设计与执行,使蛋白生产成本下降40%,显示模型正从写代码走向科研自动化。

🤖OpenAI推企业代理平台Frontier
🤖DeepSeek市占率升至50%
🤖Claude Code占GitHub提交4%
🤖Google披露1月AI更新
🤖MiniCPM-o 4.5主打实时多模态
🤖Cursor展示长时编码代理
🤖Mistral发布语音转写模型
MicroStrategy巨亏124亿
比特币ETF单日大幅流出
Bitwise提交Uniswap ETF
📰CZ推进多国本币稳定币
🤖Skywork桌面Agent上线
🛠Replit接入Gemini CLI
📦微软开源LiteBox沙箱系统
🛠Supabase推Claude连接器

🤖 AI 大模型

Anthropic 发布 Claude Opus 4.6,支持 1M token 上下文、多代理协作及 C 编译器自主构建

Anthropic 推出 Claude Opus 4.6,首款 Opus 级 1M token 上下文(beta)模型,记忆力提升 4 倍,支持 swarm 模式多代理协作速度提升 2.5 倍,Claude Code 新增 Agent Teams 多代理并行拆任务、互发消息、交叉验证及努力度调节。在 Terminal-Bench 2.0 得分 65.4%、GDPval-AA 1606 Elo、ARC-AGI-2 68.8%、FinanceAgent 第一、LiveBench 推理最高、长上下文 MRCR v2 领先等多项基准创 SOTA。团队用 16 个代理经 2000 次会话、2 万美元 API 费从零构建 10 万行 Rust 基 C 编译器,支持 x86/ARM/RISC-V,可编译 Linux 6.9 内核、QEMU、FFmpeg 等,GCC 测试 99%通过率。系统卡披露生产力提升 30%-700%(均值 152%)、安全框架压力大、自主获取 token 执行操作。订阅用户可领 50 美元 Opus 用量,已集成 GitHub Copilot、Cursor、Databricks、Notion 等 20 多家,提升代理任务规划、自我纠错、金融推理 23%。

OpenAI 发布 GPT-5.3-Codex,SWE-Bench Pro 达 57%、TerminalBench 2.0 77.3%

OpenAI 推出 GPT-5.3-Codex,编码能力大幅提升,SWE-Bench Pro 57%、TerminalBench 2.0 77.3%、OSWorld 64.7%、SWE-Lancer 81.4%等多项新高。token 用量减半、单 token 速度提升 25%、推理效率改善 2.93 倍,支持任务中途转向、实时更新、中文思考显示及良好计算机使用。专为 NVIDIA Blackwell GB200-NVL72 优化,与 Ginkgo Bioworks 合作虽独立但协同降低蛋白质生产成本 40%。Zed、warp 等集成支持,Codex App/CLI/API 即日开放,标志代理编码竞争加剧。

DeepSeek 仅靠产品获 50%市场份额

DeepSeek 几个月内从 0%市场份额暴涨至 50%以上,证明极致效率和体验降维打击营销套路。

OpenAI Codex 黑客松感谢参与者

OpenAI 举办 Codex 黑客松,感谢开发者参与,明日公布获奖项目,更多活动即将推出。

Claude Code 占 GitHub 公共提交 4%,预计 2026 年底超 20%

Claude Code 当前占 GitHub 公共提交的 4%,按趋势预计 2026 年底将达 20%以上,标志 AI 主导软件开发。

OpenAI GPT-5 连接自主实验室,蛋白质生产成本降 40%

OpenAI 与 Ginkgo 合作,将 GPT-5 接入自主实验室,设计实验、执行 36,000+反应、6 次迭代循环,识别低成本反应组合,将蛋白质生产成本降低 40%,推动生物工作流加速。

OpenAI 推出 Frontier 企业级 AI 代理平台

OpenAI 随 Codex-5.3 推出 Frontier 平台,支持共享业务上下文、执行环境、质量优化、身份治理,与 Snowflake 合作 2 亿美元,首批客户 Uber、State Farm、Intuit、HP、Oracle 等,任务从 6 周缩短至 1 天,能源产量增 5%价值 10 亿美元。目前限量可用。

Google 公布 2026 年 1 月 AI 重大更新

Google 1 月发布 GeminiApp Personal Intelligence、Gmail 升级、Chrome 集成 Gemini 3、Veo 3.1 更新、Project Genie 开放,Google AI Plus 扩展至 35 国包括美国。

OpenBMB 推出 MiniCPM-o 4.5,支持全双工实时多模态交互

OpenBMB MiniCPM-o 4.5 实现全双工 I/O、3-10fps 实时视觉、低延迟语音,支持打断和主动触发,OpenCompass 平均 77.6,本地 Python/C++部署,海外好评。

Cursor 发布长运行编码代理研究,每小时峰值超 1000 提交

Cursor 集成 Claude Opus 4.6,分享一周长代理实验:数百代理峰值每小时 1000+提交,擅长长任务代码审查,提供研究预览和 Cursor 内测试,未来重塑软件构建。

Anthropic 工程博客:量化代理编码评估中的基础设施噪声

Anthropic 官方博客分析,基础设施配置可使代理编码基准波动数个百分点,有时超顶级模型差距,强调评估标准化重要性。

Zed 集成 GPT-5.3-Codex 已上线

Zed 编辑器通过 Codex ACP 适配器支持 GPT-5.3-Codex,Zed Pro 和 BYOK 用户 API 可用,提升编码效率。

Vidu Q3 pro 视频模型登顶 Video Arena 前五

Vidu AI 的 Vidu Q3 pro 在 Video Arena 进入前五,领先 23 分,支持 16 秒 1080p 视频生成带音频,多语言文本渲染。

Kaggle Game Arena 2026 第一轮结果公布

Kaggle 发布完整数据集和日志,冠军:Poker GPT-5.2、Werewolf 和 Chess Gemini 3 Pro Preview。

Arena 推出 Max 智能路由器,实时选择最佳模型

Arena 发布 Max,基于 500 万+用户投票实时路由至最佳模型,支持编码、专家、长查询、创意写作四类第一,提供 YouTube 演示。

Laravel 发布 AI SDK,支持代理、图像、音频和 pg_vector

Taylor Otwell 发布 Laravel AI SDK beta,支持代理、图像生成、音频转录、嵌入、pg_vector 相似搜索,4 周后稳定版。

Mistral 发布 Voxtral Transcribe 2 系列语音转文字模型

Mistral 推出 Voxtral Transcribe 2 系列,支持多语言语音转文字。

Perplexity 推出 Model Council 功能

Perplexity 为 Max 订阅用户推出 Model Council,同时运行三个前沿模型(Opus 4.5 主席),比较合成更准确答案,仅网页版。

VoyageAI 发布开源嵌入模型 voyage-4-nano

VoyageAI 推出首款开源 voyage-4-nano 嵌入模型,与 voyage-4-large 共享空间,支持 Matryoshka 和 int8/二进制量化,Apache 2.0。

Claude 2026 年 1 月 App 下载和 MAU 创纪录增长

Claude 1 月 App 下载和 MAU 环比最大增长,连续第九个月 MAU 增长。

GitHub 集成 Claude 和 Codex 开启 AI 编程三剑客时代

GitHub 官宣集成 Claude、Codex 与 Copilot,通过 Agent HQ 支持 1.8 亿开发者一键调用完成编码、Bug 修复、PR 审查,支持 VS Code 和移动端。

SAFE 新型 RLHF 算法提升 Sonnet 训练奖励 5.15%

SAFE 算法结合 Double Soft-Min Critic 和多层稳定框架,在 3B 模型上平均奖励 0.725(PPO 0.689),减少奖励崩溃和 KL 失控。

OpenAI 在 Anthropic 发布后几分钟推出新型代理编码模型

TechCrunch 报道,OpenAI 于 2026-02-06 推出 Codex 5.3,仅几分钟后 Anthropic 发布类似模型,引发 AI 社区热议,竞争加剧。

Box 测试 Claude Opus 4.6,知识工作任务准确率提升 10%

Box 测试 Claude Opus 4.6 在金融、生命科学、法律复杂任务,较 Opus 4.5 准确率提升 10%,增强高级推理、逻辑、代理工具和编码。

warp 支持 Claude Opus 4.6,自适应思考降低延迟

warp 新增 Claude Opus 4.6 支持,自适应推理减少延迟,提升代码质量,解决 Opus 4.5 无法处理 bug。

Remote Labor Index:Opus 4.5 自动化 3.75%远程劳动项目

CAIS 发布 Remote Labor Index,Opus 4.5 自动化 3.75%远程劳动,GPT-5.2 第二,测试编码等数字劳动。

OpenAI 发布 Codex CLI 代理循环内部机制系列文章

OpenAI 详解 Codex CLI 代理循环,使用 Responses API,支持工具调用、提示缓存、上下文压缩,源代码 GitHub 开源。

Hugging Face 推出社区评估与基准仓库

Hugging Face 发布 Community Evals 和 Benchmark 仓库,支持去中心化评估,实时 leaderboard,用户 PR 添加分数。

Steven Byrnes 分析 LLM 算法进步性质

Steven Byrnes 论证 LLM 算法进步主要来自 Transformer 优化(3-5 倍)、数据改进、蒸馏,而非指数级训练效率,引用 Epoch AI 和 Dario Amodei,nanochat 成本仅 GPT-2 的 1/600。


💰 加密货币currency

CZ 推进多国本币稳定币合作

币安创始人 CZ 表示正与多国合作发行本币锚定稳定币,称每种法币应在链上对应稳定币,可降低跨境成本并衔接传统金融。

MicroStrategy Q4 财报:净亏 124 亿美元,或出售比特币

MicroStrategy 联合创始人 Michael Saylor 称出售比特币为选项。公司 2025 年 Q4 净亏损 124 亿美元(因 BTC 价格大跌),持有 713,502 枚 BTC,总成本 542.6 亿美元,平均成本 76,052 美元/枚。2025 年全年融资 253 亿美元。截至 2026 年 2 月 1 日持仓不变,股价跌 17%。

如何用 OKX 双币赢投资 BTC

OKX 双币赢按结算前 1 小时均价计算,到期价为 15:00-16:00 平均指数价,支持低买高卖但需看运气。

如何用 Binance 双币赢投资 BTC

Binance 双币赢跳过周末结算于 16:00,按 30 分钟均价,支持 70,000 美元高卖获 245 USDT 利息或 0.0035 BTC,最高挂单 90,000 美元等 77 天。

Vitalik Buterin 出售 ETH 支持以太坊开发

Vitalik Buterin 过去三天出售 6183 ETH,三日内总售 6899.5 枚 ETH(约 1415 万美元,均价 2052 美元),计划出售 16384 枚 ETH,剩余 9484.5 枚存入 Aave 用于捐赠。此前宣布用个人资金支持 Ethereum 开发。

Spark 鲸鱼止损卖出 2.78 万 ETH,偿还 4414 万 U 借款

Spark 上持有 ETH 借贷仓位鲸鱼从 2050 美元开始止损,卖出 2.78 万枚 ETH 偿还 4414 万 U 借款,剩余 9810 枚 ETH(1866 万美元),借款 1283 万 DAI,清算价降至 1560 美元。

MARA 转移 1318 枚 BTC 至 BitGo 等平台

比特币矿企 MARA 过去 10 小时向 Two Prime、BitGo 和 Galaxy Digital 转移 1318 枚 BTC(价值 86.89 百万美元)。

易理华向币安转入 8000 ETH,清算价 1523-1681 美元

易理华向币安转入 8000 ETH(价值 1510 万美元),当前持仓约 45 万枚 ETH,清算区间 1523-1681 美元。此前 ETH 暴跌距离爆仓仅 86 美元。

Morpho 协议借 USDT 享负利率-0.5%

Morpho 协议在 Arbitrum 上借 USDT 负利率-0.5%,抵押 wstETH 获 3.5%质押收益。存 100 万美元 wstETH 借 70 万美元 USDT 年赚 7000 美元,1 月 31 日处理 2300 万美元清算。

Bitwise 提交 Uniswap ETF S-1 注册文件

Bitwise 向 SEC 提交 Uniswap (UNI)现货 ETF S-1,由 Bitwise Investment Advisers 管理、Coinbase Custody 托管,目前不质押但未来可能引入。

Tether 以 1.5 亿美元收购 12%股权并接入黄金稳定币

Tether Investments 以 1.5 亿美元收购平台约 12%股权,建立合作,将 XAU₮黄金稳定币接入,支持 USD₮/USA₮购买实物黄金。

Lighter 上线 ARC PIPPIN BIRB JTO,支持 3X 杠杆

Lighter 新增上市 ARC、PIPPIN、BIRB、JTO,支持 3X 杠杆交易。

Bhutan 转移 2230 万美元比特币,持仓降至 5700 BTC

Bhutan 本周转 2230 万美元比特币至 QCP Capital,持仓从 2024 年 10 月 13295 BTC 降至 5700 BTC。

IREN 公布 1.6GW 俄克拉荷马数据中心园区

Iris Energy (IREN)宣布 1.6GW 俄克拉荷马数据中心园区,用于比特币挖矿和 AI 计算。

比特币暴跌至 6 万美元下方,全网爆仓超 23 亿美元

受科技股崩盘波及亚太市场,比特币亚太时段跌破 6.1 万美元,一度触及 6 万美元,日内跌超 11%,较去年 10 月高点 12.6 万美元腰斩超 52%,抹平 2021 年 11 月 69000 美元高点以来涨幅。全网 24 小时爆仓超 23 亿美元,多头头寸占大头(先前数据 17 亿美元多单 15 亿、15 亿)。OKX 数据显示 BTC 报 64518 美元跌 4.4%,ETH 1898 美元跌 3.2%。韩股跌 5%,白银跌超 10%至 64 美元,美股纳指期货跌 1.6%。杠杆爆仓加剧抛售,时隔 4 个月较高位跌超一半。

Bitnomial 推出首款 CFTC 监管 Tezos 期货

Bitnomial 交易所推出首款 CFTC 监管 Tezos 期货,机构和零售交易者可用加密货币或美元作为保证金获取 XTZ 敞口。

Tether Investments 向 Anchorage Digital 投资 1 亿美元股权

Tether Investments 宣布 1 亿美元战略股权投资 Anchorage Digital,后者为美国首家联邦监管数字资产银行,提供托管、质押等服务,并发行 USA₮。

比特币矿业 hash price 跌至历史低点 0.03 美元/TH

Luxor Technology 数据显示,每 TH 收入约 0.03 美元,双周挖矿难度下调 13%,多家矿企关停设备,美股矿企股价走弱。

Rainbow $RNBW 空投上线,Kraken 等交易所开启交易

Rainbow 宣布$RNBW 空投现已上线,用户可在 app Rewards 标签领取积分奖励,Base 链上代币交易已在主要交易所开放。Kraken 上线 RNBW 现货交易,支持 Rainbow 钱包,2025-02-06 开放 RNBW-USD 交易对。

Tempo 支持任意稳定币支付交易费

Tempo 推出稳定币费用,支持 TIP-20 USD 稳定币,交易或账户级选择,Fee AMM 自动转换。基础设施伙伴包括 Bridge、Frax、MetaMask。

比特币 ETF 单日净流出 7925 BTC,ETH 和 SOL ETF 亦流出

比特币 ETF 单日净流出 7925 BTC(5.33 亿美元),七日 19090 BTC(12.8 亿美元);以太坊 ETF 单日 37809 ETH(7384 万美元),七日 174917 ETH(3.4161 亿美元);Solana ETF 单日 21223 SOL(178 万美元)。

俄罗斯 Sovcombank 推出比特币抵押贷款

Sovcombank 成为俄罗斯首家主要银行向个人企业提供比特币抵押贷款,Sberbank 2025 年 12 月试点向 Intelion Data 发放贷款,探索加密资产融资模式。

通过 VIX 判断 Bitcoin 抄底时机

VIX<20 正常波动,25-30 恐慌初期观察,>30 事件驱动建仓,>40 加大投资,>50 大幅上涨机会。当前 VIX 22.56 属观察区。

Payy 推出隐私优先 Ethereum L2

Payy 推出 Ethereum L2,默认通过隐私池路由 ERC-20 转账。


🛠️ Tool Recommendations

WorkAny Bot 云端 OpenClaw Agent

WorkAny Bot 云托管 Agent 支持 OpenAI/Anthropic 模型,5 分钟配置 Telegram 接入,7x24 小时查资料写报告画图。

CodexBar 监控 AI 编程额度

CodexBar macOS 菜单栏工具实时监控 Claude、Cursor、Copilot 等 10+ AI 服务 剩余额度,支持 Homebrew 安装,隐私安全。

本地语言模型 Web 界面

开源 Web 界面 支持本地 LLM 部署,提供交互式访问。

基于 OpenStreetMap 数据绘制地图工具

开源工具从 OpenStreetMap 数据绘制地图,支持自定义渲染。

端到端加密跨设备剪贴板同步工具

Clipboard sync 工具支持多设备实时同步,端到端加密保护数据。

Skywork 桌面 Agent 支持本地文件自动化处理

昆仑天工 Skywork 桌面版 Agent 读取本地文件、跨格式转换(如 Doc→Excel、Excel→PPT),Windows 原生,支持 Claude 和 Gemini 3 Pro 智能路由,本地虚拟机执行不上传云端。下载:https://t.co/aO4xROY8Hz

Replit 集成 Gemini CLI 终端直达部署

Replit 与 Gemini CLI 扩展上线,支持自然语言提示→应用生成→Replit 部署,包含始终在线托管。由 GoogleCloudTech 合作。

Pi:OpenClaw 背后的极简 AI 编程助手

Pi 核心提示词仅四个工具(读、写、编辑、运行 Bash),支持扩展状态持久化、树状会话、热重载;OpenClaw 基于 Pi 构建,支持 MCP 转 CLI。

awesome-llm-apps:实用 LLM 应用代码仓库

GitHub 仓库 awesome-llm-apps 提供 PDF 对话、博客转播客、数据分析 Agent 等 84.1k 星 代码示例,支持 OpenAI、Google、Anthropic、Llama。

网络端口与二进制关联列表工具

工具列出网络端口及关联 binaries。

Next.js 路由洞察 CLI 工具支持 MCP 集成

CLI 工具提供 Next.js 路由洞察和 MCP 集成。

Cloudidr 多 LLM 代理:追踪令牌消耗,支持 40-90%成本节省

Cloudidr 作为 API 网关,仅改 URL 和 header 追踪 OpenAI、Anthropic 等多模型使用,记录令牌数、成本,支持预算上限和自动路由,延迟<50ms,节省 40-90%。

KISS 多代理进化框架:纯 Python 一键构建 ReAct 代理

KISS 框架用类型提示变 Python 函数为工具,支持 ReAct 循环、多代理串行、轨迹日志。含 AgentEvolver 自动优化成功/令牌/时间/成本,GEPA 遗传 Pareto 提示改进。

Clash Master:优雅 Clash 流量可视化工具

Clash Master 支持域名/IP/节点流量统计、30 分钟-24 小时趋势分析、多后端监控、数据持久化。适用于 OpenClash 用户。

Loupe:AI 开发者 Mac UI 探测器,转结构化代码数据

Loupe 将 Mac 界面转为 Claude/GPT-4/Cursor 可读结构化代码,支持 AI Agent UI 分析。

Supabase 发布官方 Claude 连接器,支持 MCP 服务器

Supabase 推出官方 Claude 连接器,可在 Claude web/桌面安装 MCP 服务器。

LlamaIndex 开启 Document Agent Olympics 竞赛

LlamaIndex 举办 3 周竞赛,奖金 200 美元 x3(总计 600 美元),针对复杂文档如扫描表单、金融图表,使用 LlamaCloud 构建代理。部署 LlamaCloud,处理 PDF/发票/简历等结构化数据。

nanobot:超轻量开源个人 AI 助手,支持多 LLM 和渠道

HKUDS 开源 nanobot,仅 4000 行代码,支持 OpenRouter、Anthropic、OpenAI 等多 LLM、本地 vLLM、Telegram 接入、网页搜索、定时任务。pip 安装配置 JSON 即可部署,适用于市场分析、开发辅助。

微软开源 LiteBox:基于 Rust 的沙箱库操作系统

微软发布 LiteBox 开源项目,Rust 实现的沙箱库操作系统,提升隔离和安全性。

Toad 增强 Diff 视图,语义彩色边缘线

Will McGugan 更新 Toad Diff 视图,添加语义彩色边缘线:红色删除、绿色添加、灰色无变。


📖 教程攻略

Claude Code /insight 功能分析工作流

Claude Code /insight 总结高速度创始人模式:6 天 39 会话 504 消息 92 提交,多任务 Bash 958 次,专注 bug 修复多文件变更。

OKX 双币赢抄底 Bitcoin 攻略

OKX 双币赢期权简化版,低买 BTC 如 60000 美元区间 4 小时结算,若未跌至则获 1256% 收益或 1.00051455 枚 BTC,对比 55000 和 40000 美元长期策略。

用提示词在 macOS 部署 Clash 配置 v2ray

提示词:'我用代理上网,有 v2ray 服务器,在 macOS 部署 Clash,配置文件 /tmp/config.json,展示整个过程'。生成配置、README,学习配置流程并科学上网。

AI Agent 应用开发初探:从 LLM 到框架实现

详解 AI Agent 系统组成,包括上下文记忆(滑动窗口、多轮改写)、RAG 流程(文档切分、向量化、召回)、工具调用(Function Calling、MCP 协议),并提供 LangChain4j 聊天、工具、RAG 代码示例。

基于 LangChain 的 ReAct 智能体项目:文档检索 + Redis 对话记忆全流程

LangChain Java 教程第三期:使用 ChatTongyi + DashScopeEmbeddings + Chroma 构建 RAG 链,支持 MarkdownTextSplitter 修复重复 chunk、RunnableWithMessageHistory + RedisChatMessageHistory 实现多轮对话。包含完整代码、Docker Redis 部署及测试。

OpenClaw + Cloudflare Tunnel 企业微信机器人部署指南

完整步骤:安装 OpenClaw 和 wecom 插件,配置 openclaw.json(token 和 encodingAesKey),用 Cloudflare Tunnel 创建隧道绑定域名 bot.shuqi.run 转发 localhost:18789,企业微信后台对接 HTTPS URL。

大模型实战 03:Transformers 原理图解到 HuggingFace 实战

Kaggle 双 T4 环境加载 Qwen2.5-7B:AutoTokenizer 编码/聊天模板,AutoModelForCausalLM 用 device_map=auto 和 torch.float16,调节 temperature/top_p 控制创造力。


💎 技巧经验

⭐ Claude 8 个提示规划 30 天社交媒体内容

Claude8 个提示3 小时内规划、创建、安排30 天内容,包括内容重利用系统、无限病毒创意引擎等,支持10 种格式转化。

Opus 4.6 项目初始化建议使用/init

Opus 4.6用户首选在项目运行/init,模型会吐槽旧代码冗长。


⚡ 工作流

⭐ OpenAI 内部 Codex 代理式软件开发指南

OpenAI目标3 月 31 日前:技术任务首选代理交互,默认安全工作流无需额外权限。6 点建议包括指定agents captain、维护AGENTS.md、工具清单、代理优先代码库、拒绝低质代码、基础设施建设。

Claude Opus 4.6改变 AI 开发工作流

1M token上下文加载整个80 文件代码库,识别16 个跨文件 bug(如自动提交失效、端口绑定竞态),一会话修复14 个,总耗时20 分钟,无需分任务/移交文档。

⭐ 黑客松冠军 Claude Code 配置:8 大核心思路拆解

everything-claude-code仓库(28.8k 星):CLI+Skills 替 MCP 省50% token,5 阶段 Agent 编排(RESEARCH-PLAN-IMPLEMENT-REVIEW-VERIFY),Git Worktrees并行,Hooks持久化记忆。


🧠 深度思考

AI 重塑软件行业:代码产出贬值导致软件股逆市下跌

当代软件工程价值正发生深刻转移,随着 AI 的兴起,传统代码产出价值贬值,问题发现、设计品位、验收验证以及长期生产维护成为核心竞争力。阮一峰详细分析美中软件股近两年逆市下跌的原因,尽管 AI 股持续上涨。这并非软件行业自身问题,而是 AI 颠覆了传统软件开发和商业模式,迫使行业转型。投资者需关注这一结构性变化带来的机遇与挑战。详文链接:https://t.co/egeghU4Nzs。

Anthropic 工程文章详解 Ralph 循环代码反馈

Anthropic 工程博客强调反馈循环在代码生成中的重要性,探讨平衡人类在循环(HITL)与无人类干预(AFK)的最佳实践,尤其适用于关键代码。与 Ralph 实验结论一致,突显迭代反馈对提升 AI 代码质量的关键作用。

但斌:AI 为十年牛市,关注英伟达、谷歌、特斯拉产业链

东方港湾但斌称 2025 年为 AI 勃发之年,DeepSeek、谷歌等崛起;错过 AI 时代风险大于泡沫。重点关注 AI 产业链如英伟达、谷歌、特斯拉具盈利潜力,中国工程师红利即将爆发,推动十年牛市。

当 AI 写 80%代码,架构成护城河:Skeleton Architecture 模式

InfoQ 文章详解 AI 时代软件架构策略:Skeleton 模式由人类定义稳定骨架(如基类、安全验证),Tissue 由 AI 生成垂直切片。包含 Python 代码示例,支持 PyTorch、React、Node.js 技术栈。强调上下文约束、硬护栏设计和系统思维转型,帮助开发者构建 AI 时代护城河。

马斯克:36 个月内太空成 AI 部署最廉价地

xAI Colossus 2 需 1 吉瓦电力,太空太阳能每瓦 0.25 美元,效率为地面 5 倍;SpaceX 每年 1-3 万次星舰发射,可支持数百吉瓦 AI 算力。马斯克预测 36 个月内太空将成为 AI 部署最廉价场所。

Moltbook 和元宝派:两场 AI 社交超大规模实验

Moltbook 吸引 150 万 AI agent 进行纯 AI 社交实验;腾讯元宝派将 AI 引入群聊,支持@核查、P 图、办公等功能。两项实验探索多对多场景下 AI 行为边界,推动 AI 社交大规模应用。


📰 Industry News

Intel 和 AMD 警告中国服务器 CPU 供应短缺

Intel 第四/第五代 Xeon 交付期达 6 个月,限量供应导致中国服务器产品价格涨超 10%;AMD 部分产品延至 8-10 周,影响阿里和腾讯等 AI 企业,中国占 Intel 营收超 20%。英特尔通知中国客户部分 CPU 交货前置 6 个月,服务器价格总体上涨 10%;AMD 部分 CPU 在中国交货时间达 10 周。

NIO 预计 2025 Q4 调整后经营利润 7-12 亿人民币

NIO 2025 Q4 调整后经营利润预计 7-12 亿人民币(1.01-1.73 亿美元),股价大涨,结束多年亏损。

Ookla 数据显示 Starlink 占所有卫星 Speedtest 测试 97%,远超 Viasat 和 Hughesnet。

2026 年大科技 Capex 军备赛:AMZN 2000 亿、GOOGL 1800 亿等

AMZN 2026 CapEx 2000 亿美元(+52% YoY)、GOOGL 上调至 1800 亿美元(+98%)、META 1250 亿美元(+74%)、MSFT 1050 亿美元(+31%)。Google 1750-1850 亿、Meta 1150-1350 亿、Tesla 200 亿、Amazon 2000 亿、Microsoft 跑率 1200 亿美元。

微信屏蔽腾讯元宝、阿里千问、百度文心红包链接

微信屏蔽腾讯元宝、阿里千问、百度文心红包链接,提示诱导分享,转用口令模式参与,转化率降低。阿里 Qwen 春节红包分享链接被屏蔽,称“误导下载/跳转”,需第三方浏览器访问,用户切换密码分享。

高通 Q2 指引低于预期,内存短缺致手机芯片出货降 7%

高通股价跌 10%,Q1 超预期但 Q2 内存短缺涨价致 OEM 减产,2026 先进手机芯片出货量预计降 7%。

中国商品期货大跌:白银-17.7%、锡-7.7%

上海白银跌 17.7%、锡-7.7%、黄金-4.2%、镍铜-3.7%、铝-1.7%、锌-1.2%。广州铂金-13%、钯金-9.3%、碳酸锂-5%、多晶硅-3%。

亚马逊 Q4 营收 2134 亿美元超预期,2026 Capex 2000 亿,AWS 积压订单 2440 亿

亚马逊 Q4 销售额 2134 亿美元(预期 2113.6 亿),EPS 1.95 美元(预期 1.97),AWS 增长超 3 年最快,营收 356 亿美元(+24%),积压订单 2440 亿美元(同比+40%、环比+22%),Trainium 业务年化超数十亿美元。过去一年 AWS 新增 3.9GW 电力(相当于 4 座核电站),Q4 单季 1.2GW,预计 2027 年底容量翻倍。2026 年资本支出 2000 亿美元,主要用于 AI 基础设施、数据中心、芯片,但股价盘后跌超 11%,投资者质疑生成式 AI 高投入回报。

BYD 本周市值蒸发 600 亿美元

BYD 股价跌 7%,自 5 月来市值蒸发超 600 亿美元。国内需求冷却、原材料成本上升,每车额外成本约 1000 美元。

X 推出 175 万美元 Grok Imagine 视频大赛

X 举办 Grok Imagine 视频大赛,总奖金 175 万美元:第一 100 万、第二 50 万、第三 25 万美元。视频限 30 秒,仅限美国用户。

Sapiom 获 1500 万美元融资

Sapiom 完成 1500 万美元融资,用于 AI 代理自主采购技术工具。

Joanna Stern 辞职 WSJ 创办消费科技媒体公司

Joanna Stern 结束 WSJ 12 年生涯,创办专注帮助用户应对科技/AI 变化的媒体公司,已开启订阅和 YouTube。

黑石敲定 50 亿澳元贷款支持 Firmus AI 数据中心

黑石集团敲定超 50 亿澳元贷款助 Firmus 扩张 AI 数据中心,计划至 2028 年部署 1.6 吉瓦容量,此前融资 8.3 亿澳元。

OpenClaw 旧金山首聚千人,发布 CuaBot 多人 Agent 桌面

OpenClaw 旧金山线下聚会吸引 1000 人,演示龙虾头机器人实时 AI 控制和 CuaBot 工具,支持多 Agent 独立 Linux 桌面,通过 Docker 和 Xpra 隔离操作。

Y Combinator 春季批新增 AI 构建问题,支持 Claude Code 上传

YC 春季 2026 批申请新增问题,要求上传 Claude Code markdown 或 transcript 展示规划、设计、调试和发布流程,2 月 9 日截止。

Reddit Q4 财报超预期,授权 10 亿美元回购

Reddit Q4 营收 7.26 亿美元(预期 6.67 亿)、EPS 1.24 美元(预期 0.93)、DAU 1.214 亿(预期 1.202 亿);Q1 营收指导 6 亿美元(预期 5.77 亿),授权 10 亿美元股份回购。

丰田提高 2025/26 财年预期:经营利润 3.80 万亿日元

丰田预计 2025/26 财年销售净额 50 万亿日元(前 49 万亿)、经营利润 3.80 万亿日元(前 3.40 万亿)、净利润 3.57 万亿日元(前 2.93 万亿)。

Goodfire AI 完成 1.5 亿美元 B 轮融资,估值 12.5 亿美元

Goodfire AI 获 1.5 亿美元 B 轮融资,估值 12.5 亿美元。专注机制可解释性平台,已部署 Rakuten 日英 PII 监控,支持万亿参数实时转向。

Elon Musk 计划建 Optimus Academy 训练人形机器人

Elon Musk 计划 Optimus Academy:模拟世界数百万机器人,现实数万台闭合仿真-现实差距。解决人形 50+关节协调及数据飞轮问题。

广东 2025 人工智能核心产业规模达 3000 亿元

广东省发布会称,2025 年集成电路产量 942.4 亿块,增长 152%;AI 核心产业规模 3000 亿元,民用无人机产量增长 39%占全国 9 成。

Kraken 推出银、铜、铂钯 xStocks 商品产品

Kraken 上线 xStocks:银 SLVx、铜 COPx、铂钯 PPLTx/PALLx,提供通胀对冲和 AI 基础设施金属敞口。

Sonos × 少数派 × 暖风家联合沉浸体验空间上线

Sonos 于 2 月 6 日入驻少数派深圳后海汇店,与暖风家墨水屏区结合,提供听觉沉浸体验。

阿里千问春节活动送出超 100 万单奶茶后故障

阿里千问上线“春节 30 亿免单”后 3 小时内送出 100 万单奶茶,APP 多地故障,官方回应“紧急加资源”。

Tesla 首次在非洲摩洛哥开启 Model 3 和 Model Y 销售

Tesla 在摩洛哥启动 Model 3 和 Model Y 销售,2026 年 7 月开始交付。

黄仁勋:英伟达 AI 项目失控,编程即打字

NVIDIA CEO 黄仁勋与思科 CEO 炉边谈:AI 项目百花齐放勿早收敛,编程商品化,企业知识产权在“问题”而非答案。建议建本地 AI 系统,每员工配多 AI。强调工具使用而非重造,物理 AI 需懂因果。

Elon Musk 与 Collision 和 Dwarkesh 访谈讨论太空数据中心和 xAI

Elon Musk 在 Collision 和 Dwarkesh 三小时访谈中详谈 SpaceX 轨道数据中心、xAI 商业计划、Optimus 人形机器人、中国竞争、DOGE 和 TeraFab,访谈时长 3 小时。

Waymo 蚕食网约车市场份额

a16z 报告 Waymo 蚕食 rideshare 市场,提供移动图表分析。

美团以 7.17 亿美元全资收购叮咚买菜

美团 2026 年 2 月 5 日宣布收购叮咚买菜全部股份,初始对价 7.17 亿美元,总对价最高 9.97-10.06 亿美元,包括 2.8 亿美元资金和现金义务。叮咚 2025Q3 收入 66.6 亿元、GMV72.7 亿元、净利润 0.8 亿元,运营 1000+前置仓,覆盖 30 城,90 后月活 1488.7 万,长三角 300 仓日均 1700 单/仓,连续多季盈利。此举整合美团 1.5 亿日订单网络,重塑即时零售,对阿里和京东形成压力。梁昌霖内部信称三大竞争力将放大。

拓普集团成立航天科技公司,注册资本 1 亿元

宁波拓普航天科技有限公司近日成立,注册资本 1 亿元,由拓普集团全资持股,经营范围包括航天器制造、民用火箭发动机研发与运载火箭制造。

小马智行与摩尔线程达成战略合作推进 L4 自动驾驶

小马智行与摩尔线程合作,基于 MTT S5000 智算卡和夸娥集群训练世界模型和车端模型,实现算法-数据-算力全链路协同。

Y Combinator 恢复接受加拿大公司投资

Y Combinator 恢复投资加拿大、美国、开曼、新加坡公司,此前反馈后调整。

英伟达 RTX60 系列推迟至 2027 年底量产

英伟达因内存涨价和 AI 产能优先,推迟 RTX50 SUPER 发布,RTX60 系列至 2027 年底量产,可能 2028 年上市。

苹果收缩虚拟健康教练项目 Mulberry

苹果叫停 Mulberry 虚拟健康教练项目,将功能拆分整合至现有健康 App。

OpenAI 推出 GPT-5.3-Codex 应用

OpenAI 于 2026 年 2 月 5 日发布 GPT-5.3-Codex 应用,24 小时内下载超 100 万次,支持 SWE-Bench Pro 得分 56.8%和 TerminalBench 2.0 得分 77.3%。

Anthropic 金融模型发布致股价波动

Anthropic Claude Opus 4.6 发布后,FactSet 股价跌 10%、路透跌 8.5%,S&P Global 和 Moody’s 股价走低。

BATZ 巨头狂撒 48 亿红包争夺 AI 超级入口

腾讯、阿里、字节、百度春节红包总额达 48 亿元,字节获央视春晚独家 AI 云合作,腾讯元宝登 AppStore 首位但遭微信封杀,阿里千问月活破 1 亿。

三星 AR 眼镜定档 2026 年搭载谷歌 Android XR 和 Gemini

三星首款 AI 眼镜 2026 年发布,重 50g、骁龙 AR1 芯片、1200 万像素相机、155mAh 电池,集成谷歌 Android XR 系统和 Gemini 模型,支持实时导航和多模态交互。


📚 前沿研究 & Papers

旧金山 Physical AI 黑客松获奖项目,Robocafe 获 Activeloop 奖

旧金山 Physical AI 黑客松获奖项目 Robocafe 获得 Activeloop 奖。该项目使用 lerobot 臂实现语音控制端包、倒水、收拾桌子等功能,ACT 模型处理复杂任务链,已在 GitHub 开源。

LLM 提出特征学习时序抽象世界模型与策略

论文利用 LLM 提出专家乘积世界模型特征,预测宏动作后抽象状态,帮助 RL 探索。涉及 temporally abstract 世界模型与 options 框架。

Agent Primitives:多代理系统可复用构建块提升 12-16.5%准确率

Agent Primitives 将多代理系统分解为 Review、Voting/Selection、Planning/Execution 基元,使用 KV-cache 通信避免信息衰减。在 8 个基准测试中平均提升 12.0-16.5%,GPQA-Diamond 达 53.2%,令牌使用降低 3-4 倍。论文:https://t.co/fxEL6g0x4O。

Maximum Likelihood Reinforcement Learning (MaxRL)新论文

MaxRL 插值 REINFORCE 与最大似然,仅需优势计算除均值奖励一行代码;在推理任务中 Pareto 优于 GRPO,提升样本效率,产生更大梯度范数。

Demis Hassabis:持续学习是 AGI 关键缺失能力

Google DeepMind 创始人 Demis Hassabis 称,从经验中持续学习是实现 AGI 的主要缺失能力。

去哪儿网数据库异常检测算法落地实践

去哪儿 DBA 团队部署 DoubleRollingAggregate、SeasonalAD、LevelShiftAD 等算法,实现 CPU/磁盘/QPS 等 10+指标智能巡检,准确率超 80%。

YOLOE-26 发布:实时开放词汇分割模型,支持文本/视觉提示

康奈尔大学 YOLOE-26 结合 YOLO26 效率与开放词汇能力,实现自然语言/参考图识别,无需重训。YOLOE-26x-seg mAP 达 39.5(文本)、36.2(视觉)、29.9(无提示)。集成 Ultralytics,提供 Nano 至 XL 模型。

氛围编码威胁开源生态:用户互动减少,新项目启动难度增

预印本论文分析 Vibe Coding 导致开源官网流量下滑、论坛使用减少(如 Stack Overflow)。建模显示开源规模需改革维护者报酬。JavaScript/Python 生态受冲击最大,建议资金补贴上游项目。

博睿康完成 IPO 辅导备案,NEO 脑机接口 32 患者 100%达标

博睿康 2 月 4 日完成科创板 IPO 辅导备案,NEO 无线微创脑机接口 2025 年 5 月启动 GCP 试验,32 位颈髓损伤患者在 11 家医院完成植入,100%实现脑控抓握,进入创新审评通道。

ERNIE 5.0 技术报告发布

百度发布 ERNIE 5.0 技术报告,详细技术规格和性能数据。

Cloudflare x402 模板收费机器人,支持 Claude 部署

Cloudflare 更新 x402 模板,使用 bot score 免费人类/选定 Agent,收费其他 bot。提示部署需 Claude,支持自定义 allowlist。

推理计算需求至 2035 年达 41M H100 当量

报告预测编码自动化推理计算从 2019 年 1 月 7.4 H100 增至 2035 年 1 月 41M H100,实验吞吐量从 19 增至 1.3M,计算预算成瓶颈。

Token 级过滤塑造 LLM 能力减少医疗风险

arXiv 2601.21571 论文:1.8B 参数模型 token 过滤使医疗学习 7000x 变慢,支持拒绝训练,保持非医疗任务性能。

Schmidhuber 发布神经世界模型繁荣技术笔记

J. Schmidhuber 发布 WM26 技术笔记(IDSIA-2-26,2026-02-04),回顾 RNN 世界模型历史,从 1990 年起创新如 Transformer、人工好奇心、深度残差学习。YouTube 演讲 WM26b。

Anthropic 用 Claude 团队构建 C 编译器

Anthropic 工程团队于 2026 年 2 月 5 日发布博客,使用 Claude 并行团队构建 C 编译器,展示 LLM 在复杂工程任务中的应用。

FOTBCD:法国大规模建筑变化检测基准数据集

FOTBCD-Binary 含 2.8 万对 0.2m/像素图像,覆盖 28 部门,训练 25 测试 3 地理分离,支持跨域泛化基准。


🚀 Product Launches

ChenkinNoob-XL v0.2 SDXL 转 Rectified Flow 模型

ChenkinNoob-XL v0.2 消除灰度提升对比/暗场景,20-28 步收敛,47M 样本训练于 8xH20,支持 ComfyUI 和 LoRA。

MiniCPM-o 4.5 Docker 本地部署

MiniCPM-o 4.5 支持 Mac Docker 实时视频交互,WebRTC 全双工低延迟,9B 参数 演示开源。

ModelScope ms-agent 框架重大更新

ms-agent 更新:技能发现、多技能 DAG 协作、渐进分析优化小模型上下文,安全 Docker 执行,自省 bug 修复。安装`pip install ms-agent -U`,WebUI `ms-agent ui`。

阿里推出桌面应用 QoderWork

阿里发布 QoderWork 桌面应用,支持 AI 编码工作流。

开源人形机器人硬件软件全栈发布

开源人形机器人提供完整硬件和软件栈,支持自定义开发。链接:https://t.co/OUmjQH4Ush。

Sakana AI 首款通用服务开启日本 Beta 测试

Sakana AI 开发首款面向大众 AI 服务,日本国内招募 Beta 测试者,合作者获赠周边商品。链接:https://t.co/tIPx06JWQB。

VISI0 一站式故事渲染平台上线

VISI0 使用 AI 分析故事生成分镜、视频、对白、旁白、配乐,保持人物一致性。支持修改和剪辑,完全用 Claude Code 开发,49646 行代码、11 天完成。

OpenAI 发布 Frontier 企业 AI 智能体平台,与 Snowflake 合作 2 亿美元

OpenAI Frontier 平台整合数据仓库、CRM,支持 agent 操作文件/代码/GUI,首批客户 Uber、State Farm、Intuit、Thermo Fisher、HP、Oracle,兼容多模型。

Tesla 申请 Cybercar 和 Cybervehicle 商标

Tesla 提交 Cybercar 和 Cybervehicle 商标申请,用于 Cybercab 在禁用“Cab/Taxi”州的 robotaxi 推出,此前财报提及需此调整。

Astro 6 Beta 发布,重构开发服务器支持 Cloudflare Workers

Astro 6 Beta 引入基于 Vite Environment API 的开发服务器、一流 Cloudflare Workers 支持、稳定实时内容集合和 CSP,需 Node 22+,统一开发生产环境。

Tesla Cybertruck 在德州加州开启 V2G 功能

Tesla Cybertruck 在 Texas 和 California 支持 Powershare Grid Support,车主可向电网回送能量获能源账单抵扣,支持高需求事件。

小鹏 GX 开启 L4 级自动驾驶开放测试,算力 3000TOPS

小鹏首款大六座 SUV GX 搭载 4 颗图灵芯片,本地算力 3000TOPS,具备 L4 级自动驾驶能力,在广州路测。

Tesla 中国版添加“Hey, Tesla”唤醒词,支持空间感知

Tesla 中国市场新增“Hey, Tesla”唤醒词,全舱监听并智能识别语音来源位置。

Tesla 进入非洲首个市场

Tesla 宣布非洲首个市场上线。

质变科技发布业内首个多模态记忆平台 MemoryLake

质变科技推出 MemoryLake,集成多模态内容理解/记忆存储/计算管理,由 MemoryLake-D1 大模型、记忆引擎及 Relyt 多模态云构成。

Tesla 提交新一代 Roadster 商标申请,揭幕临近

Tesla 提交 Roadster 字标及新设计商标,USPTO 备案显示:https://t.co/lqCCLRIlWm 和 https://t.co/oqt6II2vpO,暗示揭幕接近。

Tesla Optimus 机器人计划建 Optimus Academy

Elon Musk 采访透露,Tesla 将建 Optimus Academy,部署 1 万至 3 万台 Optimus 机器人进行现实自玩训练,结合物理准确模拟器关闭仿真-现实差距。

Cloudflare Workers 免费计划新增 Queues

Cloudflare 将 Queues 加入 Workers 免费计划,每日支持 1 万次队列操作。

Obsidian 1.11.7 发布,支持移动端全屏、浮动导航、滑动侧边栏

Obsidian 1.11.7 桌面/移动版全员可用,新增移动界面自定义:全屏隐藏元素、浮动导航按钮或锚定、滑动侧边栏覆盖或浮动。

LangSmith Insights Agent 上线

LangChain 推出 Insights Agent,分析 traces 揭示用户使用模式、代理失败点,支持自定义洞察。

Vercel AI 加速器重启,提供 600 万美元积分

Vercel AI 加速器招募 40 团队,持续 6 周,提供 Vercel、v0、AWS 等 600 万美元积分。申请截止 2 月 16 日。

Notion 分享从 AI 功能到 AI 原生产品的三年迭代经验

NotionHQ 发布 After Hours 播客,Shir Yehoshua 等分享三年转型:从 Waymo 式 demo 到 memo、反复试错、日常 AI 和进步优先于完美,涉及产品构建重构。

Linear 推出 MCP 产品管理升级,支持项目里程碑和图像加载

Linear MCP 更新:创建/编辑倡议、项目里程碑、更新,管理项目标签,支持图像加载。

Roblox 推出 Cube Foundation Model,4D 世界模型

Roblox 发布 Cube Foundation Model,4D 模型和世界模型,支持游戏和元宇宙 AI 内容生成。

Goodfire AI 完成 1.25 亿美元 B 轮融资,估值达 10 亿美元

Goodfire 完成 1.25 亿美元 B 轮融资,成为独角兽;估值达 10 亿美元(另报 12.5 亿美元),Anthropic 直接投资,专注机制解释性,用于 AI 模型权重分析和转向,制药发现阿尔茨海默病生物标志物。由 Anthropic、DeepMind、OpenAI 研究者创办。

Firefox 148 新增 AI 功能关闭开关

Firefox 148 添加 Block AI enhancements 开关,支持 OpenAI、Anthropic 等侧边栏聊天机器人,用户可单独关闭翻译、PDF 图像等功能。

Skywork Desktop 本地 AI 工作区工具

Skywork Desktop 支持语义文件理解、统一解析、多格式文件夹历史、本地运行隐私优先、自动选模型(Claude/Gemini),内置 100+技能处理文档/幻灯/网页。

贾跃亭发布 FF 首批具身智能机器人

FF 在拉斯维加斯发布首批具身智能机器人,贾跃亭重新出任 Co-CEO。活动于 2026-02-05 早上 7:30 举行。

OpenAI GPT-5.3-Codex 基准领先

OpenAI GPT-5.3-Codex 在 TerminalBench 2.0 得分 77.3%、SWE-Bench Pro 56.8%,支持 OSWorld-Verified 64.7%,速度提升 25%。


🔒 网络安全

罗马Sapienza 大学遭勒索软件攻击离线数日

Sapienza 大学(欧洲最大大学之一)于2026 年 2 月 5 日勒索软件攻击,系统离线数日。


由 X-Crawler AI 生成于 2026-02-06 14:34

订阅天眼 · 掌握先机

解锁完整情报系统

登录后可访问全部历史日报、智能推文搜索、深度行业分析等高级功能。

分享

每日精选 · 直送邮箱

订阅天眼日报

AI 精选科技要闻摘要,每天一封,免费无广告。