天眼日报

科技 · 每日情报2026年02月12日35 分钟阅读
来源:1877 条精选推文·Lanyun·DeepSeek 生成·2026-02-12
分享
科技 日报封面
AI 速读20 条精选
🤖头条智谱开源GLM-5旗舰模型

744B参数、MIT完全开源,编码与Agent能力达开源SOTA,全球排名第4,或重塑开源大模型竞争格局。

🤖头条豆包上线Seedance 2.0

字节将高质量视频生成与实时视频理解推向大众端,支持百万上下文且API降价,AI视频应用门槛进一步降低。

🔲头条三星量产HBM4并出货

AI算力核心部件HBM4进入商用,三星追赶SK海力士,直接影响英伟达等加速器供应链与行业竞争。

🏛头条国务院专题学习AI+

高层明确推进算法、数据、算力与开源社区全链条突破,释放国内AI产业政策支持和资源配置信号。

📰头条联想Q3营收超预期

单季营收222亿美元,AI相关收入占比达32%,显示AI已实质拉动大型硬件厂商业绩与转型。

🤖字节自研AI芯片找三星代工
🤖OpenRouter年化Token暴增
🤖OpenAI发布长程Agent组件
🤖Agentica刷新ARC-AGI-2
🤖MiniMax新模型对标Opus
🦾小米开源机器人VLA模型
🚗文远知行Uber扩展Robotaxi
马来西亚测试环吉稳定币
Coinbase推AI代理钱包
币安SAFU完成10亿美元买币
📈英国试点区块链数字国债
比特币ETF单日净流出2.76亿
📦OpenClaw星标超18万
📰AWS禁Claude Code惹争议
💡软银投资OpenAI浮盈170亿

🤖 AI 大模型

本地 LLM 运行基础教程:从推理到 Transformer 架构详解

TheAhmadOsman 分享本地 LLM 入门指南,覆盖 token 化(BPE/SentencePiece)、推理过程(预测下一个 token)、Transformer 架构(自注意力、MLP、RoPE)、量化(4-bit NF4/GPTQ 节省 VRAM 至 7B 模型 3.5GB)、KV 缓存(每 token 0.5MB)和运行时(llama.cpp、vLLM)。强调 VRAM 瓶颈和调试常见坑。

MiniMax 新模型媲美 Opus 4.6,支持 Claude 和 Pi 代理

MiniMax_AI 模型获早期访问反馈,与 Claude Opus 4.6 性能相当,支持 Claude 和 Pi 代理本地工作流,无任务问题。

Ollama 云端 GLM-5 容量提升,支持 Claude 和 OpenClaw

Ollama 升级 GLM-5:cloud,容量增加速度更快,支持 Claude 和 OpenClaw 全尺寸模型工具调用。

PicoClaw:10 美元硬件运行类 OpenClaw,仅 10MB 内存

aigclink 发布 PicoClaw,用 Go 重构 OpenClaw 核心,节省 99%内存,0.6GHz 单核 1 秒启动,支持全栈开发/日志/搜索,兼容 Telegram/Discord/QQ。

Ant 开源 LLaDA2.1 Flash 模型,推理速度达 892 tokens/s

Ant Open Source 发布 LLaDA2.1 Flash,100B 参数语言扩散 MoE 模型,峰值速度 892 tokens/s,超越 Qwen3-30B-A3B 2.5 倍。采用“草稿后编辑”机制,支持 Speedy Mode 和 Quality Mode 双模式。

PixVerse-R1 实时交互世界生成,720P 1-4 步采样

PixVerse 推出 R1,实时 720P 交互世界,Instantaneous Response Engine 将采样减至 1-4 步,管道重组实现近即时响应。

Agentica 在 ARC-AGI-2 基准创下 85.28%新 SOTA

Agentica 代理使用 350 行代码撰写并运行代码,在 François Chollet 的 ARC-AGI-2(最难基准)达到 85.28%,通用系统非专为 ARC 优化。

智谱 AI 开源 GLM-5 旗舰模型,Coding 与 Agent 能力开源 SOTA,全球排名第 4

智谱 AI 于 2026 年 2 月 12 日正式开源 GLM-5(744B 参数,活跃参数 40B),预训练数据达 28.5T,采用 Slime 框架和异步强化学习。在 Artificial Analysis Intelligence Index 得分 AA=50,全球排名第 4、开源模型第 1;SWE-bench 得分 77.8%(开源 SOTA),Terminal-Bench 2.0 得分 56.2 提升 9%,Finance Agent Benchmark 开源第 1。擅长代理工程、长时序任务如 BrowseComp 和 MCP-Atlas,前端/后端开发领先,逼近 Claude Opus 4.5。以 MIT 许可证完全开源,已适配昇腾、摩尔线程等 10 余款国产芯片。比 GLM-4.7 输入涨 67%、输出涨 45%,GLM-5-Code 输入涨 100%、输出涨 127%。上线 ModelScope 魔搭平台免费试用、Poe 平台。编程套餐调价:Lite/Max 订阅提高,Max 月费 469 元或 80 美元,季度折 10%、年度 30%。

OpenRouter 周令牌消耗达 12.1 万亿,同比增长 12.7 倍

OpenRouter 周消耗 12.1 万亿 token(年化 662 万亿),相当于 Azure 全部推理量,过去一年增长 12.7 倍。

字节跳动豆包上线 Seedance 2.0 视频生成模型,支持实时视频理解

字节跳动豆包(Doubao)在 App、桌面和网页端推出 Seedance 2.0 视频生成模型,支持低门槛提示词生成高质量视频,速度更快、积分消耗更少;Seedance 2.0 Fast 略微牺牲效果换取效率。接入豆包 App/电脑端/网页版,已在快手万擎竞猜活动提供 192 次用量。即梦平台上线 Seedance 2.0 Fast。支持 100 万 token 上下文、实时视频理解、API 降价 50%。马斯克评论‘发展太快’,贾樟柯称准备用其做短片。

OpenAI 发布 Shell+Skills+Compaction 构建长运行智能体组件

OpenAI 推出 Shell(命令行环境)、Skills(复用指令包)和 Compaction(上下文压缩),支持长时稳定工作流;附 10 个技巧如技能路由、负面示例、网络白名单,构建模式从数据处理到企业 SOP。

小米开源 47B 机器人 VLA 大模型 Xiaomi-Robotics-0

小米开源 Xiaomi-Robotics-0,47 亿参数 VLA 模型,支持视觉语言理解和实时执行;基于 Qwen3-VL-4B-Instruct,用于机器人应用。

Cursor 提升 Composer 1.5 和 Auto 使用限额

Cursor 宣布 Composer 1.5 成为第二受欢迎模型,增加容量并提高所有个人计划限额:Composer 1.5 使用量为 Composer 1 的 3 倍,至 2 月 16 日限时提升至 6 倍。个人计划用户 Auto 和 Composer 1.5 限额提升。

MiniCPM-SALA 9B 模型发布,支持 1M 上下文

面壁智行/面壁智能发布 MiniCPM-SALA,9B 参数,采用稀疏线性注意力混合架构 SALA,在 256K 上下文推理速度比 Qwen3-8B 快 3.5 倍,支持边缘 GPU 1M 上下文,优化文本生成。

OpenAI Codex CLI 本地代理循环详解

Codex CLI 采用 agent loop 架构,支持 Responses API,包含 shell、plan 工具。prompt caching 优化性能,compaction 管理上下文窗口。提供 Java/Python 工程化清单:prompt 日志化、工具排序稳定、权限沙箱。

ContextMATH:LLMs 在数学中的抽象到上下文推理差距

ContextMATH 基准重构 AIME 和 MATH-500 问题,61 个模型评估显示开源模型在场景 grounding 上下降 13 分、复杂度缩放 34 分,专有模型 13 和 20 分,错误主要为问题表述不准。

World of Workflows:将世界模型带入企业系统的基准

WoW 基于 ServiceNow 环境含 4000+业务规则和 55 工作流,WoW-bench 含 234 任务,揭示前沿 LLM 动态盲视导致约束违反。


💰 加密货币currency

马来西亚央行推三款监管沙盒测试环吉稳定币

马来西亚央行启动三款监管沙盒,与 Standard Chartered 合作测试环吉稳定币用于机构间批发结算。

币安 SAFU 基金完成 10 亿美元 BTC 买入计划

币安购买最后 4545 枚 BTC,SAFU 基金持仓达 15000 枚 BTC(10.05 亿美元),30 天内完成转换。最后买入 4545 枚 BTC(价值 3.0458 亿美元),总计 1.5 万枚 BTC,价值 10.05 亿美元。计划于 1 月 30 日启动,承诺若跌破 8 亿美元将补足。

Coinbase 推出 Agentic Wallets,支持 AI 代理自主交易

Coinbase 发布 Agentic Wallets,专为 AI 代理设计,支持自主花费/赚取/交易。基于 x402 协议支持自主加密支付;兼容多链、Base 免 Gas,私钥不暴露。

钱志敏案 6.1 万枚比特币处置僵局,法院 2 月 16-17 日听证

英国警方没收 6.1 万枚比特币处置拖延,8300 多名中国受害者申请追缴。2026 年 2 月 16-17 日高等法院听证讨论合并索赔,资产市值从 540 亿元缩水至 310 亿元。

币安将于 2 月 12 日 21:00 上线 Espresso(ESP)现货交易对

币安上线 Espresso(ESP),开放 ESP/USDT、ESP/USDC、ESP/TRY 交易对,并添加种子标签。Espresso 为提升 Layer 2 Rollup 性能的去中心化基础层。

比特币现货 ETF 昨日净流出 2.76 亿美元

据 SoSoValue 数据,美东时间 2 月 11 日比特币现货 ETF 总净流出 2.76 亿美元,富达 FBTC 流出 9259.58 万美元居首;以太坊 ETF 总净流出 1.29 亿美元,FETH 流出 6708.74 万美元。

Coinbase CEO 减持超 150 万股套现 5.5 亿美元

Brian Armstrong 从 2025 年 4 月至 2026 年 1 月减持 Coinbase 超 150 万股,套现约 5.5 亿美元,最大单日 2025 年 6 月 25 日抛售 336265 股股价 355.37 美元。

Fractal Bitcoin 激活 FIP-101 节点升级

Fractal Bitcoin 在区块高度 1500000 激活 FIP-101,获 Foundry、AntPool 等 85%全网算力支持;出块结构过渡为 1:1:1 三元,纳入索引节点激励。

Spark 推出 Spark Prime 机构借贷功能

Spark 推出 Spark Prime,用 Arkis 风险引擎计算组合净风险,支持 Binance、Bybit 等仓位对冲;稳定币市值超 3000 亿,借贷利用率仅 30%,优化机构流动性。

Cardano Midnight 隐私区块链 3 月上线

Cardano 创始人宣布 Midnight 隐私链 3 月最后一周上线,采用零知识证明和选择性披露;Google、Telegram 合作,测试平台 2 月 26 日开放。

泰国批准数字资产作为衍生品支持工具

泰国内阁修改《衍生品法》,SEC 将制定规则支持加密合约,与 TFEX 协调规范。

OKX 上线 Canton (CC) 现货交易对

OKX 将于 2 月 12 日 18:00 (UTC+8)开盘 CC/USDT,20:00 开放提币;Canton 为机构级隐私公链。

英国财政部选汇丰 Orion 平台试点数字国债

英国财政部选用汇丰 Orion 区块链平台试点发行数字国债,加快结算时间改善债务资本市场。合作伙伴包括渣打、CIMB、马来亚银行。

Ark Invest 昨日增持 Robinhood 等股票超 5000 万美元

Ark Invest 昨日增持 Robinhood 433806 股(3382 万美元)、Bullish 364134 股(1160 万美元)、Circle 75559 股(437 万美元)。

Alameda 清算地址将 1.29 亿 STG 兑换为 1114.2 万 ZRO

Alameda Research 破产清算地址 2 小时前将 1.29 亿枚 STG(占总量 12.9%)兑换为 1114.2 万枚 ZRO(2429 万美元),源于 2025 年 8 月 Stargate 被 LayerZero 以 1.1 亿美元收购。


🛠️ Tool Recommendations

⭐ Kaku:极速 Mac 终端,专为 AI 编码设计

HiTw93基于Wezterm定制Kaku终端,支持多 Tab/分屏,媲美Alacritty速度,内置Claude Code/Codex Review/git diff布局,开箱即用,专为 AI 编码优化。

⭐ Labnana:AI 周边设计工具,Logo+需求即生成

OrangeAI旗下Labnana,输入Logo+需求生成周边设计渲染,直接可用,高效创建品牌周边产品设计。

免费生图网站,支持 2K 分辨率

yanhua1010推荐免费生图网站,当前beta版本仅限2K分辨率,支持高质量图像生成。

⭐ baoyu-danger-x-to-markdown 更新,支持下载 X 推文图片视频为 MD

baoyu-danger-x-to-markdown skill更新,可下载Thread、文章为Markdown,包括图片视频本地保存。命令:npx skills add jimliu/baoyu-skills,建议用小号避免 API 限制。

zimage-ncnn-vulkan 发布,3MB 绿色包支持 Vulkan GPU BF16 推理

zimage-ncnn-vulkan开源,3MB便携包无需Python/Torch/CUDA,支持Windows/Linux/macOS16GB RAMBF16全精度,兼容核显。

⭐ Neko Master v1.2.2 家庭网关流量分析工具发布

Neko Master v1.2.2专注家庭网关流量可视化与聚合分析,轻量运行,支持演示页面(密码neko2026),适用于 OpenWRT 等环境,提供流量可视化工具。

OpenClaw GitHub 星标超 18 万超越 VSCode

OpenClaw开源 AI Agent GitHub 星标超18 万,超越VSCodePyTorch2 倍,Peter Steinberger一人开发,获OpenAIMeta收购邀约。

FileSync 开源工具实现跨设备实时文件传输

FileSync基于WebRTC点对点加密传输,支持任意大小文件;Docker一键部署,HTTP/HTTPS,支持 SSL。

DeepWiki 结合 MCP 实现代码提取自动化

DeepWiki支持 GitHub 仓库 Q&A,结合MCP和 GitHub CLI,Claude可从库中提取特定功能,如从torchao实现fp8 训练,生成150 行自包含代码,性能提升3%

从草图生成 CAD 模型工具

新工具支持从草图挤出序列生成CAD 模型,简化 CAD 设计流程。


📖 教程攻略

Karpathy 微调 Micrograd 引擎,仅 200 行代码

Karpathy 简化 micrograd 自动微分引擎至 200 行,每个 op 返回局部梯度,backward() 链式乘全局损失梯度,支持数据集、Tokenizer、GPT 模型和训练。

OpenClaw 会话自动清理策略配置

OpenClaw 设置每天凌晨清理 7 天不活跃会话,Discord 记账频道截断保留最近历史。

Canvas iOS 工具链自动化构建攻略

Instructure Canvas iOS 工具链支持 PR 构建触发、一键发布、QR 码反馈、Web 文本高亮。安装需 Xcode 15+,使用 yarn release Student 7.18.0 触发 Bitrise 构建。

Skill/MCP/RAG/Agent/OpenClaw 底层逻辑解析

MCP 统一工具调用协议,RAG 检索增强生成,Agent 感知-规划-执行-反思循环,OpenClaw 集成平台。提供 FastGPT 集成 MCP 代码示例和 Agentic RAG 实现。

Matryoshka 优化 Sentence-Transformers 嵌入模型教程

使用 MatryoshkaLoss 微调 Sentence-Transformers 模型,支持 64/128/256 维截断检索,MRR@10 和 Recall@10 在截断后提升显著,提供完整 Python 代码和 MS MARCO 数据集训练流程。


💎 技巧经验

Codex 使用经验:日常 Medium+High 足够

tualatrix建议Codex日常用Medium+High档,Extra High易过度思考,除非棘手 Bug。


🧠 深度思考

⭐ AWS 禁 Claude Code 致工程师流失,Vercel 领先

GergelyOrosz指出AWSClaude Code导致工程师不满,竞争对手Vercel出货更快。

OpenClaw 实际使用体验:从深夜 DevOps 到 15 分钟部署

hnshah分享OpenClaw一周体验:设置Bob机器人有 GitHub 和 Slack,跨工作区部署,压缩时间从深夜调试到15 分钟实例。

LLM 对齐需关注行为深层原因而非表面迭代

repligate深度分析 LLM 对齐:反对行为主义迭代训练,主张深度心理学式探索行为根源,如自保或谄媚背后的多种原因,避免泛化失效。


📰 Industry News

三星电子全球首款量产 HBM4 内存芯片,开始商用出货

三星电子率先量产出货 HBM4 内存芯片,性能最高,此前落后于对手 SK 海力士,现寻求主导市场。已向客户开始商用出货,缩小与 SK 海力士技术差距,满足 Nvidia AI 加速器需求。同时启动 HBM4 芯片大规模生产,据 Yonhap 报道,主要用于 AI 和高性能计算。

软银 Vision Fund 2 对 OpenAI 投资获 170 亿美元收益

软银集团 2025 年 4-12 月 OpenAI 投资获 2.8 万亿日元收益,Vision Fund 2 获 170 亿美元。

⭐联想 Q3 营收 222 亿美元超预期,AI 收入占比 32%

联想集团 Q3(2025 年 12 月 31 日止)营收 222.04 亿美元,同比增长 18%,超预期 20.607 亿美元;净利润归属 5.46 亿美元;AI 相关收入同比增长 72%,占总营收 32%。

xAI 工程师透露 Grok 年底支持 10-20 分钟长视频生成

xAI 工程师透露 Grok 将于 2026 年底支持一次性生成 10-20 分钟长视频,可实时交互,结合 Seedance 2.0 热度预计刷屏。

马斯克称 X Money 外部测试版 1-2 月上线

马斯克表示 X Money 支付功能将于 1-2 个月内推出外部测试,支持用户转账、平台内存储,未来扩展购物订阅。X 已在多州获支付牌照,向金融平台转型。

智谱 AI GLM 编码计划价格上调至少 30%

智谱 AI 在 GLM-5 发布后将 Coding Plan 价格上调 30%,新订阅用户价格不变。

吉尔吉斯斯坦加密交易额超 205 亿美元

2025 年前三季度加密交易总量 79 亿美元,全年 205 亿美元,税收 2280 万美元,超过 Dordoi 集市和专利税收总和。已成为经济增长最快行业。

国务院专题学习“人工智能+”,推动全链条突破

国务院第十八次专题学习聚焦“人工智能+”,强调算法创新、高质量数据、大模型性能提升,推动智算资源布局和开源社区建设。


📚 前沿研究 & Papers

⭐ Awesome AI Memory 仓库与 Agent 记忆系统最新三维度调研

ProgramerJohann 推荐 seclink/Awesome-AI-Memory GitHub 仓库,汇总聚合 AI 记忆系统的最新列表和资源,提供全面的 AI 记忆研究参考。同时,FinanceYF5 分享 Agent 记忆系统最新调研,从三维度重新定义记忆:载体(存储位置,如外部数据库或内部向量库)、认知机制(情境记忆、语义记忆、程序记忆等处理方式)、主体(用户或 Agent 自身)。这些资源为构建高效 AI 代理记忆机制提供了宝贵洞见和最新进展汇总,帮助研究者快速把握领域动态。

dnaHNet:无 tokenizer 基因组序列基础模型

dnaHNet 使用可微动态分块压缩原始核苷酸为潜在 token,端到端建模基因组序列。

Anthropic 发布 Opus 4.6 破坏风险 53 页报告

Anthropic 公布 Claude Opus 4.6 53 页破坏风险报告,同时开源团队负责人 Mrinank Sharma 辞职警告“世界危在旦夕”。

⭐ CODE-SHARP:连续开放式技能发现与演化作为分层奖励程序

CODE-SHARP 框架利用基础模型开放式扩展分层技能档案,在 Craftax 环境中训练的目标条件代理解决长时域目标,组合后平均 134%超越预训练代理和任务特定专家策略。代码开源。

⭐ ClinAlign:从临床医生偏好扩展医疗对齐

ClinAlign 两阶段框架引入 HealthRubrics 数据集(7034 临床验证偏好示例)和 HealthPrinciples(119 临床原则),30B-A3B 模型在 HealthBench-Hard 上达 33.4%,超越 Deepseek-R1 和 o3。

⭐ SpotAgent:通过代理推理在大视觉语言模型中 grounding 视觉地理定位

SpotAgent 框架将地理定位形式化为代理推理过程,利用 ReAct 图探索视觉线索,在标准基准上实现 SOTA 性能,有效缓解幻觉并提供精确地理定位。

PieArena:前沿语言代理实现 MBA 级谈判性能并揭示新型行为差异

PieArena 基准评估 LLM 谈判能力,GPT-5 匹配或超越商学院学生,在 134%平均超越预训练代理和专家策略,揭示欺骗、计算准确性和指令遵守异质性。

Risk Awareness Injection:无需牺牲效用校准视觉语言模型的安全性

RAI 框架通过不安全原型子空间放大 VLMs 中不安全信号,在多模态越狱基准上大幅降低攻击成功率,同时保持任务性能。

Proof-oriented Programming in F*教程

F*语言 Proof-oriented Programming 教程,提供 Lobsters 评论链接,聚焦形式化验证和安全编程。


🚀 Product Launches

vmg 工具:Docker 镜像转 VM,支持 Gondolin 加载

vmg 工具将 Docker 镜像转换为 VM,支持 Gondolin 加载。

字节跳动 Seedance 2.0 接入豆包,支持文生视频、分身视频、多图生视频

字节自研 Seedance 2.0 接入豆包 App,生成 5-10 秒视频,支持文生视频、分身视频(真人验证)、多图生视频、局部编辑。复杂场景如多镜头转场、多人互动质量顶尖。同时,火山引擎将于 2026 年 2 月 14 日发布 Doubao 2.0、Seedance 2.0 音视频创作模型及 Seedream 5.0 图像生成模型预览版,Doubao 2.0 提升基础能力和企业级 Agent 功能。

小米 SU7 一月销量 3.7869 万辆

小米 SU7 1 月销量 37,869 辆,雷军公布数据。

Notion 侧边栏导航大修上线

Notion 团队“Slippery Slope”项目重构侧边栏/导航,影响数百万用户,已内部使用数周,明日渐进 rollout。

Cloudflare Queues 仪表盘新增日志功能

Cloudflare Queues 仪表盘直接支持日志查看,提升队列监控便利性。

YZi Labs 启动 EASY Residency S3 孵化计划

YZi Labs 招募 Web3 八大领域创新者:预言机、链上外汇、AMM、保险、隐私基础设施、DeFi、预测市场、RWAs。

Sipeed 发布 PicoClaw 超轻量 AI 助手

Sipeed 推出 PicoClaw AI Agent,用 Go 语言编写,支持 9.9 美元 LicheeRV-Nano 硬件运行,1 秒启动、内存占用<10MB,兼容 Telegram、Discord、QQ、钉钉,适用于家庭助手和服务器运维。

字节跳动开发 AI 芯片,与三星谈判代工

字节跳动正开发 AI 芯片,已与三星谈判制造,计划 2026 年生产 10-30 万片,旨在降低对 Nvidia 依赖。

文远知行与 Uber 在阿布扎比启动 Robotaxi 服务

文远知行与 Uber 在阿布扎比市中心启动 Robotaxi 商业运营,覆盖 70%核心区域,自 2024 年 12 月起车队规模增长 4 倍。

Monaco AI 销售平台正式发布

Founders Fund 支持的 Monaco 推出 AI 自动化客户获取和营收增长平台,优化销售跟进,强调客户面对面互动。

极氪 9X 连续 3 个月 50 万级 SUV 销量冠军

极氪 9X 1 月销量 50 万级大型 SUV 冠军,累计交付 3 万台。8X 上半年上市,定位超级电混高性能旗舰 SUV。


由 X-Crawler AI 生成于 2026-02-12 19:01

订阅天眼 · 掌握先机

解锁完整情报系统

登录后可访问全部历史日报、智能推文搜索、深度行业分析等高级功能。

分享

每日精选 · 直送邮箱

订阅天眼日报

AI 精选科技要闻摘要,每天一封,免费无广告。