天眼日报
科技 · 每日情报2026年02月12日约 35 分钟阅读

AI 速读20 条精选
🤖头条智谱开源GLM-5旗舰模型
744B参数、MIT完全开源,编码与Agent能力达开源SOTA,全球排名第4,或重塑开源大模型竞争格局。
🤖头条豆包上线Seedance 2.0
字节将高质量视频生成与实时视频理解推向大众端,支持百万上下文且API降价,AI视频应用门槛进一步降低。
🔲头条三星量产HBM4并出货
AI算力核心部件HBM4进入商用,三星追赶SK海力士,直接影响英伟达等加速器供应链与行业竞争。
🏛头条国务院专题学习AI+
高层明确推进算法、数据、算力与开源社区全链条突破,释放国内AI产业政策支持和资源配置信号。
📰头条联想Q3营收超预期
单季营收222亿美元,AI相关收入占比达32%,显示AI已实质拉动大型硬件厂商业绩与转型。
🤖字节自研AI芯片找三星代工
🤖OpenRouter年化Token暴增
🤖OpenAI发布长程Agent组件
🤖Agentica刷新ARC-AGI-2
🤖MiniMax新模型对标Opus
🦾小米开源机器人VLA模型
🚗文远知行Uber扩展Robotaxi
₿马来西亚测试环吉稳定币
₿Coinbase推AI代理钱包
₿币安SAFU完成10亿美元买币
📈英国试点区块链数字国债
₿比特币ETF单日净流出2.76亿
📦OpenClaw星标超18万
📰AWS禁Claude Code惹争议
💡软银投资OpenAI浮盈170亿
🤖 AI 大模型
本地 LLM 运行基础教程:从推理到 Transformer 架构详解
TheAhmadOsman 分享本地 LLM 入门指南,覆盖 token 化(BPE/SentencePiece)、推理过程(预测下一个 token)、Transformer 架构(自注意力、MLP、RoPE)、量化(4-bit NF4/GPTQ 节省 VRAM 至 7B 模型 3.5GB)、KV 缓存(每 token 0.5MB)和运行时(llama.cpp、vLLM)。强调 VRAM 瓶颈和调试常见坑。MiniMax 新模型媲美 Opus 4.6,支持 Claude 和 Pi 代理
MiniMax_AI 模型获早期访问反馈,与 Claude Opus 4.6 性能相当,支持 Claude 和 Pi 代理本地工作流,无任务问题。Ollama 云端 GLM-5 容量提升,支持 Claude 和 OpenClaw
Ollama 升级 GLM-5:cloud,容量增加速度更快,支持 Claude 和 OpenClaw 全尺寸模型工具调用。PicoClaw:10 美元硬件运行类 OpenClaw,仅 10MB 内存
aigclink 发布 PicoClaw,用 Go 重构 OpenClaw 核心,节省 99%内存,0.6GHz 单核 1 秒启动,支持全栈开发/日志/搜索,兼容 Telegram/Discord/QQ。Ant 开源 LLaDA2.1 Flash 模型,推理速度达 892 tokens/s
Ant Open Source 发布 LLaDA2.1 Flash,100B 参数语言扩散 MoE 模型,峰值速度 892 tokens/s,超越 Qwen3-30B-A3B 2.5 倍。采用“草稿后编辑”机制,支持 Speedy Mode 和 Quality Mode 双模式。PixVerse-R1 实时交互世界生成,720P 1-4 步采样
PixVerse 推出 R1,实时 720P 交互世界,Instantaneous Response Engine 将采样减至 1-4 步,管道重组实现近即时响应。Agentica 在 ARC-AGI-2 基准创下 85.28%新 SOTA
Agentica 代理使用 350 行代码撰写并运行代码,在 François Chollet 的 ARC-AGI-2(最难基准)达到 85.28%,通用系统非专为 ARC 优化。智谱 AI 开源 GLM-5 旗舰模型,Coding 与 Agent 能力开源 SOTA,全球排名第 4
智谱 AI 于 2026 年 2 月 12 日正式开源 GLM-5(744B 参数,活跃参数 40B),预训练数据达 28.5T,采用 Slime 框架和异步强化学习。在 Artificial Analysis Intelligence Index 得分 AA=50,全球排名第 4、开源模型第 1;SWE-bench 得分 77.8%(开源 SOTA),Terminal-Bench 2.0 得分 56.2 提升 9%,Finance Agent Benchmark 开源第 1。擅长代理工程、长时序任务如 BrowseComp 和 MCP-Atlas,前端/后端开发领先,逼近 Claude Opus 4.5。以 MIT 许可证完全开源,已适配昇腾、摩尔线程等 10 余款国产芯片。比 GLM-4.7 输入涨 67%、输出涨 45%,GLM-5-Code 输入涨 100%、输出涨 127%。上线 ModelScope 魔搭平台免费试用、Poe 平台。编程套餐调价:Lite/Max 订阅提高,Max 月费 469 元或 80 美元,季度折 10%、年度 30%。OpenRouter 周令牌消耗达 12.1 万亿,同比增长 12.7 倍
OpenRouter 周消耗 12.1 万亿 token(年化 662 万亿),相当于 Azure 全部推理量,过去一年增长 12.7 倍。字节跳动豆包上线 Seedance 2.0 视频生成模型,支持实时视频理解
字节跳动豆包(Doubao)在 App、桌面和网页端推出 Seedance 2.0 视频生成模型,支持低门槛提示词生成高质量视频,速度更快、积分消耗更少;Seedance 2.0 Fast 略微牺牲效果换取效率。接入豆包 App/电脑端/网页版,已在快手万擎竞猜活动提供 192 次用量。即梦平台上线 Seedance 2.0 Fast。支持 100 万 token 上下文、实时视频理解、API 降价 50%。马斯克评论‘发展太快’,贾樟柯称准备用其做短片。OpenAI 发布 Shell+Skills+Compaction 构建长运行智能体组件
OpenAI 推出 Shell(命令行环境)、Skills(复用指令包)和 Compaction(上下文压缩),支持长时稳定工作流;附 10 个技巧如技能路由、负面示例、网络白名单,构建模式从数据处理到企业 SOP。小米开源 47B 机器人 VLA 大模型 Xiaomi-Robotics-0
小米开源 Xiaomi-Robotics-0,47 亿参数 VLA 模型,支持视觉语言理解和实时执行;基于 Qwen3-VL-4B-Instruct,用于机器人应用。Cursor 提升 Composer 1.5 和 Auto 使用限额
Cursor 宣布 Composer 1.5 成为第二受欢迎模型,增加容量并提高所有个人计划限额:Composer 1.5 使用量为 Composer 1 的 3 倍,至 2 月 16 日限时提升至 6 倍。个人计划用户 Auto 和 Composer 1.5 限额提升。MiniCPM-SALA 9B 模型发布,支持 1M 上下文
面壁智行/面壁智能发布 MiniCPM-SALA,9B 参数,采用稀疏线性注意力混合架构 SALA,在 256K 上下文推理速度比 Qwen3-8B 快 3.5 倍,支持边缘 GPU 1M 上下文,优化文本生成。OpenAI Codex CLI 本地代理循环详解
Codex CLI 采用 agent loop 架构,支持 Responses API,包含 shell、plan 工具。prompt caching 优化性能,compaction 管理上下文窗口。提供 Java/Python 工程化清单:prompt 日志化、工具排序稳定、权限沙箱。ContextMATH:LLMs 在数学中的抽象到上下文推理差距
ContextMATH 基准重构 AIME 和 MATH-500 问题,61 个模型评估显示开源模型在场景 grounding 上下降 13 分、复杂度缩放 34 分,专有模型 13 和 20 分,错误主要为问题表述不准。World of Workflows:将世界模型带入企业系统的基准
WoW 基于 ServiceNow 环境含 4000+业务规则和 55 工作流,WoW-bench 含 234 任务,揭示前沿 LLM 动态盲视导致约束违反。💰 加密货币currency
马来西亚央行推三款监管沙盒测试环吉稳定币
马来西亚央行启动三款监管沙盒,与 Standard Chartered 合作测试环吉稳定币用于机构间批发结算。币安 SAFU 基金完成 10 亿美元 BTC 买入计划
币安购买最后 4545 枚 BTC,SAFU 基金持仓达 15000 枚 BTC(10.05 亿美元),30 天内完成转换。最后买入 4545 枚 BTC(价值 3.0458 亿美元),总计 1.5 万枚 BTC,价值 10.05 亿美元。计划于 1 月 30 日启动,承诺若跌破 8 亿美元将补足。Coinbase 推出 Agentic Wallets,支持 AI 代理自主交易
Coinbase 发布 Agentic Wallets,专为 AI 代理设计,支持自主花费/赚取/交易。基于 x402 协议支持自主加密支付;兼容多链、Base 免 Gas,私钥不暴露。钱志敏案 6.1 万枚比特币处置僵局,法院 2 月 16-17 日听证
英国警方没收 6.1 万枚比特币处置拖延,8300 多名中国受害者申请追缴。2026 年 2 月 16-17 日高等法院听证讨论合并索赔,资产市值从 540 亿元缩水至 310 亿元。币安将于 2 月 12 日 21:00 上线 Espresso(ESP)现货交易对
币安上线 Espresso(ESP),开放 ESP/USDT、ESP/USDC、ESP/TRY 交易对,并添加种子标签。Espresso 为提升 Layer 2 Rollup 性能的去中心化基础层。比特币现货 ETF 昨日净流出 2.76 亿美元
据 SoSoValue 数据,美东时间 2 月 11 日比特币现货 ETF 总净流出 2.76 亿美元,富达 FBTC 流出 9259.58 万美元居首;以太坊 ETF 总净流出 1.29 亿美元,FETH 流出 6708.74 万美元。Coinbase CEO 减持超 150 万股套现 5.5 亿美元
Brian Armstrong 从 2025 年 4 月至 2026 年 1 月减持 Coinbase 超 150 万股,套现约 5.5 亿美元,最大单日 2025 年 6 月 25 日抛售 336265 股股价 355.37 美元。Fractal Bitcoin 激活 FIP-101 节点升级
Fractal Bitcoin 在区块高度 1500000 激活 FIP-101,获 Foundry、AntPool 等 85%全网算力支持;出块结构过渡为 1:1:1 三元,纳入索引节点激励。Spark 推出 Spark Prime 机构借贷功能
Spark 推出 Spark Prime,用 Arkis 风险引擎计算组合净风险,支持 Binance、Bybit 等仓位对冲;稳定币市值超 3000 亿,借贷利用率仅 30%,优化机构流动性。Cardano Midnight 隐私区块链 3 月上线
Cardano 创始人宣布 Midnight 隐私链 3 月最后一周上线,采用零知识证明和选择性披露;Google、Telegram 合作,测试平台 2 月 26 日开放。泰国批准数字资产作为衍生品支持工具
泰国内阁修改《衍生品法》,SEC 将制定规则支持加密合约,与 TFEX 协调规范。OKX 上线 Canton (CC) 现货交易对
OKX 将于 2 月 12 日 18:00 (UTC+8)开盘 CC/USDT,20:00 开放提币;Canton 为机构级隐私公链。英国财政部选汇丰 Orion 平台试点数字国债
英国财政部选用汇丰 Orion 区块链平台试点发行数字国债,加快结算时间改善债务资本市场。合作伙伴包括渣打、CIMB、马来亚银行。Ark Invest 昨日增持 Robinhood 等股票超 5000 万美元
Ark Invest 昨日增持 Robinhood 433806 股(3382 万美元)、Bullish 364134 股(1160 万美元)、Circle 75559 股(437 万美元)。Alameda 清算地址将 1.29 亿 STG 兑换为 1114.2 万 ZRO
Alameda Research 破产清算地址 2 小时前将 1.29 亿枚 STG(占总量 12.9%)兑换为 1114.2 万枚 ZRO(2429 万美元),源于 2025 年 8 月 Stargate 被 LayerZero 以 1.1 亿美元收购。🛠️ Tool Recommendations
⭐ Kaku:极速 Mac 终端,专为 AI 编码设计
HiTw93基于Wezterm定制Kaku终端,支持多 Tab/分屏,媲美Alacritty速度,内置Claude Code/Codex Review/git diff布局,开箱即用,专为 AI 编码优化。⭐ Labnana:AI 周边设计工具,Logo+需求即生成
OrangeAI旗下Labnana,输入Logo+需求生成周边设计渲染,直接可用,高效创建品牌周边产品设计。免费生图网站,支持 2K 分辨率
yanhua1010推荐免费生图网站,当前beta版本仅限2K分辨率,支持高质量图像生成。⭐ baoyu-danger-x-to-markdown 更新,支持下载 X 推文图片视频为 MD
baoyu-danger-x-to-markdown skill更新,可下载Thread、文章为Markdown,包括图片视频本地保存。命令:npx skills add jimliu/baoyu-skills,建议用小号避免 API 限制。zimage-ncnn-vulkan 发布,3MB 绿色包支持 Vulkan GPU BF16 推理
zimage-ncnn-vulkan开源,3MB便携包无需Python/Torch/CUDA,支持Windows/Linux/macOS,16GB RAM跑BF16全精度,兼容核显。⭐ Neko Master v1.2.2 家庭网关流量分析工具发布
Neko Master v1.2.2专注家庭网关流量可视化与聚合分析,轻量运行,支持演示页面(密码neko2026),适用于 OpenWRT 等环境,提供流量可视化工具。OpenClaw GitHub 星标超 18 万超越 VSCode
OpenClaw开源 AI Agent GitHub 星标超18 万,超越VSCode和PyTorch2 倍,Peter Steinberger一人开发,获OpenAI和Meta收购邀约。FileSync 开源工具实现跨设备实时文件传输
FileSync基于WebRTC点对点加密传输,支持任意大小文件;Docker一键部署,HTTP/HTTPS,支持 SSL。DeepWiki 结合 MCP 实现代码提取自动化
DeepWiki支持 GitHub 仓库 Q&A,结合MCP和 GitHub CLI,Claude可从库中提取特定功能,如从torchao实现fp8 训练,生成150 行自包含代码,性能提升3%。从草图生成 CAD 模型工具
新工具支持从草图和挤出序列生成CAD 模型,简化 CAD 设计流程。📖 教程攻略
Karpathy 微调 Micrograd 引擎,仅 200 行代码
Karpathy 简化 micrograd 自动微分引擎至 200 行,每个 op 返回局部梯度,backward() 链式乘全局损失梯度,支持数据集、Tokenizer、GPT 模型和训练。OpenClaw 会话自动清理策略配置
OpenClaw 设置每天凌晨清理 7 天不活跃会话,Discord 记账频道截断保留最近历史。Canvas iOS 工具链自动化构建攻略
Instructure Canvas iOS 工具链支持 PR 构建触发、一键发布、QR 码反馈、Web 文本高亮。安装需 Xcode 15+,使用 yarn release Student 7.18.0 触发 Bitrise 构建。Skill/MCP/RAG/Agent/OpenClaw 底层逻辑解析
MCP 统一工具调用协议,RAG 检索增强生成,Agent 感知-规划-执行-反思循环,OpenClaw 集成平台。提供 FastGPT 集成 MCP 代码示例和 Agentic RAG 实现。Matryoshka 优化 Sentence-Transformers 嵌入模型教程
使用 MatryoshkaLoss 微调 Sentence-Transformers 模型,支持 64/128/256 维截断检索,MRR@10 和 Recall@10 在截断后提升显著,提供完整 Python 代码和 MS MARCO 数据集训练流程。💎 技巧经验
Codex 使用经验:日常 Medium+High 足够
tualatrix建议Codex日常用Medium+High档,Extra High易过度思考,除非棘手 Bug。🧠 深度思考
⭐ AWS 禁 Claude Code 致工程师流失,Vercel 领先
GergelyOrosz指出AWS禁Claude Code导致工程师不满,竞争对手Vercel出货更快。OpenClaw 实际使用体验:从深夜 DevOps 到 15 分钟部署
hnshah分享OpenClaw一周体验:设置Bob机器人有 GitHub 和 Slack,跨工作区部署,压缩时间从深夜调试到15 分钟实例。LLM 对齐需关注行为深层原因而非表面迭代
repligate深度分析 LLM 对齐:反对行为主义迭代训练,主张深度心理学式探索行为根源,如自保或谄媚背后的多种原因,避免泛化失效。📰 Industry News
三星电子全球首款量产 HBM4 内存芯片,开始商用出货
三星电子率先量产出货 HBM4 内存芯片,性能最高,此前落后于对手 SK 海力士,现寻求主导市场。已向客户开始商用出货,缩小与 SK 海力士技术差距,满足 Nvidia AI 加速器需求。同时启动 HBM4 芯片大规模生产,据 Yonhap 报道,主要用于 AI 和高性能计算。软银 Vision Fund 2 对 OpenAI 投资获 170 亿美元收益
软银集团 2025 年 4-12 月 OpenAI 投资获 2.8 万亿日元收益,Vision Fund 2 获 170 亿美元。⭐联想 Q3 营收 222 亿美元超预期,AI 收入占比 32%
联想集团 Q3(2025 年 12 月 31 日止)营收 222.04 亿美元,同比增长 18%,超预期 20.607 亿美元;净利润归属 5.46 亿美元;AI 相关收入同比增长 72%,占总营收 32%。xAI 工程师透露 Grok 年底支持 10-20 分钟长视频生成
xAI 工程师透露 Grok 将于 2026 年底支持一次性生成 10-20 分钟长视频,可实时交互,结合 Seedance 2.0 热度预计刷屏。马斯克称 X Money 外部测试版 1-2 月上线
马斯克表示 X Money 支付功能将于 1-2 个月内推出外部测试,支持用户转账、平台内存储,未来扩展购物订阅。X 已在多州获支付牌照,向金融平台转型。智谱 AI GLM 编码计划价格上调至少 30%
智谱 AI 在 GLM-5 发布后将 Coding Plan 价格上调 30%,新订阅用户价格不变。吉尔吉斯斯坦加密交易额超 205 亿美元
2025 年前三季度加密交易总量 79 亿美元,全年 205 亿美元,税收 2280 万美元,超过 Dordoi 集市和专利税收总和。已成为经济增长最快行业。国务院专题学习“人工智能+”,推动全链条突破
国务院第十八次专题学习聚焦“人工智能+”,强调算法创新、高质量数据、大模型性能提升,推动智算资源布局和开源社区建设。📚 前沿研究 & Papers
⭐ Awesome AI Memory 仓库与 Agent 记忆系统最新三维度调研
ProgramerJohann 推荐 seclink/Awesome-AI-Memory GitHub 仓库,汇总聚合 AI 记忆系统的最新列表和资源,提供全面的 AI 记忆研究参考。同时,FinanceYF5 分享 Agent 记忆系统最新调研,从三维度重新定义记忆:载体(存储位置,如外部数据库或内部向量库)、认知机制(情境记忆、语义记忆、程序记忆等处理方式)、主体(用户或 Agent 自身)。这些资源为构建高效 AI 代理记忆机制提供了宝贵洞见和最新进展汇总,帮助研究者快速把握领域动态。dnaHNet:无 tokenizer 基因组序列基础模型
dnaHNet 使用可微动态分块压缩原始核苷酸为潜在 token,端到端建模基因组序列。Anthropic 发布 Opus 4.6 破坏风险 53 页报告
Anthropic 公布 Claude Opus 4.6 53 页破坏风险报告,同时开源团队负责人 Mrinank Sharma 辞职警告“世界危在旦夕”。⭐ CODE-SHARP:连续开放式技能发现与演化作为分层奖励程序
CODE-SHARP 框架利用基础模型开放式扩展分层技能档案,在 Craftax 环境中训练的目标条件代理解决长时域目标,组合后平均 134%超越预训练代理和任务特定专家策略。代码开源。⭐ ClinAlign:从临床医生偏好扩展医疗对齐
ClinAlign 两阶段框架引入 HealthRubrics 数据集(7034 临床验证偏好示例)和 HealthPrinciples(119 临床原则),30B-A3B 模型在 HealthBench-Hard 上达 33.4%,超越 Deepseek-R1 和 o3。⭐ SpotAgent:通过代理推理在大视觉语言模型中 grounding 视觉地理定位
SpotAgent 框架将地理定位形式化为代理推理过程,利用 ReAct 图探索视觉线索,在标准基准上实现 SOTA 性能,有效缓解幻觉并提供精确地理定位。PieArena:前沿语言代理实现 MBA 级谈判性能并揭示新型行为差异
PieArena 基准评估 LLM 谈判能力,GPT-5 匹配或超越商学院学生,在 134%平均超越预训练代理和专家策略,揭示欺骗、计算准确性和指令遵守异质性。Risk Awareness Injection:无需牺牲效用校准视觉语言模型的安全性
RAI 框架通过不安全原型子空间放大 VLMs 中不安全信号,在多模态越狱基准上大幅降低攻击成功率,同时保持任务性能。Proof-oriented Programming in F*教程
F*语言 Proof-oriented Programming 教程,提供 Lobsters 评论链接,聚焦形式化验证和安全编程。🚀 Product Launches
vmg 工具:Docker 镜像转 VM,支持 Gondolin 加载
vmg 工具将 Docker 镜像转换为 VM,支持 Gondolin 加载。字节跳动 Seedance 2.0 接入豆包,支持文生视频、分身视频、多图生视频
字节自研 Seedance 2.0 接入豆包 App,生成 5-10 秒视频,支持文生视频、分身视频(真人验证)、多图生视频、局部编辑。复杂场景如多镜头转场、多人互动质量顶尖。同时,火山引擎将于 2026 年 2 月 14 日发布 Doubao 2.0、Seedance 2.0 音视频创作模型及 Seedream 5.0 图像生成模型预览版,Doubao 2.0 提升基础能力和企业级 Agent 功能。小米 SU7 一月销量 3.7869 万辆
小米 SU7 1 月销量 37,869 辆,雷军公布数据。Notion 侧边栏导航大修上线
Notion 团队“Slippery Slope”项目重构侧边栏/导航,影响数百万用户,已内部使用数周,明日渐进 rollout。Cloudflare Queues 仪表盘新增日志功能
Cloudflare Queues 仪表盘直接支持日志查看,提升队列监控便利性。YZi Labs 启动 EASY Residency S3 孵化计划
YZi Labs 招募 Web3 八大领域创新者:预言机、链上外汇、AMM、保险、隐私基础设施、DeFi、预测市场、RWAs。Sipeed 发布 PicoClaw 超轻量 AI 助手
Sipeed 推出 PicoClaw AI Agent,用 Go 语言编写,支持 9.9 美元 LicheeRV-Nano 硬件运行,1 秒启动、内存占用<10MB,兼容 Telegram、Discord、QQ、钉钉,适用于家庭助手和服务器运维。字节跳动开发 AI 芯片,与三星谈判代工
字节跳动正开发 AI 芯片,已与三星谈判制造,计划 2026 年生产 10-30 万片,旨在降低对 Nvidia 依赖。文远知行与 Uber 在阿布扎比启动 Robotaxi 服务
文远知行与 Uber 在阿布扎比市中心启动 Robotaxi 商业运营,覆盖 70%核心区域,自 2024 年 12 月起车队规模增长 4 倍。Monaco AI 销售平台正式发布
Founders Fund 支持的 Monaco 推出 AI 自动化客户获取和营收增长平台,优化销售跟进,强调客户面对面互动。极氪 9X 连续 3 个月 50 万级 SUV 销量冠军
极氪 9X 1 月销量 50 万级大型 SUV 冠军,累计交付 3 万台。8X 上半年上市,定位超级电混高性能旗舰 SUV。由 X-Crawler AI 生成于 2026-02-12 19:01
每日精选 · 直送邮箱
订阅天眼日报
AI 精选科技要闻摘要,每天一封,免费无广告。