天眼日报

科技|2026年02月12日|约 35 分钟阅读

来源：1377 条推文 + 500 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-02-12

AI 速读20 条精选

🤖 AI 大模型

本地 LLM 运行基础教程：从推理到 Transformer 架构详解

TheAhmadOsman 分享本地 LLM 入门指南，覆盖 token 化（BPE/SentencePiece）、推理过程（预测下一个 token）、Transformer 架构（自注意力、MLP、RoPE）、量化（4-bit NF4/GPTQ 节省 VRAM 至 7B 模型 3.5GB）、KV 缓存（每 token 0.5MB）和运行时（llama.cpp、vLLM）。强调 VRAM 瓶颈和调试常见坑。

MiniMax 新模型媲美 Opus 4.6，支持 Claude 和 Pi 代理

MiniMax_AI 模型获早期访问反馈，与 Claude Opus 4.6 性能相当，支持 Claude 和 Pi 代理本地工作流，无任务问题。

Ollama 云端 GLM-5 容量提升，支持 Claude 和 OpenClaw

Ollama 升级 GLM-5:cloud，容量增加速度更快，支持 Claude 和 OpenClaw 全尺寸模型工具调用。

PicoClaw：10 美元硬件运行类 OpenClaw，仅 10MB 内存

aigclink 发布 PicoClaw，用 Go 重构 OpenClaw 核心，节省 99%内存，0.6GHz 单核 1 秒启动，支持全栈开发/日志/搜索，兼容 Telegram/Discord/QQ。

Ant 开源 LLaDA2.1 Flash 模型，推理速度达 892 tokens/s

Ant Open Source 发布 LLaDA2.1 Flash，100B 参数语言扩散 MoE 模型，峰值速度 892 tokens/s，超越 Qwen3-30B-A3B 2.5 倍。采用“草稿后编辑”机制，支持 Speedy Mode 和 Quality Mode 双模式。

PixVerse-R1 实时交互世界生成，720P 1-4 步采样

PixVerse 推出 R1，实时 720P 交互世界，Instantaneous Response Engine 将采样减至 1-4 步，管道重组实现近即时响应。

Agentica 在 ARC-AGI-2 基准创下 85.28%新 SOTA

Agentica 代理使用 350 行代码撰写并运行代码，在 François Chollet 的 ARC-AGI-2（最难基准）达到 85.28%，通用系统非专为 ARC 优化。

智谱 AI 开源 GLM-5 旗舰模型，Coding 与 Agent 能力开源 SOTA，全球排名第 4

智谱 AI 于 2026 年 2 月 12 日正式开源 GLM-5（744B 参数，活跃参数 40B），预训练数据达 28.5T，采用 Slime 框架和异步强化学习。在 Artificial Analysis Intelligence Index 得分 AA=50，全球排名第 4、开源模型第 1；SWE-bench 得分 77.8%（开源 SOTA），Terminal-Bench 2.0 得分 56.2 提升 9%，Finance Agent Benchmark 开源第 1。擅长代理工程、长时序任务如 BrowseComp 和 MCP-Atlas，前端/后端开发领先，逼近 Claude Opus 4.5。以 MIT 许可证完全开源，已适配昇腾、摩尔线程等 10 余款国产芯片。比 GLM-4.7 输入涨 67%、输出涨 45%，GLM-5-Code 输入涨 100%、输出涨 127%。上线 ModelScope 魔搭平台免费试用、Poe 平台。编程套餐调价：Lite/Max 订阅提高，Max 月费 469 元或 80 美元，季度折 10%、年度 30%。

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情

天眼日报

🤖 AI 大模型

本地 LLM 运行基础教程：从推理到 Transformer 架构详解

MiniMax 新模型媲美 Opus 4.6，支持 Claude 和 Pi 代理

Ollama 云端 GLM-5 容量提升，支持 Claude 和 OpenClaw

PicoClaw：10 美元硬件运行类 OpenClaw，仅 10MB 内存

Ant 开源 LLaDA2.1 Flash 模型，推理速度达 892 tokens/s

PixVerse-R1 实时交互世界生成，720P 1-4 步采样

Agentica 在 ARC-AGI-2 基准创下 85.28%新 SOTA

智谱 AI 开源 GLM-5 旗舰模型，Coding 与 Agent 能力开源 SOTA，全球排名第 4

OpenRouter 周令牌消耗达 12.1 万亿，同比增长 12.7 倍

字节跳动豆包上线 Seedance 2.0 视频生成模型，支持实时视频理解

OpenAI 发布 Shell+Skills+Compaction 构建长运行智能体组件

小米开源 47B 机器人 VLA 大模型 Xiaomi-Robotics-0

Cursor 提升 Composer 1.5 和 Auto 使用限额

MiniCPM-SALA 9B 模型发布，支持 1M 上下文

OpenAI Codex CLI 本地代理循环详解

ContextMATH：LLMs 在数学中的抽象到上下文推理差距

World of Workflows：将世界模型带入企业系统的基准

免费先跟踪重点，再决定是否升级

获取下一次重大事件提醒