天眼日报

🤖 AI 大模型
Taalas 推出 HC1 芯片,Llama3.1-8B 推理达 17000 tokens/s
Taalas 发布 HC1 ASIC 芯片,将 Meta Llama3.1-8B 模型硬编码,支持 17000 tokens/s 推理速度,0.75 美分/百万 tokens 成本,功耗 12-15kW/机架。融资 1.69 亿美元,比 Cerebras 快 10 倍。
Claude Code 升级 2.1.50,支持 Git Worktree 并行代理
Claude Code 升级至 2.1.50 版本,新增 Git Worktree 功能,允许多个子代理独立工作区并行运行,避免干扰。CLI 版本新增内置 git worktree 支持,每个代理独立工作树,桌面版已支持,现扩展至 CLI。
Claude Code 桌面版新增嵌入式开发服务器预览和 PR 监控功能
Anthropic 的 Claude Code 桌面版新增嵌入式浏览器预览开发服务器、实时日志查看、PR CI 监控和自动修复/合并功能。支持会话迁移到云端,解决模型无法直接验证 UI 和 CI 结果的痛点,提升开发效率。
OpenAI 5 年收入预测上调 27%,2025 年达 300 亿美元
OpenAI 去年收入 131 亿美元(超预期 1 亿美元),今年目标 300 亿美元、明年 620 亿美元。推理成本去年 80 亿美元、今年 140 亿美元,训练成本今年 320 亿美元。ChatGPT 周活峰值 9.1 亿。
Gemini 3.1 Pro 基准测试超 Claude Opus 4.6,OpenClaw 配置支持
Google 的 Gemini 3.1 Pro Preview 在多项基准领先 Claude Opus 4.6,价格不到一半。通过 OpenRouter 零数据保留端点接入 OpenClaw,上下文限 20 万 token。
Anthropic 推出 Claude Code Security,发现开源项目 500+漏洞
Anthropic 发布 Claude Code Security 工具,扫描开源代码库发现 500+漏洞,这些漏洞经人类多次审查未被发现。工具模拟人类阅读代码,提供针对性补丁,改变网络安全岗位格局。预览版可扫描代码库漏洞并建议软件补丁供人工审核,发现传统工具遗漏问题,发布后 Cloudflare 股价跌 8%,影响网安行业。
Anthropic 研究:分析数百万 Claude Code 交互,评估 AI 代理自治度
Anthropic 新研究分析数百万次 Claude Code 和 API 交互,评估用户授予代理自治度、部署场景及风险。揭示代理实际使用模式及潜在隐患。
METR 评估 GPT-5.3-Codex 高推理努力下 50%时间视界约 6.5 小时
METR 使用 Triframe 框架评估 GPT-5.3-Codex(high 推理),软件任务 50%时间视界约 6.5 小时(95% CI 3-17 小时)。OpenAI 提供 API 访问,与 Codex 框架结果相似。
scaling01 分析 SWE-Bench-Verified 上限至少 91.2%
SWE-Bench-Verified 中 44/500(8.8%)任务对顶级模型如 Opus 4.6 仍太难,上限至少 91.2%。GPT-5.1 通过率 65.9%,独解 2 任务;Gemini 3.0 Pro 独解 3 任务。
Claude Code 团队工程原则:Never bet against the model
Claude Code 团队引用《The Bitter Lesson》,强调通用模型优于特化方法。工程权衡:scaffolding 短期提升 10-20%,但易成技术债;未来焦点转向自动化测试和模型评测。
Aru AI 发布:安全数据存储的个人 AI 助手,支持儿童和成人模式
Aru AI 是个人 AI 助手,支持 Gemini、OpenRouter 或本地模型(如 Ollama)。所有聊天、嵌入和设置存储在本地 SQLite 数据库中,不上传服务器。包含 LLM 模块(语言模型)、语义模块(记忆事实)和启发式模块(情绪和性格)。儿童模式拒绝成人话题,青少年模式提供咨询,成人模式无限制。2026-02-21 发布,支持多语言界面。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。