天眼早报

科技|2026年04月08日|33 分钟阅读
来源:1480 条推文 + 296 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-04-07 — 2026-04-08
分享
AI 速读16 条精选
🤖头条智谱开源744B模型GLM-5.1

参数达744B,评测位列开源第一,支持连续8小时自主运行的长时程Agent能力,大幅提升开源大模型实用性与商业价值。

🤖头条Anthropic发布前沿安全模型

新模型Claude Mythos Preview找漏洞能力超越人类安全专家,已发现数千高危漏洞,将重塑网络安全防御格局。

📰头条伊美达成两周停火协议

美国与伊朗接受斡旋达成停火,将于伊斯兰堡正式谈判,直接导致WTI原油盘中暴跌15%,大幅缓解全球能源焦虑。

🔲头条Intel加入马斯克Terafab计划

Intel将与Tesla、xAI等共同推进一体化芯片制造,覆盖逻辑、存储与先进封装,试图在同一体系内整合关键环节,重塑行业格局。

📰美以空袭伊朗原油出口枢纽
📦开源AI记忆系统MemPalace发布
🤖Zapier开放Agent专属SDK
📰MIT用AI集群实现材料设计突破
🔍AI编程致App Store新应用激增
📰Agent数据访问或成SaaS存亡关键
📰特斯拉FSD完成850英里零接管
💡AI数据中心Firmus估值达55亿
📰台湾推动去中国化无人机供应链
📰Cloudflare提前后量子安全目标
📰低成本云端GPU跑大模型方案
📰Google在印度升级AI购物体验

🤖 AI 大模型

𝕏 🔥 智谱开源 GLM-5.1 模型,长时程 Agent 能力大幅提升

智谱 AI正式开源GLM-5.1模型,参数规模达744B,采用 MIT 许可开放权重。该模型在SWE-Bench Pro上跑出 58.4 分,并在 Terminal-Bench、NL2Repo 等评测中位列开源第一,超过 Opus 4.6、GPT-5.4 等模型。此外,它支持长时程Agent自主运行,可连续运行8 小时处理长周期任务,API 已同步上线。同时,GLM 5 Turbo 与 GLM 5.1 在 Design Arena 分别拿到 1355 和 1352 Elo。

𝕏 🔥 Anthropic 发布 Claude Mythos Preview 及 Project Glasswing 安全计划

Anthropic发布新前沿模型Claude Mythos Preview,并推出Project Glasswing安全项目。官方称该模型发现软件漏洞的能力超过绝大多数人类安全专家,目前已发现数千个高危漏洞,覆盖主流操作系统、浏览器与关键基础软件。同时,Anthropic 开放了技术报告以说明漏洞与利用链细节。

𝕏 🟢 Cognition 发布 SWE-1.6,提升编码模型速度与交互体验

Cognition发布SWE-1.6,在SWE-Bench Pro达到与预览版相当表现,并上线 Windsurf 免费与高速两档模式。

𝕏 🟢 Google 下调 Veo 3.1 Fast 价格

Google AI Devs宣布Veo 3.1 Fast已实行降价

𝕏 🟢 AI Agent 核心模型选型指南与分级清单

针对 OpenClaw 等 Agent 的模型选型清单发布GPT-5.4 等列为第一梯队;MiniMax M2.7Kimi K2.5 适合执行层;Qwen3.6 PlusLlama 4 Maverick 兼顾平衡;Gemma 4 31B 领跑本地推理。

𝕏 🔥 开源 AI 记忆系统 MemPalace 发布,实现 100% 长文本召回率

开发者开源本地化 AI 记忆系统MemPalace,引入六层空间结构与AAAK无损压缩语言,将 1950 万 Token 年记忆量压缩至65 万 Token,在LongMemEval基准测试中实现**100%**召回率。


🛠️ AI 工具推荐

𝕏 🟢 LangSmith Fleet 接入 Arcade,可调用 8000+企业工具

LangSmith Fleet接入Arcade后可连接**8000+**企业工具,支持无代码构建类似 Claude Cowork 的智能体,并覆盖 GitHub、Salesforce、Zendesk 等系统。

𝕏 🟢 Hermes Agent 对比 OpenClaw:自进化技能与双层记忆更适合长期运行

Hermes Agent支持自动沉淀技能文档SQLite双层记忆与五层安全防护,文章结合3 万星标与多项架构差异,适合评估自托管智能体选型。

𝕏 🟢 Runway Characters 新增摄像头与屏幕共享

Runway Characters现支持摄像头屏幕共享,可通过 API 实时查看并理解用户画面后作出响应。

𝕏 🟢 shadcn 新增 apply 命令,可一键替换整套 UI 预设

shadcn新增npx shadcn apply,可一次性替换组件、主题、颜色、字体与图标,适合快速重构前端样式。

𝕏 🟢 Rowboat 发布:本地优先的 AI 知识图谱协作助手

Rowboat定位为 AI 同事,可汇总邮件、会议、工作记录生成动态知识图谱,并基于图谱执行任务;产品强调开源、本地优先、语音驱动

𝕏 🟢 Pixa 通过 MCP 把 Claude 接入图片与视频工作能力

Pixa通过MCPClaude可调用去背景、图像生成和视频生成等工具

𝕏 🟢 Prism 新增论文评审 AI 工作流

Prism上线Paper Review,用于技术与科学论文评审和复现性检查。

𝕏 🟢 Fal 上线 Ideogram 3.0 透明图与文字分层能力

fal接入Ideogram 3.0,支持透明 PNG 与可编辑文字图层。

𝕏 🟢 Zapier 开放 AI Agent 专属 SDK,支持接入 8000+ 应用

Zapier 正式公测其 Agent SDK,开发者可将其集成至 CursorClaude Code 等 AI 编程助手中,使 Agent 直接获得调用 8000 多款 应用程序 API 的能力

𝕏 🟢 开源工具 Code-Review-Graph 大幅降低 AI 编程 Token 消耗

开源项目 Code-Review-GraphClaude Code 等工具构建本地代码知识图谱,通过 Tree-sitter 仅解析相关文件,平均降低 8.2 倍 Token 消耗,增量更新仅需 2 秒


📖 教程攻略

🟩 🟢 如何以 57 美分成本在云端 GPU 处理 33 万 Token

开发者分享通过Vast.ai按小时租用H200 GPU(4.14 美元/小时)运行开源模型的经验,利用vLLM处理33.5 万 Token仅耗费0.57 美元,大幅降低 AI 使用成本。

𝕏 🟢 LlamaIndex 联合 LanceDB 给出结构感知 PDF 问答方案

LlamaIndex联合LanceDB展示结构感知 PDF QA 流程:用 LiteParse提取文本与截图、向量写入数据库,再由Claude按需进行图像推理。

𝕏 🟢 用 30k 篇 arXiv 论文转 Markdown 构建可聊天论文库

新博客展示如何3 万篇 arXiv 论文转成Markdown,结合开源 OCR 模型Chandra 2Hugging Face Jobs与 Codex 的 SKILL.md 流程,实现论文可检索与对话。

𝕏 🟢 Claude Code 技能可生成带逐词引用的深度研究报告

/research-docs技能可解析PDF、Word、Pptx,生成带逐词引用与定位框的 HTML 报告。

𝕏 🟢 Karpathy 式个人知识库方案:3 个文件夹加 CLAUDE.md

这套方法用raw/wiki/outputs三层目录和CLAUDE.md规则文件,让 AI 自动整理个人知识库

𝕏 🟢 Hermes 从 0 到 1 教程:在 OpenClaw 环境继续使用 Claude

该教程介绍通过Hermes接入Claude,用于替代 OpenClaw 受限后的使用路径。


💎 技巧经验

𝕏 🟢 Agent 能力优化应优先迭代上下文层,而非只盯模型层

实践观点认为提升智能体有模型执行框架上下文三层,其中技能与指令最易快速迭代,适合当前团队优先优化。

𝕏 🟢 控制大模型成本:优化 token 消耗可节省数百美元/天

开发者分享使用优化工具后,将日开销从接近1000 美元/天拉回,说明在Claude与智能体场景中精细化控制 token 很有必要。


⚡ 工作流

𝕏 🟢 OpenAI Prism 新增论文审阅工作流,面向科研评估与复现

OpenAI Prism新增Paper Review工作流,用于技术与科学论文审阅,强调提升严谨性正确性可复现性

𝕏 🟢 Rocket 1.0 主打先决策后生成的 AI 产品工作流

Rocket 1.0强调在写代码前先完成研究、方案和竞品跟踪,统一产品决策上下文。

𝕏 🟢 开发者开源 Waza:专为 AI 编程打造的 8 项核心 Skill 集合

开发者开源了轻量级 AI 技能集 Waza包含 /think(架构思考)、/hunt(系统排查)、/health(工具链体检)等 8 个 纯 Markdown 格式的指令,优化工程师与 AI 的协作工作流。


📚 论文研究

FeatureBench 提出可扩展的 Agentic Coding 评测框架

FeatureBench面向真实代码特性开发评测,任务平均涉及790.2 行代码修改,并原生适配OpenHandsClaude Code,试图替代只偏向修 bug 的 SWE-bench 范式。

𝕏 🟢 技能检索越真实,Agent 性能越易退化,研究提出按查询精炼技能

新研究显示在大规模、噪声化技能库下,智能体表现会逼近无技能基线;通过query-specific skill refinement可将Claude Opus 4.6Terminal-Bench 2.057.7%提升到65.5%

𝕏 🟢 状态投毒研究指出 Agent 持久记忆可被系统级利用

针对智能体记忆的新研究提出State Poisoning风险,污染能力、身份、知识任一维度后,攻击成功率可达64%-74%,且跨会话持续存在。

𝕏 🟢 密歇根大学发布物理 AI 错误定位研究与数据集

密歇根大学团队发布CVPR 2026论文,聚焦物理 AI 助手的错误解释问题;同时公开论文、项目页、代码、数据集和权重提升机器人任务中“错在哪、何时错、哪里错”的可解释性

𝕏 🟢 Hugging Face 开源双臂机器人折衣项目

LeRobot/Hugging Face公开机器人折衣项目,使用8 套双臂装置100+小时示范数据5000+ GPU 小时训练,并分享代码、数据和工程细节。

𝕏 🟢 连续语言扩散方法宣称可单次前向完成高效推理

Flow maps语言建模方法显示,FMLM在单次前向传播下也能得到不错结果

𝕏 🟢 交互式世界模型研究尝试从大规模人类视频学习

新研究提出大规模人类视频训练交互式世界模型

𝕏 🟢 MIT 团队利用 AI 智能体集群实现跨学科材料设计零干预突破

MIT 研究团队通过 ScienceClaw 智能体集群,在零人类干预下跨越生物学与声学领域,自主发现并验证了全新的分层肋膜晶格谐振器设计,其最佳共振频率达 2.116 kHz


🚀 产品发布

𝕏 🟢 Google 在印度升级 AI 购物体验,Gemini 接入商品搜索与比价

Google在印度推出三项购物 AI 升级Gemini内嵌可购买结果、AI Mode 对话式购物,以及新版 Circle to Search。底层依托500 亿商品的 Shopping Graph,每小时更新 20 亿条信息。

𝕏 🟢 X 发布新版图片编辑器,支持 Grok 文生图编辑与打码模糊

X在 iOS 推出新版图片编辑器,新增Grok驱动的文字编辑、局部模糊打码功能,Android 版本随后上线。

𝕏 🟢 Google Chrome 上线垂直选项卡与沉浸式阅读模式

Google Chrome开始推送垂直选项卡沉浸式阅读模式,前者支持把标签移动到浏览器侧边栏以改善多标签浏览,后者可在整页界面中去除干扰元素提供专注阅读体验。

𝕏 🟢 Niantic Spatial 发布 Scaniverse,升级空间智能平台入口

Niantic Spatial推出新版Scaniverse,支持 VPS 地图、网格与 Gaussian splats 生成,并预告NSDK 4.0统一支持 Unity、Swift、Android 与 ROS 2。

𝕏 🔥 Intel 加入马斯克 Terafab 芯片制造计划

Intel加入Terafab项目,将与 Tesla、xAI、SpaceX 共同推进一体化芯片制造,覆盖逻辑、存储与先进封装,试图在同一体系内整合关键环节。

𝕏 🟢 deepagents v0.5 发布异步子代理与多模态文件系统支持

deepagents v0.5新增异步子代理、多模态文件系统与新后端接口。

𝕏 🟢 Waymo 在纳什维尔正式推出无人驾驶出租车服务

Waymo宣布在纳什维尔正式开放无人驾驶出租车服务,并与Lyft达成合作,用户可通过应用直接叫车。

𝕏 🟢 Adobe 推出免费 AI 学习工具 Acrobat Spaces

Adobe面向学生群体推出免费 AI 驱动学习工具Acrobat Spaces,旨在提升文档处理和学习效率。


🌍 国际大事

伊美达成两周停火协议,将于伊斯兰堡举行正式谈判

美国伊朗正式接受巴基斯坦斡旋,达成两周停火协议。双方将于 4 月 10 日在伊斯兰堡开启正式谈判,受此影响,WTI 原油价格盘中暴跌 15%。此前,特朗普曾威胁若不重开霍尔木兹海峡将打击伊朗发电设施,但在巴基斯坦总理的斡旋下,双方最终达成妥协。

美以联军空袭伊朗哈尔克岛原油出口枢纽及石化设施

美国以色列对伊朗发起猛烈空袭,摧毁哈尔克岛原油出口枢纽及伊斯兰革命卫队设施,并导致伊朗两条主要铁路干线全面停运。此外,伊朗马赫沙赫尔石化特区的阿米尔·卡比尔等石化厂及阿拉克铝厂也遭到袭击,部分设施严重受损。

𝕏 🟢 中东多国采取紧急措施应对安全局势升级

因地区安全局势升级,科威特内政部要求居民在 4 月 7 日午夜至 4 月 8 日 6 点期间尽量留在家中,以便安全部门应对突发情况。同时,APM Terminals Bahrain宣布自 4 月 8 日凌晨起暂停哈利法·本·萨勒曼港运营,时间点与地区冲突升级预期重叠。

𝕏 🟢 NASA 确认 Artemis II 已脱离月球引力范围并返航

NASA表示Orion飞船已脱离月球引力范围Artemis II乘组正返航,计划于 4 月 10 日溅落。

𝕏 🟢 欧洲人愈发认为北约陷入危机

经济学人分析称,随着美国与欧洲盟友关系转弱,欧洲对北约危机的担忧上升


📈 财经市场

𝕏 🔥 Tasklet 完成 2000 万美元融资,ARR 升至 500 万美元

Tasklet宣布完成2000 万美元融资,由USVLightspeedYC等参与;公司称今年收入增长超1200%,年化经常性收入达500 万美元

𝕏 🟢 Firmus 估值达到 55 亿美元,获英伟达支持建设 AI 数据中心

Firmus作为获英伟达支持的 AI 数据中心建设商,最新估值达到55 亿美元,反映 AI 基础设施资本热度持续上升。

𝕏 🟢 圭亚那石油周收入升至 6.23 亿美元,战争推高能源红利

圭亚那石油收入从战前每周约3.7 亿美元升至6.23 亿美元,能源出口激增正重塑该国经济结构。

𝕏 🟢 YC 投资组合公司 Mosaic 完成 380 万美元种子轮融资

Mosaic完成380 万美元种子轮融资,主打 AI 视频编辑代理;其工作流已被全球代理公司、平台和新闻网络用于扩大内容生产规模。

𝕏 🟢 Anthropic 挖来前微软 AI 平台主管 Eric Boyd 负责基础设施

Anthropic聘请前微软AI 平台主管Eric Boyd出任基础设施负责人,以支撑Claude Code需求增长及数据中心扩张。

𝕏 🟢 Joby 与 Air Space Intelligence 合作布局高密度 eVTOL 空域管理

JobyAir Space Intelligence合作,把飞行运营与Flyways AI结合,面向高密度 eVTOL 空域调度。

💻 🟢 风投 Eclipse 筹集 13 亿美元投资物理 AI 初创公司

风险投资公司Eclipse宣布筹集13 亿美元新基金,将专门用于投资和孵化物理 AI领域的初创企业。


🏭 工业能源

𝕏 🟢 台湾推动去中国化无人机供应链,地缘政治重塑制造布局

经济学人关注台湾发展不含中国零部件的无人机产业链,这一动向反映出地缘政治正在加速重塑无人机供应链与国防制造体系。随着各方寻求降低对中国零部件依赖,区域化、可信化与安全可控正成为无人机产业链重构的重要方向。

𝕏 🟢 特斯拉称 FSD Supervised 完成 850 英里零人工接管行驶

特斯拉展示FSD Supervised完成850 英里连续行驶,过程中包含停车与充电,且全程零人工接管。该演示强调其辅助驾驶系统在长距离复杂流程中的连续执行能力,也为外界观察自动驾驶从单段通行向完整出行闭环推进提供了新的参考样本。

𝕏 🟢 AI 编程工具推动 App Store 新应用上架量激增 84%

AI 编程工具普及影响,App Store在 2026 年初新应用上架量激增84%,增长主要集中于生产力等类别。与此同时,苹果已开始限制部分应用上架,显示低门槛生成式开发正在迅速抬高应用供给,但平台审核与质量控制压力也在同步上升。

𝕏 🟢 Ondas 获 2026 年 FIFA 世界杯反无人机保护系统合同

Ondas宣布其Sentrycs系统被选中,2026 年 FIFA 世界杯全部 16 个主办城市提供反无人机保护,合同价值达数百万美元。该项目表明大型国际赛事对低空安全与反无人机防御的需求正在提升,也凸显相关系统在关键基础设施和重大活动安保中的商业化落地速度。

𝕏 🟢 开源 Unreal Robotics Lab 插件将 MuJoCo 物理引擎接入虚幻引擎

Unreal Robotics Lab发布开源插件,将MuJoCo物理与Unreal Engine结合,用于高保真机器人仿真。该工具有助于把更真实的物理交互与更强的图形环境统一到同一开发流程中,为机器人训练、验证与仿真测试提供更接近真实环境的基础设施。

𝕏 🟢 Uber 扩展与 AWS 合作,部署 Graviton4 并试点 Trainium3

Uber宣布扩展与Amazon AWS的合作,部署Graviton4支撑实时运营,并试点Trainium3训练匹配和推荐 AI 模型。这表明大型平台公司正进一步采用云厂商自研芯片优化成本与性能,在在线业务推理和模型训练之间构建更细分的算力分工。

𝕏 🟢 AI 训练与验证负载变化使数据中心架构瓶颈转向 CPU 并行执行层

行业讨论指出,AI 已从静态推理转向训练闭环、持久执行与验证负载,并行 CPU 环境与执行层正成为新一代数据中心架构瓶颈。随着工作负载愈发强调编排、调度与多任务协同,系统压力不再只集中在加速器本身,而是更多转移至 CPU 并行层和整体架构协同能力。

𝕏 🟢 660 美元双臂移动机器人方案瞄准低成本实验平台

有项目展示660 美元双臂移动机器人方案,组装时间约4 小时,突出低成本、快速搭建的实验属性。该类平台有望降低机器人教学、研究和早期验证门槛,使更多开发者能够以较低预算开展移动操作相关测试与原型迭代。


🧠 深度思考

𝕏 🟢 OpenClaw 仍处于“苹果 I 阶段”,通用可用的 Agent 平台尚未到来

开发者以配置损坏与手动修复经历指出,OpenClaw虽已展现强大潜力,但仍像Apple I时代的 DIY 主板,真正面向大众可直接使用的智能体平台尚未成熟

𝕏 🟢 企业未来可能不是因为省钱而停用 SaaS,而是无法被 Agent 直接访问数据

观点认为,企业放弃SaaS的核心原因将从成本转向Agent 无法访问自有数据,更多业务数据或回流到关系型数据库以减少集成复杂度。

𝕏 🟢 谷歌错过 ChatGPT 式发布窗口,核心不是技术落后而是产品门槛更高

Sundar Pichai回顾称,Google 在2022 年已做出接近 ChatGPT 的 LaMDA 产品化形态,但因毒性与质量门槛未选择大规模发布。

𝕏 🟢 ⭐ Cline 提出 AI 行业存在模型监控盲区

Cline指出模型质量可能在生产环境中静默退化,团队往往把问题误判为代码缺陷,因此需要建立模型无关架构与持续监控机制。

𝕏 🟢 Browserbase 被视为修复浏览器智能体基础设施断层

分析认为Browserbase把登录、点击、运行代码和模型切换整合到一个服务中,解决智能体在真实网站环境中的执行断点

𝕏 🟢 Notion 认为智能体瓶颈已从写代码转向可访问界面

Notion开发者观点认为,随着模型增强,智能体真正瓶颈已从代码生成转向能否触达现实工作系统的交互层

𝕏 🟢 Demis Hassabis 谈 AI 实验室分化:算法突破比堆资源更关键

Demis Hassabis认为领先实验室正在拉开差距,原因是新工具能更快构建下一代系统,而未来优势将更多取决于能否持续产生新算法突破


📰 综合新闻

𝕏 🟢 ⭐ 俄罗斯政府黑客入侵数千台家用路由器窃取密码

TechCrunch披露,俄罗斯政府黑客入侵数千台家用路由器以窃取密码,显示消费级网络设备仍是国家级攻击的重要入口。

𝕏 🟢 NASA 发布阿耳忒弥斯 2 号月球轨道日食与地落照片

NASA发布阿耳忒弥斯 2 号任务最新高分辨率图像,展示了从月球轨道拍摄的日食奇观以及类似阿波罗 8 号的地落画面。


💡 生活建议

𝕏 🟢 做有趣但能拉伸能力边界的副项目,可能带来长期复利

WordPlay累计完成2.5 亿局游戏,站点仍有1 万+日活;作者认为做能锻炼新能力的兴趣项目,本身就是长期收益。


🛡️ 安全防护

𝕏 🟢 Cloudflare 将全面后量子安全目标提前至 2029 年

鉴于量子硬件和软件的快速进展,Cloudflare宣布将其实现全面后量子安全的目标时间表提前至2029 年


由 X-Crawler AI 生成于 2026-04-08 08:11

订阅天眼 · 掌握先机

解锁完整情报系统

登录后可访问全部历史日报、智能推文搜索、深度行业分析等高级功能。

分享

每日精选 · 直送邮箱

订阅天眼日报

AI 精选科技要闻摘要,每天一封,免费无广告。