天眼日报
科技 · 每日情报2026年03月28日约 38 分钟阅读
AI 速读27 条精选
🤖头条苹果拟让Siri接入外部AI
苹果或把Siri变成AI路由层,允许接入ChatGPT等助手,重塑移动端入口与AI分发格局。
🤖头条OpenAI星门数据中心开建
Stargate密歇根项目进入实建阶段,指向5GW级算力竞争,AI基础设施军备赛继续升级。
🏛头条GitHub将用Copilot数据训练
免费和Pro用户默认被纳入训练,微软可访问相关数据,开发者隐私与代码使用边界再起争议。
🏛头条Anthropic获令阻止军方封杀
法院认定五角大楼封杀Claude或涉违宪报复,影响美国国防AI采购与大模型进入政府市场。
🏛头条荷兰法院叫停Grok裸图生成
法院以GDPR为依据紧急禁令限制真人裸体生成,或推动欧盟AI生成内容监管进一步收紧。
🤖Meta发布SAM 3.1
🤖Mistral开源Voxtral语音模型
🤖TurboQuant大幅压缩KV缓存
🤖GPT-5.4系列登顶榜单
🤖Google资助Anthropic数据中心
📰Gemini API新增月度限额
🤖Perplexity扩大三星合作
📰Google耳机实时翻译上线iOS
🏛GitHub被指默认用私有代码训练
📰Google提前推进后量子迁移
🤖AA-AgentPerf发布硬件基准
🤖MIT提出多答案强化学习
🤖FeatureBench评测代理编程
📦Chroma开源20B搜索代理
📰钉钉开源Agent CLI工具
📦Insanely Fast Whisper提速19倍
📰LlamaParse强化PDF表格提取
📰Cline加入Kanban看板
🦾Unitree开源人形机器人数据集
🤖ARC Prize发布ARC-AGI-3
📰索尼4月全球上调PS5价格
🏥上海支持高端家用医疗设备
🤖 AI 大模型
⭐ TurboQuant:llama.cpp 3.5x KV 缓存压缩
TurboQuant CUDA 实现3.5x KV 缓存压缩,质量优于 q8_0(PPL 降低1.17%),RTX 3090 24GB支持Q6 Qwen3.5 27B 128K上下文,预填充速度99.6%,解码97.5%。⭐ Mistral Voxtral TTS:3B 参数开放语音模型
Mistral发布Voxtral,3B+390M+300M参数分层架构,6x实时速度,90ms首音频,支持9语言,5s音频克隆,人评优于ElevenLabs 62.8%-69.9%。⭐ Claude Code 即将发布 2.1.86 版本
ClaudeCodeLog 宣布 Claude Code 2.1.86 即将发布,支持代码执行和开发工作流优化。Anthropic 赢得联邦法院禁令,阻止五角大楼封杀 Claude
联邦法官 Rita Lin 发布初步禁令,认定五角大楼对 Anthropic 的封杀系 第一修正案 报复,而非国家安全措施。Anthropic 此前获 Top Secret 许可和 2 亿美元 DoW 合同,此举影响国防 AI 部署。⭐ Meta发布SAM 3.1,引入对象多路复用大幅提升视频处理效率
Meta发布SAM 3.1,作为SAM 3的即插即用更新,支持单次前向传播跟踪最多16个对象,H100上16对象处理达30FPS(SAM 3仅10FPS),128对象下仍保持11.46FPS。无需牺牲准确性,适用于更小硬件。Claude Code新增原生PowerShell支持
Claude Code现原生运行PowerShell,提升 Windows 开发效率。⭐ GPT-5.4 系列模型登顶 Text Arena 排行榜
OpenAI的GPT-5.4-Mini-High排名#22整体,定价$0.75/$4.50,#3商业管理金融、#10多轮对话。GPT-5.4-Nano排名#88,定价$0.20/$1.25。提供成本性能权衡。⭐ Google Veo 3.1 支持多图参考生成
Google Veo 3.1新增多图参考模式,打破Dream一家独大格局。支持图像生成多样化输入。⭐ Anthropic 最强模型 Capybara/Claude Mythos 性能实现代际跃迁
Anthropic 内部文件泄露显示 Claude Mythos 已完成训练,性能全面碾压 Opus 4.6,网络攻击能力远超现有 AI,但因安全担忧未发布。Matrix-Game 3.0 实时交互世界模型开源,支持 720p 40FPS
Skywork_ai 发布 Matrix-Game 3.0,MIT 许可,5B 模型实现分钟级记忆一致性,融合 Unreal/AAA/真实数据,扩展至 28B MoE。⭐IBM 发布 LLM 代理工作流优化研究
IBM新调研分类LLM 代理工作流优化方法,按结构确定时机(静态模板 vs 动态运行图)、优化组件和信号(任务指标、验证反馈)划分。提出结构感知评估,包括图属性、执行成本和鲁棒性。⭐ Chroma Context-1 发布:20B 参数搜索代理
Chroma推出Context-1,20B参数搜索代理,比前代快10 倍、成本低10 倍,Apache 2.0 开源,支持代理式搜索前沿。Claude Code Max 1M 上下文试用期结束
Anthropic的Claude Code Max会员1M token上下文Opus 4.6试用结束,切换至200K基础版,1M需 API 付费。⭐ GitHub Copilot 用户数据将被用于训练 AI 模型,并分享给微软
GitHub将于4 月 24 日起使用Copilot交互数据(输入输出、代码片段等)训练 AI 模型,微软等关联公司也可访问。免费/Pro 用户默认同意,可在设置中选择退出;企业版不受影响。数据保留最长5 年。OpenClaw 开源智能体框架引发大模型热潮,智谱张鹏称重回正常价格
OpenClaw开源智能体框架推动 AI 从聊天向落地转型,智谱 AICEO张鹏表示用户需求转向长程任务规划与纠错。月之暗面杨植麟等专家讨论其对研发、算力、应用的影响。🛠️ Tool Recommendations
Insanely Fast Whisper:开源工具将 Whisper 转录速度提升 19 倍
Insanely Fast Whisper 使用 Flash Attention 2 将 Whisper large-v3 处理 2.5 小时 音频时间从 31 分钟 缩短至 98 秒,支持多语言、说话者分离和时间戳,完全本地 GPU 运行。Claude Code 文档镜像站上线
Claude Code 文档镜像,提供便捷访问和使用指南。⭐ CodePilot 0.40.0 全面支持 CLI 工具集成
CodePilot 0.40.0 首个全面拥抱 CLI 的 Agent 产品,内置 FFmpeg、Strip 和网易云音乐等工具,AI 可自动安装并使用,提升开发效率。⭐ LlamaParse PDF 表格智能提取工具
LlamaIndex 推出 LlamaParse,超越基本 OCR 处理 PDF 表格:重建空间关系、保留表头层次、多行/合并/无边框表转 JSON。示例发票处理验证总计,适用于 金融/医疗/物流。AnyClaw 开源 Agent 工具转接器
AnyClaw 将 API/Web/Script 转为 MCP/Skills/CLI 格式,支持 OpenAPI、网页自动化、30+ 工具镜像仓库。兼容 opencli 生态,一键安装运行。liteparse 开源文档解析器 CLI 支持编码代理
liteparse 免费开源 CLI 文档解析器,编码代理可直接交织解析命令与文件系统操作,提升工作流效率。OpResume 免登录在线简历生成器支持 PDF 导出
OpResume 开源免费工具,免登录、本地存储、PDF 原生导出、一键隐藏敏感信息,适合快速求职。⭐ 钉钉开源 CLI 工具,支持 Claude Code 等 AI Agent
钉钉 开源 CLI,一行命令调用 AI 表格、日历、日志等 10 项 核心能力。输出 JSON 结构化 数据,支持 dry-run 预览,原生兼容 Claude Code 和 小龙虾。⭐ Readwise 推出 OpenClaw 插件
Readwise 支持 OpenClaw,一键保存文章、推文、书籍、YouTube 等为 Markdown。Claw 即时访问完整库,支持搜索。⭐ Cline 新增 Kanban 看板功能,支持可视化任务管理
Cline 开源 Agent 开发工具新增 Kanban 看板功能,类似 Symphony,支持 Claude Code、Codex 等代理。Kanban 卡片管理任务,Agent 自动认领需求、开发并更新进度。配备 Worktree 隔离 Git,自动依赖链和 auto-commit,提升开发协作效率。⭐ Nexu 客户端模型供应升级,支持 GLM/Kimi/MiniMax
Nexu 开源客户端升级,支持 GLM/Kimi/MiniMax,稳定性提升,刷新模型列表即可使用。Wikipedia MCP 服务器支持 LLM
Wikipedia MCP 服务器为 LLM 提供接口,支持文档访问。土耳其开源全栈 AI 引擎
土耳其开源 全栈 AI 引擎,支持完整 AI 工作流。⭐ openJiuwen 社区发布 JiuwenClaw 自进化 AI 代理
openJiuwen 社区推出 JiuwenClaw,专注任务执行,支持动态办公场景、内容迭代和真实浏览器自动化。核心包括分层记忆系统、智能上下文压缩和自主技能进化,集成华为小艺、Telegram 等多平台。ViduClaw:全球首个多模态创意营销智能体
Vidu 推出 ViduClaw,集成营销全链路技能,支持脚本生成、视频素材、剪辑配音。单人可交付团队级提案,适用于广告电商场景,输入邀请码 APPSON1 获 500 积分。📖 教程攻略
MiniMax-M2.7 为龙虾写生产级 SKILL 教程
使用 MiniMax-M2.7 为 openclaw 编写批量生成产品爆炸图网页的 SKILL,模板化流程拆分融合,支持海螺 2.0 图生视频,适配 Token Plan。LangChain Agent 评估准备清单
LangChain 提供代理/Agent 评估准备清单,包括分析 LangSmith 追踪错误、使用代码分级器和 LLM-as-judge、构建能力与回归评估、生产失败示例驱动飞轮。步骤涵盖 LangSmith 追踪分析、代码/LLM 评判器、能力/回归评估,以及从生产失败构建示例飞轮,帮助开发者系统化评估代理性能。Claude Code 启动设置和内存银行系统
分享 Claude Code 最佳启动配置和内存银行系统,支持代码沙盒执行和 Python 可视化输出。使用 Gemini 1.5 Flash Live 构建语音 Agent
Google 教程:用 Gemini 1.5 Flash Live 和 LiveKit 从本地到生产部署语音 Agent,支持原生语音、工具调用、多语言切换和函数链。LangChain Deep Agents IDE 式代理 UI 指南
LangChain 发布 Deep Agents 指南:构建沙盒文件系统、实时文件树、diffs、终端、聊天 UI,实现端到端代理工作空间。Claude Code 最佳编程语言评测
dev.to 文章评估多种语言在 Claude Code 中的表现,提供实用步骤与代码示例,突出独特视角。多 Claude 代理协调系统:agent-comms
agent-comms 为多 Claude Code 代理提供文件系统通信,注册、预告文件、冲突检查、协商,避免覆盖,支持 Claude 技能。C 预处理器技巧、提示和习惯用法
GitHub 仓库 Cloak 汇总 C 预处理器高级技巧,包括宏展开、条件编译、泛型编程等,提供完整代码示例与配置步骤,支持复杂元编程。龙虾安全架构:面向开发者的硬核生存指南
OpenClaw 安全框架从源头对齐、边界重构、结果保障三层构建思维链监控、形式化验证、Agentic IAM。使用本体论建模身份/权限/资源,支持实时语义验证与人在回路机制。💎 技巧经验
⭐ Claude Code 常用快捷键技巧
Claude Code 技巧:输入 ! 执行 shell 命令如 !git status;@文件名引用文件;双 Esc 回退操作,提升代码交互效率省 token。⚡ 工作流
IBM 发布 LLM 代理工作流优化调研
IBM 对代理工作流进行系统性分类,区分静态模板与动态图两种范式,梳理优化组件和关键信号(如任务指标、验证反馈)。研究提出结构感知评估框架,涵盖图属性分析与执行成本度量。Kensho 基于 LangGraph 构建多代理数据检索系统
Kensho 在 LangGraph 上构建多代理系统,采用中央路由器加领域专用代理的架构,为 S&P Global 客户提供股权研究、宏观经济、ESG 等多类验证数据的统一入口。ByteRover 为 OpenClaw 推出三层原生记忆插件
ByteRover 发布三层记忆架构插件:Context Tree 用于知识库存储、Workspace Memory 管理规则、Daily Memory 记录笔记。基于 LoCoMo 检索机制,准确率达 92.2%,并支持 Git-like 状态化管理。Claude Code 实现从 HTML 到 Figma 的设计系统工作流
Claude Code 探索完整设计工作流:从 HTML 原型迭代出发,构建完整设计系统,再导出为 Figma 变量组件,最终应用于导航场景,全程包含自我审视与迭代优化环节。🧠 深度思考
制药业 AI 应用加速文件处理和研究
John Coogan 分享制药 AI 用例:自动化 FDA 10,000 页文件、Word 文档批量替换、文献综述和 IP 审查,累计节省时间推动加速。Arena 数据:开源模型与专有模型差距缩小至 50-60 分
Arena 分析 3 年数据,顶级 20% 开源模型与专有模型差距从 2024 中 100-150 分缩至 50-60 分,专有模型自 2023 起徘徊 1350 分左右。Anthropic Rust 项目编码 AI 方法论
Anthropic 开源 claudes-c-compiler/buffa/connect-rust,fork tokio/moka。提炼 AI 编码实践:C 编译器代理团队、harness 长运行应用。前阿里千问负责人 林俊旸:AI 演进转向 智能体
林俊旸 离职长文复盘千问困境,断言大模型从推理转向 智能体思考,未来竞争聚焦环境设计、防作弊协议等系统工程。AI 能力提升未导致成本上升
METR 时间视界数据分析显示,前沿模型在 50% 可靠性视界任务成本比率稳定在人类成本 3%,未随能力提升而增加。长任务成本比率未随时长上升,固定成本下进步速度不变。前微软架构师:Windows GUI 30 年混乱,17 条路径 5 种语言
Windows GUI 从 Win32 到 WinUI/MAUI,14 年 14 次转向,17 种框架/5 种语言/3 种渲染。根源 Windows vs .NET 内战、过早押注 Metro/UWP。Charles Petzold 6 版书后停笔。📰 Industry News
Google 加码 Anthropic:资助 Texas 数据中心
Google 计划资助 Anthropic 巨型 Texas 数据中心,AI 战转向算力和电力。【重磅】OpenAI Stargate 密歇根数据中心开始浇筑钢梁
Sam Altman 宣布 Michigan Stargate 与 Oracle 和 Related Digital 合作,第一批钢梁已安装,标志从规划转向物理建设,预计支持 5GW 以上算力。[苹果计划开放 Siri 支持竞争 AI 助手]()
Bloomberg 报道 Apple 将 Siri 转变为路由层,支持用户选择 ChatGPT 等外部模型,通过 App Store 抽成 AI 订阅,iOS 27 预计 2026 年发布。GitHub 默认使用付费用户私有代码训练模型
GitHub 更改政策,默认训练包括私有仓库代码,用户需手动关闭设置。企业用户确认受影响,引发隐私争议。ARC Prize 基金会发布 ARC-AGI-3
ARC Prize Foundation 推出 ARC-AGI-3,历时近一年开发,由工程师、游戏设计师和 AI 研究员团队完成,推动开源 AGI 研究。Gemini API 引入月度消费上限和自动升级
Google Gemini API 4 月 1 日起新增月度消费上限,达限自动暂停避免意外账单,支持项目消费帽和自动/更快分级升级。Webtoon Canvas 平台推出 AI 翻译工具支持 7 种语言
Webtoon 为 Canvas 漫画平台添加 AI 本地化工具,可选翻译剧本至英语、西班牙语、法语、印尼语、泰语、繁体中文、德语,春季测试版向英语用户开放。Wedbush 分析师预测 Tesla 与 SpaceX 2027 年合并
Wedbush 分析师 DivesTech 称 Tesla 持 SpaceX<1%股份,联合 Terafab 工厂铺路 2027 年合并。Musk 目标控制 AI 生态。【重磅】荷兰法院禁令:xAI Grok 停止生成真人裸体图像
荷兰海牙法院 3 月 27 日紧急禁令 xAI Grok 停止生成真人风格裸体图像,违反 GDPR,可能影响欧盟 AI 内容政策,xAI 需升级过滤系统。维基百科禁止 AI 生成内容直接粘贴
维基百科规定 AI 仅提供审阅建议,最终需人工审核,防止 AI 幻觉传播虚假内容。Anthropic 删除 Claude Mythos 博客:最强模型预告
Anthropic 删除 Claude Mythos 博客,称其为最强模型,在编码、推理、网络安全超 Claude Opus 4.6,预示 AI 网络攻击浪潮。【重磅】黄仁勋详解英伟达四层 scaling laws:AGI 已实现,未来程序员增至 10 亿
黄仁勋访谈揭示英伟达四层 scaling laws(预训练/后训练/测试时/Agentic),瓶颈为算力。OpenClaw 为 token iPhone,CUDA 安装基数护城河。英伟达营收可达 3 万亿美元,中国创新最快,台积电 30 年无合同合作。DLSS 5 增强游戏渲染。索尼将于 4 月起全球上调 PS5 价格 100 美元
索尼宣布 2026 年 4 月 2 日起上调 PS5 标准版至 649.99 美元(原 549.99 美元)、数字版 599.99 美元、PS5 Pro 899.99 美元,PlayStation Portal 249.99 美元。归因全球经济压力,年内第二次涨价。上海出台方案,支持高端医疗设备家用化
上海市发布行动方案,推动家用无创医疗检测设备研发,如无创肺水测量仪、家用血压机器人。2025 年中国家用医疗器械市场 4638 亿元,占比 36%。心衰患者 1200 万,年住院 3.3 次费用 3 万元。📚 前沿研究 & Papers
FeatureBench:首个可扩展 Agentic Coding 评测框架
西安交大张家铖提出 FeatureBench,源于真实仓库的测试驱动基准,任务平均 790.2 行代码修改,配规范接口签名,全开源数据生成到推理评测基础设施,适配 OpenHands 和 Claude Code 框架。AI 学会科研品味:RLCF 新训练范式
复旦大学仝竞奇分享论文,提出 RLCF 范式,利用 70 万对高/低被引论文训练 Scientific Judge 模型,优于 GPT-5.2 和 Gemini 3 Pro,Scientific Thinker 生成高影响力构想。Google 新报告:代理 AI 引发下一次智能爆炸
Google 报告称历史智能爆炸为社会性而非个体,DeepSeek-R1 通过 RL 发展内部“思想社会”。建议构建人类-AI 配置和代理机构,而非单体模型。Google TurboQuant 压缩 KV 缓存内存达 6 倍
TurboQuant 将 KV 缓存降至 3 位存储,长上下文基准无精度损失,H100 GPU 上 4 位注意分数计算加速 8 倍,影响内存芯片需求。MIT 论文:Multi-Answer RL 提升语言模型分布推理能力
MIT 论文提出 Multi-Answer RL,训练模型生成多个答案而非单一猜测,在医疗诊断、编码和歧义问答中,top-1 编码准确率提升 50%以上,token 消耗减半。优于单答案 RL 和多次采样。Together Research:分治策略小模型匹敌 GPT-4o 长上下文任务
Together Research 论文(ICLR 2026 接受),小模型分治策略在长上下文任务匹配或超越 GPT-4o 单次处理,高跨块依赖任务仍需单次生成。AA-AgentPerf Agent 时代硬件基准测试
ArtificialAnlys 推出 AA-AgentPerf 基准:真实代理负载(200 轮、>100K token),支持 KV 缓存重用、生产优化。指标包括加速器/千瓦/美元/机架并发用户,gpt-oss-120b/DeepSeek V3.2 模型,现开放提交。OpenAI 2025 企业 AI 报告:顶级用户 AI 使用率 6 倍
OpenAI 报告显示,95th 百分位员工 AI 消息 6 倍中位数,数据分析角色 16 倍。顶级用户拉大差距。Google 将量子安全加密迁移提前至 2029 年
Google 宣布 2029 年前完成基础设施向后量子密码迁移,比政府时间表提前数年。标志 Q 日(量子破加密)可能早于预期到来。Unitree 开源 UnifoLM-WBT-Dataset:人形机器人数据集
Unitree 开源 UnifoLM-WBT-Dataset,这是真实世界人形机器人全身遥控数据集,覆盖开放环境,包含最多场景、任务复杂度和操作多样性。自 2026 年 3 月 5 日起高频更新。基因疗法大退潮:320 万美元一针到黑框警告
BioMarin Roctavian 退市,Sarepta Elevidys 黑框警告致 2 死。AAV 载体免疫风险暴露,辉瑞 Beqvez 上市 1 年退市。2025 年 6 家药企撤出,商业化/支付难题凸显,中国信念医药定价 409 万元。🚀 Product Launches
LangSmith Prompt Hub 新增 Environments
LangSmith 支持提示词环境管理,Staging/Production 提交,促进回滚,引用 staging/production 标签,无需改代码。Google 推出 Live Translator 耳机实时翻译,支持 iOS
Google 推出 Live Translator 耳机实时翻译,支持德法日印墨英美等语言,直接耳机翻译对方语音。Google Translate Live translate 耳机功能正式上线 iOS,支持 70+语言,扩展至更多国家和 Android/iOS 用户。该功能为用户提供便捷的跨平台实时翻译体验,提升沟通效率。Notion 推出新主屏幕小部件
Notion 新小部件,一键从主屏幕打开 AI 聊天、相机或语音输入。Meta 发布 SAM 3.1 对象多路复用更新
Meta 发布 SAM 3.1,引入对象多路复用单次前向传播跟踪最多 16 个对象,视频处理速度翻倍至 H100 GPU 上 32 帧/秒,开源模型和代码,支持更小硬件高性能应用。Perplexity 深化与三星合作覆盖 10 亿设备
Perplexity 赋能三星浏览器 AI,预装于 10 亿+设备(1 亿活跃用户),扩展 Bixby 和 Galaxy S26 设备合作。Linear Agent 自动生成完整项目范围
Linear Agent 根据工作区产品和客户知识自动起草项目需求、建议里程碑并组织问题,实现上下文到执行转化。Google Gemini 3 月更新:聊天历史转移+跨 App 帮助
Gemini 3 月 Drops:转移 AI 聊天历史、免费 Google Apps 个性化帮助、Android 语音暂停不中断(iOS 即将)。访问 Gemini Drops Hub。Figma macOS 吸管工具支持任意颜色拾取
Figma macOS 桌面 App 新增 eyedropper,任意位置拾取颜色。Runway 推出 Ad Concepter App
Runway Ad Concepter App 用单提示、参考图和产品照生成广告概念、构图和故事板。现已上线 Web 应用。Google Veo 3.1 支持食材图像生成视频
Google Veo 3.1 在 Gemini App 和 Flow 中,用食材图像和提示快速生成移动端视频,提供更多创意控制。Sony PS5 全系涨价,PS5 Pro 涨 150 美元
Sony 4 月 2 日起 PS5 全系涨价,PS5 Pro 涨 150 美元,受影响产品包括数字版和光驱版。Cloudflare Workflows 新增可视化仪表板
Cloudflare Workflows 仪表板新增步骤图可视化,将 TypeScript 代码转为工作流视觉表示。Nuki 智能锁首次降价
Nuki Smart Lock 支持 Matter-over-Thread,解锁速度快、兼容智能家居,现价$149(原$199)。无需订阅即可远程解锁和通知,电池续航优于 Wi-Fi。美团快乐猴一日三店开业,门店超 16 家
美团硬折扣超市快乐猴一日开 3 店(宁波 2 家、北京 1 家),总门店 16 家。覆盖华东/华北,4 月进军华南(佛山/广州)。全自营模式,2025 年 8 月首店杭州。由 X-Crawler AI 生成于 2026-03-28 08:50
每日精选 · 直送邮箱
订阅天眼日报
AI 精选科技要闻摘要,每天一封,免费无广告。