06月15日 · 科技晚报

天眼晚报

科技|2026年06月15日|119 分钟阅读
来源:1710 条推文 + 1031 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-06-05
分享
AI 速读17 条精选

🤖 AI 大模型

𝕏 Anthropic 披露 Claude 编写 80%生产代码并呼吁暂停前沿 AI 开发

Anthropic 披露截至 2026 年 5 月,合并到生产系统的代码中超过 80%Claude 编写,工程师日均合并代码量是 2024 年的 8 倍,AI 自主研究恢复能力达人类 97%。公司发布博文《When AI Builds Itself》,呼吁建立全球协调机制暂停前沿 AI 开发,称 AI 模型逼近无需人类干预即可自我改进的临界点。Claude Code 的 token 消耗量远高于普通对话,标志着编码 Agent 从辅助进入自主生产阶段。

𝕏 腾讯混元与人大联合开源 PlanningBench

腾讯混元联合人大高瓴人工智能学院开源PlanningBench,包含30 多个真实世界规划任务,覆盖调度、生产、旅行、资源分配、应急响应六大类,并提供全自动验证机制,可用于评测和微调 LLM 的规划能力。代码和数据集已发布在 GitHub 和 Hugging Face。

𝕏 OpenAI 发布 ChatGPT Dreaming V3 记忆系统

OpenAI 发布 Dreaming V3 记忆系统,后台自动合成跨对话用户画像,计算效率提升 5 倍,覆盖 Free/Go/Plus/Pro 所有用户层级,即日向 Plus/Pro 用户开放,免费用户数周内推送。可后台合成用户对话并生成可编辑的用户画像摘要,支持跨会话连续性和时序感知,如自动将“用户七月要去新加坡”更新为“已去完”。用户可审查或修正记忆。Anthropic 亦有同名功能。

Google DeepMind 发布 Gemma 4 QAT 检查点

Google DeepMind 发布 Gemma 4 的量化感知训练(QAT)检查点,采用量化感知训练显著提升在移动设备和笔记本电脑上的推理效率。Q4_0 格式下 E2B 模型降至 3.2GB,新增移动格式压缩至约 1GB(纯文本版低于 1GB),支持 llama.cpp、Ollama、vLLM 等主流框架,专为边缘设备和手机部署优化。

𝕏 Agent Arena 排行榜发布:GPT-5.5 第一,Claude Opus 4.7 第二

Agent Arena 发布智能体评估排行榜,基于 30 万+ 任务和 200 万+ 工具调用。OpenAI GPT-5.5 排名第一,Anthropic Claude-Opus-4.7 第二,ZAI GLM-5.1 第三。

𝕏 阿里通义发布 Qwen-VLA 统一视觉-语言-动作模型

阿里通义 发布 Qwen-VLA,一个统一视觉-语言-动作模型,融合操作、导航和轨迹预测于单一架构,同时推出多模态智能体模型 Qwen3.7-Plus

华为芯片成功优化 DeepSeek-V4-Pro 模型

研究团队利用至少 1000 颗华为昇腾 910C 芯片 完成了拥有 1.6 万亿参数 的 DeepSeek-V4-Pro 模型后训练,标志着中国 AI 在受美制裁下从推理向训练领域跨越。

腾讯披露 AI 重塑研发:多数团队 90%以上代码由 AI 生成

腾讯称 2025 年底大部分团队 90%以上代码 由 AI 生成,TokenHub 上线 3 个月 后日均消耗突破 5 万亿 token

🔶 互联网机器人流量首次反超人类

Cloudflare Radar显示 HTML 网页请求中 Bot 流量 57.5%,美国达 71.5%,AI Agent 正在改写网页访问和内容分发。

高通推出车端 AI Claw 生态计划

高通联合诚迈科技、德赛西威等企业,推动 AI 智能体 和多模态模型部署到车端。

🔶 可灵 AI 两周年:全球用户突破 1 亿

可灵 AI公布两周年数据:全球用户 突破 1 亿,覆盖 224 个国家和地区;企业客户近 5 万家。2026 年 Q1 单季营收超 6.5 亿元,同比增长超 300%,ARR 接近 5 亿美元

腾讯混元提出 Stem 稀疏注意力算法

腾讯混元提出 Stem 稀疏注意力算法,已被 ICML-26 收录。实现 25% 预算下近无损精度,128K 上下文首字延迟降低 3.7 倍

OpenAI 发布联邦前沿 AI 安全治理蓝图

OpenAI发布《民主治理前沿 AI:联邦框架蓝图》,明确呼吁建立联邦安全框架,强化 CAISI 评估能力,并首次官方承认观察到 递归式自我改进(RSI) 迹象,称其为未来十年最关键的安全议题。

𝕏 Higgs Audio v3 TTS 发布:4B 参数,支持 100 种语言

Boson AI 发布 Higgs Audio v3 TTS 模型,约 4B 参数,支持 100 种语言、零样本语音克隆、20+情感控制标记。在单张 H100 上达到 14.74 req/s,RTF 0.262。已集成到 SGLang-Omni。

🔶 OpenAI 给每家 YC 初创公司送 200 万美元代币换取股权

OpenAI CEO 阿尔特曼宣布向 Y Combinator 入驻初创公司提供价值 200 万美元 的 OpenAI 代币换取股权,并组建“创始人体验”团队。此举旨在用算力代币锁定初创公司技术依赖。

𝕏 Devenex 在 Google Cloud Next 发布 AI Agent 企业级治理层

DevenexGoogle Cloud Next 2026 上发布执行控制面(Execution Control Plane),提供 Agent 身份、网关、注册表等治理能力。Google 将 Agent 控制层作为平台级能力与 AWS、微软竞争。

𝕏 谷歌发布 Gemma 4 12B,无需编码器栈即可本地运行

谷歌发布 Gemma 4 12B,采用无编码器架构,支持视觉、音频、推理、智能体四大核心能力,Apache 2.0 协议,可在 8GB RAM 的笔记本上本地运行。

Perplexity AI 推出混合本地-服务器推理编排器

Perplexity AI推出首个 混合本地-服务器推理编排器,自动在设备端和云端模型间路由 AI 任务,支持隐私敏感数据本地处理,7 月登陆 Perplexity Computer。

腾讯云发布 WorkBuddy 企业版及办公智能体套件

腾讯云升级企业智能体产品矩阵,发布 WorkBuddy 企业版Agent Suite,推广大模型在企业场景落地。

腾讯内部调整 AI Token 额度:按工作任务动态调配

腾讯内部宣布 AI Token 额度改为按工作任务动态调配,总投入只增不减,不进行消耗量排名,保障高产出员工配额。

rsync 备份故障引发 AI 辅助编程争议

rsync新版本导致部分 增量备份失败,维护者承认大量使用 Claude 并坚持人工审查。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。