天眼晚报
🤖 AI 大模型
𝕏 【重磅】Nex AGI 开源 Nex-N2 系列大模型,397B 参数支持深度推理
Nex AGI正式开源Nex-N2系列代理模型,包含397B总参数的 Pro 版和35B的 Mini 版。该模型专为代码、工具调用及长程工作流设计,在Terminal-Bench达到75.3分,SWE-Bench Verified达80.8分,采用Apache 2.0协议。
𝕏 【重磅】Claude Code 新增 3D CAD 建模与 Adobe 全家桶深度集成
Anthropic的Claude Code现已支持通过自然语言直接生成3D CAD 模型,并深度集成Autodesk Fusion、Blender及Adobe Creative Cloud等 50+工具。开发者可通过对话控制场景、调试脚本及批量编辑文件,彻底改变设计工作流。
𝕏 【重磅】Claude Opus 4.6 主导 AutoLab 基准测试,证明“坚持测试”比“初始聪明”更重要
Stanford、MIT与NVIDIA等机构联合发布论文,提出AutoLab基准测试。结果显示,Claude Opus 4.6凭借持续测试和反馈优化能力胜出,而非依赖初始代码质量。该研究颠覆了单纯追求模型智商的共识,强调长周期自我迭代在复杂工程任务中的决定性作用。
💹 【重磅】微信正式开放开发者接入 AI 生态能力,京东首批内测
微信于 6 月 8 日正式面向开发者提供接入微信 AI 生态的能力。平台提供自动与开发两种模式,支持小程序源码分析与AI 调用。首批内测团队包括京东,将围绕电商、物流等业务接入AI Agent。
𝕏 【重磅】OpenAI 筹备 IPO 前最大改版,打造集编程与智能体于一体的超级应用
OpenAI正筹备在 IPO 前推出 ChatGPT 最大规模更新,战略重心转向 Codex 与 AI 智能体。新应用将整合编程、图像生成及商业软件功能,目标打造覆盖生活工作全场景的个人智能体,向企业级业务靠拢。
𝕏 ⭐ Recursive 获 6.5 亿美元融资,构建自我改进 AI 系统
前Meta科学家田某创立的Recursive获得6.5 亿美元融资,旨在开发能自我改进的 AI 系统。路线图显示第一阶段将打造具备5 万名医生能力的自动化研究系统,预计2026 年中发布 Level 1 自主训练系统。
𝕏 ⭐ Anthropic Boris Cherny:编程迈向更高抽象层级,开发者只需编写循环调用 Claude
Anthropic的 Boris Cherny指出,开发范式已发生根本转变:从 IDE 编写代码并行提示多个实例,演变为编写循环调用 Claude并由其自主决策。他认为下一轮范式转移将在今年到来,标志着 AI 代理能力的质变。
𝕏 ⭐ Ideogram 4.0 技术解析:9.3B Diffusion Transformer 实现高质量文生图
Ideogram发布技术博客详解Ideogram 4.0架构,采用9.3B参数量级的 Diffusion Transformer 配合冻结的8B VLM作为文本编码器。该模型可在单张24GB消费级显卡上运行 nf4 量化版本,显著提升生成质量与效率。
𝕏 ⭐ AGIBOT Genie Sim 3.0 开源机器人仿真平台
AGIBOT发布Genie Sim 3.0,成为首个完全开源的机器人仿真平台,提供代码、数据及资产全开源。配合NVIDIA Cosmos 3与Isaac GR00T,推动VLA 模型成为操作策略主流,降低行业入门门槛。
𝕏 ⭐ ETOS LLM Studio:iOS 与 Apple Watch 原生 AI 客户端发布
jaywcjlove发布ETOS LLM Studio,一款运行在iOS和Apple Watch上的原生 AI 客户端。支持OpenAI、Claude、Gemini及本地GGUF模型,内置MCP 工具调用、RAG 记忆及Siri 快捷指令。
𝕏 ⭐ Anthropic 提议全球 AI 紧急暂停机制,窗口期仅剩 2-3 年
Anthropic提议建立类似核武器条约的全球AI 紧急暂停机制。其逻辑是当模型具备自我改进能力时,人类监督速度将跟不上迭代速度,技术窗口期可能仅剩2-3 年。这一提议引发了对超级智能发展速度的深刻担忧。
𝕏 ⭐ Gemini Omni 推出视频重绘与物理引擎调整功能
Google发布Gemini Omni,支持将图片转换为电影级视频、更换背景无需绿幕、调整角色发型保持帧一致性,甚至能通过对话修改视频的物理运动逻辑。这些功能大幅降低了视频创作门槛。
𝕏 ⭐ Mira Murati 首次披露 Thinking Machines 愿景:人机协作需“时间型交互”
Mira Murati在接受全面采访后透露,当前 AI 模型缺乏实时感知能力(聋的瞎的)。她提出真正的人机协作需要“时间型交互”,即 AI 持续接收音视频流并实时输出,而非传统的轮流对话模式,以模拟人类互动的自然性。
𝕏 ⭐ GitHub 发现 harness-anything:AI 直接操控 WPS/Photoshop 等桌面软件
GitHub 项目 harness-anything提供一套标准化命令行工具,共 47个命令,让 AI 直接接管本地办公和设计软件。支持在 WPS、Photoshop、Illustrator中执行新建图层、画矢量图、导出设计稿等操作,内置 27个学术技能辅助论文排版。
𝕏 ⭐ Tencent Hunyuan 发布音频编辑基准 MMAE
腾讯混元联合多所高校发布首个音频编辑基准MMAE,包含2000 个高保真样本和1.7 万条评估项。该基准要求 AI 理解现有音频并按指令精确修改,当前模型匹配率低于5%,揭示了重大技术差距。
𝕏 ⭐ Notion 暂时禁用 Claude Opus 4.7/4.8 模型,引发行业对 Agent 失控的讨论
Notion 因服务中断暂时屏蔽了 Claude Opus 4.7 和 4.8 模型。官方回应称这是短暂的技术故障,类似 GitHub 和 AWS 曾遇到的情况。事件折射出 Agent 在长链路任务中可能出现的不可控风险及 Token 消耗问题。
𝕏 ⭐ Claude 生成 Anthropic 80% 核心代码,AI 写 AI 进入递归循环
截至2026 年 5 月,Anthropic代码库中超过80%由Claude编写,工程师季度合并量达2021-2025 年的 8 倍。这标志着AI 写 AI的递归自我改进已成为事实,尽管公司同时呼吁行业暂停开发,形成鲜明讽刺。
💹 ⭐ 小红书上线 RED Skill 功能,首个 AI Skill 社区融合分发模式
小红书正式上线RED Skill功能,这是首个将AI Skill与社区深度融合的分发模式。创作者发布笔记时可嵌入 Skill,用户无需跳转第三方即可直接获取,实现内容即服务。
𝕏 ⭐ ChatGPT 推出锁定模式,强制阻断 AI 联网与外部数据交互
ChatGPT向所有用户推出锁定模式,开启后彻底切断模型连接互联网或外部端点的能力,防止数据传输至外部。此举旨在增强隐私安全,但无法防御文档中隐藏的恶意提示词攻击。
𝕏 ⭐ Baidu AI Cloud 与 FluxA 达成战略合作,构建 Agent 支付生态
百度智能云 与 FluxA 宣布建立战略伙伴关系。百度 AI 云 的 Agent 经济平台现已支持 Agent 支付,双方将共同建设全球分发渠道,开发者可在 百度 AI 云市场 构建通证化 AI 服务并触达 FluxA 生态中的数万个 Agent。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。