天眼早报
🤖 AI 大模型
𝕏 OpenAI 发布 GPT-5.5-Cyber 安全模型及 Daybreak 计划
OpenAI发布GPT-5.5-Cyber,在CyberGym基准上击败Mythos 5。同时启动Daybreak网络安全倡议,利用 AI 发现并修复开源漏洞,已为cURL、Go、Python等项目生成补丁。模型仅限可信访问,未公开。
𝕏 NVIDIA 通过软件优化使 GB200 NVL72 推理成本降低 2.5 倍
NVIDIA团队在70 天内通过软件优化(重写NVFP4 MoE内核、使用CuTe-DSL)将GB200 NVL72上Kimi架构的推理成本降低2.5 倍。该架构与 xAI 的 Cursor Composer 2.5 相同,受益于铜背板18 倍带宽优势。
𝕏 百度美研往事:曾有机会成为 OpenAI、Anthropic 早期天使
《晚点 LateTask》专访披露大量内幕:百度早在2014 年就已训练近3 亿参数语言模型,发现Scaling Law雏形;李彦宏、陆奇仅用2 天决策投资Cerebras;百度曾有机会投资OpenAI、Anthropic、Scale AI,因中美关系恶化未成;百度美研人才后来流向 OpenAI、Anthropic、Adept、xAI 等。
𝕏 Meta 投资印度金融科技 CRED 9 亿美元,创始人将执掌 WhatsApp
Meta以9 亿美元投资印度金融科技公司CRED,持股约20%,估值45 亿美元。CRED 拥有1700 万会员,年营收约3.2 亿美元。创始人Kunal Shah将加入 Meta 担任 WhatsApp 全球 CEO。这是 WhatsApp 在最大市场推进支付和商业平台的关键一步。
𝕏 SpaceX 与 AI 初创公司 Reflection 签署每月 1.5 亿美元计算租赁协议
SpaceX与开源 AI 初创公司Reflection达成每月1.5 亿美元的计算租赁协议,总金额约63 亿美元,协议至2029 年。Reflection 将获得英伟达GB300算力,用于加速“美国开放智能”。合同自2026 年 7 月 1 日开始,双方可在三个月后提前 90 天解约。
𝕏 美光与 Anthropic 达成战略 AI 协议,投资 H 轮融资
美光科技宣布与Anthropic达成内存与存储 AI 架构设计战略协议,同时参与 Anthropic 的H 轮融资。美光内部还将部署Claude供员工使用。此举延续了 AI 公司与芯片厂商的深度绑定趋势,使美光成为 AI 基础设施关键内存供应商。
𝕏 GLM-5.2 系列:开源模型能力跃升至接近顶尖闭源模型
智谱GLM-5.2发布,与顶尖闭源模型差距缩小至7 个月。在AA-Briefcase和GDPval-AA基准上排名开源模型第一,整体第三,仅次于Claude Fable 5和Claude Opus 4.8。GDPval-AA得分1524 Elo,平均每次任务执行 31 轮交互。FP16 权重至少需10.55 张 H200显卡(约 16 张带 KV Cache),月租约19 万元。价格仅**$1.40/$4.40**每百万 token,成本效率突出。
𝕏 艾宾浩斯遗忘曲线 140 年后仍未被学校采用:间隔学习的力量
深度长文揭示1885 年德国心理学家赫尔曼·艾宾浩斯发现遗忘曲线和间隔效应,但学校制度至今仍在优化遗忘而非对抗遗忘。Anki等间隔重复软件基于此原理,但教育系统未采纳。核心:同样时间,分布方式不同,产生完全不同的大脑。
𝕏 Cloudflare 光纤断裂引发北美互联网大面积故障
Cloudflare证实其在北美东部遭遇光纤断裂,导致连接北美或欧洲访问相关服务的流量出现大面积延迟飙升和超时。X(Twitter)、Reddit、Zoom、Microsoft Teams等多个平台在同一时间段内出现访问报错,引发互联网连锁反应。
𝕏 Fable 5 LisanBench 评测:综合排名第三,存在无效词转换问题
LisanBench 作者发布Fable 5评测结果:在主路径长度和难度加权指标中排名第 3、第 2,但无效词转换率高达28%(Opus 4.8 为 0%)。考虑 token 预算和奖励破解后,仍认为 Fable 5 是目前最佳模型。另据知情人士,Anthropic的非美国公民研究员因禁令无法使用Mythos/Fable 5,但仍可构建更强大的Mythos 6或Fable 6,评论认为此限制逻辑不通。
𝕏 百度开源 Unlimited-OCR,一次性解析数百页文档
百度在Hugging Face开源Unlimited-OCR,核心创新R-SWA注意力机制使 KV Cache 恒定,支持整本 PDF 端到端解析。在OmniDocBench上获93 分,比DeepSeek-OCR高6 个百分点,大幅提升长文档 OCR 速度与稳定性。
𝕏 高盛预测 EV 将减少全球石油需求 32 万桶/天
高盛报告指出,电动车普及可能在2027 年底前减少全球石油需求高达32 万桶/天。该分析仅计入乘用车新增量,未包含占全球 EV 销量92%的印度和80%的越南的两轮/三轮电动车,以及全球**55%**的非道路交通石油需求。
𝕏 10 个 GitHub 仓库让一人运营初创公司如同一个团队
精选10 个开源工具,覆盖内部应用、文档追踪、计费、API 密钥管理、AI 日志、通知、客户调研、营销自动化、安全与产品分析。每个工具可替代一个部门职能,让创始人无需雇佣团队即可运营公司。
𝕏 Google Interactions API 正式可用,成为 Gemini 模型主要接口
Google 宣布Interactions API正式 GA,作为构建Gemini模型和 Agent 的主要接口。新功能包括Managed Agents、后台执行、扩展工具支持、多模态生成,并即将原生支持Gemini Omni。基于开发者反馈优化有状态代理工作流。
𝕏 SpaceX 首次获得投资级信用评级,发行债券
Fitch给予SpaceX **BBB+**投资级评级,三大评级机构(Moody's、Fitch、S&P)均已给予投资级。公司在IPO后持有1008 亿美元现金,市值超2 万亿美元。此次发行无担保优先票据,用于偿还过桥贷款。
𝕏 ASML CEO 警告:欧洲在 AI 硬件竞赛中落后,美国购买 80%先进芯片
ASML CEO表示,欧洲在AI 硬件方面已大幅落后,美国购买了全球**80%**的先进芯片。像特斯拉 TeraFab这样的超级工厂可能需要每月数百万片晶圆的产能。这凸显了欧美在半导体制造能力上的巨大差距。
𝕏 日本转向出口最上级护卫舰等高科技武器
据**《华尔街日报》报道,日本正转向出口最上级护卫舰等高科技武器,旨在振兴本国国防工业,强化针对中国**的地区威慑力,并助力满足全球防务需求。这是日本防务政策的重要转向。
𝕏 开源免费音频分离工具 StemDeck:上传歌曲即可分离 6 个音轨
GitHub Daily推荐StemDeck开源免费工具,可在本地将歌曲分离成人声、鼓、贝斯、吉他、钢琴和其他乐器等多达6 个独立音轨。支持 Windows 和 macOS,带多轨混音器,可单独调音量、静音、导出。
𝕏 Ai2 开源 TMax 27B 终端代理模型
Ai2开源TMax 27B终端代理模型,在Terminal Bench 2.0上达到42.7%,可与 40 倍参数规模模型媲美。基于 Qwen 3.5 9B,采用 DPPO 训练于 OpenThoughts 数据集。
𝕏 Sakana AI 发布 Fugu 多智能体系统,单 API 调用匹敌前沿模型
日本Sakana AI发布Fugu多智能体编排系统,仅需单个 API 调用即可动态调度全球模型,在工程、科学推理等基准测试中与Fable/Mythos并肩。公司由 Transformer 论文共同作者Llion Jones联合创立,强调集体智能与 AI 主权。Fugu Ultra在Three.js无限地形生成任务上一键生成,效果接近Claude Fable水平。
𝕏 NVIDIA 发布 Halos 机器人安全系统
英伟达推出Halos for Robotics全栈安全系统,为机器人开发提供统一的安全架构,覆盖计算、传感器、软件、外部监控和 AI 认证。机器人开发者可在单一平台上保证物理 AI 的安全。
𝕏 Vals AI 发布 SkillsBench 基准测试:编码智能体使用技能平均提升 17 个百分点
Vals AI发布SkillsBench基准,测试编码智能体使用可复用技能的效果。平均准确率从35.5%升至52.5%,提升17.0个百分点,MiniMax-M3 提升最多(+25.4)。GPT 5.5 在两种智能体下均领先。
𝕏 无编程经验者用 AI 构建了 1800 个 AI 机器人的 WOW 服务器
一位无编程经验的开发者利用AI构建了World of Warcraft服务器,内置1800 个AI 机器人。机器人能与玩家对话、相互交流、升级并像真人一样走动,充分验证了 AI 生成代码的能力。
𝕏 a16z 领投医疗 AI 公司 Prosper 3000 万美元 A 轮融资
a16z领投Prosper AI 3000 万美元A 轮融资。Prosper 提供 AI 原生平台,自动化诊所运营中的预约、保险验证、患者账单等语音密集型工作,提升医疗效率。
𝕏 OpenMed 开源医疗模型 HuggingFace 下载量达 760 万
OpenMed开源医疗模型已累计760 万次下载,日均新增10 万次。近期在 GitHub 趋势榜获2500+星,**15+**新贡献者加入。该项目从一人发起发展成社区。
𝕏 Lucid 裁员 18%并调整运营
美国电动车制造商Lucid宣布裁员18%,COO Marc Winterhoff立即离职。该计划预计每年节省1.58 亿美元成本,旨在使生产与需求对齐、减少库存。
𝕏 Kubernetes v1.35 支持原地 Pod 重启以降低控制面扰动
Kubernetes v1.35新特性支持In-place Pod restarts,可减少控制面变动。Google 开源办公室分享了大型系统的实践,帮助开源生态繁荣。
𝕏 小米推出家用充电机器人臂
中国电动车制造商小米发布Home Charging Robotic Arm,可自动为电动车插拔充电线,支持远程充电。该产品将于2026 年 Q4在中国上市。
𝕏 Ai2 发布 Qwen 3.5 9B 终端代理模型
Ai2发布的Qwen 3.5 9B终端代理模型在Terminal Bench Lite上达到53.0%,采用 DPPO 训练,超越多数更大模型。
𝕏 Google Vids 推出 AI 定制演示者,支持 24 种语言
Google Vids允许用户设计自定义AI 演示者,支持24 种语言,可大幅简化按需生成培训视频的流程。桌面端免费试用。
𝕏 Hugging Face 即将突破 300 万模型与 100 万数据集
Hugging Face即将在数日内突破300 万个公开模型和100 万个公开数据集,展示开源 AI 生态的持续繁荣。
𝕏 Google Cloud 推出 GKE Agent Sandbox GA 和 Agent Substrate 开源
Google Cloud宣布GKE Agent Sandbox正式可用,为 Agent 工作负载提供安全可扩展的基础。同时发布开源项目Agent Substrate,旨在提升智能体基础设施密度。
𝕏 Oxlint 比 ESLint 快近 10 倍:迁移体验
开发者将 Monorepo 从 ESLint 迁移到Oxlint,CI 时间从7-11 分钟降至76 秒。Oxlint 只需一个配置文件,一行命令即可运行,迁移成本与 ESLint 9 相当,但速度优势巨大。
𝕏 48 名中国开发者联名举报苹果滥用垄断地位
48 名中国 iOS 开发者联名向监管部门提交举报信,认为苹果违背“全球最低费率”承诺,请求查处滥用市场支配地位行为、落实公平对待、建立费率自动对齐监督机制。
𝕏 用 Claude Code 和截图进行高效提示工程
分享高质量提示技巧:通过截图获取 90%的上下文,用语音描述目标,将稳定工作流转为技能/记忆,在循环中测试 Agent 直到可信度 90%+。有效提升 AI 编码效率。
𝕏 Stripe 执行副总裁升任副董事长
Stripe前首席营收官Eileen O'Mara升任副董事长,负责与全球商业、政府和政策领导者合作。前美洲业务负责人Tyler Bryson将接任首席营收官。
𝕏 Mole 1.8.0 发布:新增电池健康、Apple Silicon 风扇控制等功能
Mac 维护工具Mole 1.8.0发布,带来电池健康监控、Apple Silicon风扇控制、更快的应用更新、更流畅的磁盘图谱和更实用的菜单栏。
𝕏 Mistral AI 全球团队已达 1000 人
法国 AI 初创公司Mistral AI宣布全球员工数达到1000 人,正在招聘各职能岗位。公司继续扩展并服务客户。
𝕏 Seedcamp 筹集 3.2 亿美元新基金扩大美国业务
欧洲早期风投Seedcamp宣布完成3.2 亿美元新基金募集,用于扩展在美国的业务版图。
𝕏 YouMind 桌面端即将发布
知识管理工具YouMind桌面端即将发布,提供更好的使用体验。
𝕏 CLI Proxy API 移除统计功能,推荐替代项目
CLI Proxy API不再预置数据统计功能,作者推荐替代项目api-dashboard。用户可自行搭建管理后台。
𝕏 Instagram TV 拓展长篇和直播内容对抗流媒体
Instagram计划在其 TV 应用中加入长视频、剧集和直播格式,直接与Netflix等流媒体服务竞争。
𝕏 自由职业者记账软件 YouNeed 推荐
发现一款界面清新的自由职业者记账软件YouNeed,提供简洁的财务管理界面,适合独立工作者使用。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。