06月18日 · 科技晚报

天眼晚报

科技|2026年06月18日|107 分钟阅读
来源:1324 条推文 + 380 篇 RSS 文章·Lanyun·BatchV2 生成·2026-06-18
分享
AI 速读15 条精选

🤖 AI 大模型

𝕏 Noam Shazeer 离开 Google 加入 OpenAI 领导架构研究

Transformer 论文合著者、前 Google DeepMind VP Noam Shazeer正式加入OpenAI,担任架构研究负责人。OpenAI 联合创始人 Mark Chen 亲自欢迎,称其“极度 AGI 导向”。此前 Google 以27 亿美元收购 Character.AI 换其回归,但未满两年即离职。这标志着 Google 在 AI 人才竞争中进一步落后。

𝕏 Midjourney 发布全身超声 CT 扫描仪,进军医疗影像领域

Midjourney创始人David Holz在旧金山发布全新医疗设备——全身超声 CT 扫描仪,采用358,000 个换能器,每秒捕获17GB原始数据,单次全身扫描约60 秒,成本仅 MRI 的1/10,速度提升60 倍。计划 2027 年在旧金山开设首家水疗中心,配备 9-10 台扫描仪。

Subquadratic 推出 1200 万 Token 上下文窗口模型

初创公司Subquadratic发布首个模型,支持1200 万 Token上下文窗口(远超现有前沿模型的 100 万)。采用 Subquadratic Selective Attention (SSA) 架构,计算和内存与上下文长度线性增长。在 MRCR v2 基准得分83 分(比 GPT-5.5 高 9 分),SWE-bench 得分82.4%

𝕏 白宫对 Anthropic 实施出口管制,限制 Mythos 模型访问

美国白宫Anthropic与韩国SK Telecom的 Mythos 模型合作争议,对其施加出口管制,要求获得BIS许可证才能全球分享模型,包括向外国公民露出。特朗普政府要求 Anthropic 向“外国人士”(含内部员工)开放最新模型前必须取得许可证。OpenAI也已对此表达担忧。

𝕏 GLM-5.2 开源模型发布:1M 上下文、灵活思考强度、MIT 协议

智谱 AI联合Together AI发布GLM-5.2,支持1M 上下文,具备灵活思考强度与更强 agent 编码能力。新架构 IndexShare 在 1M 上下文下将每 token FLOPs 降低2.9 倍,采用 MIT 开源协议。在 Shape-Rotator 基准测试中表现突出,得分超过Gemini 3.5 FlashOpus 4.8。现已在Tabbit浏览器上线,提供 100 万 Token 上下文窗口,代码能力在 Code Arena 排名开源第一。API 定价与 GLM-5.1 相同。

𝕏 DeepSeek 完成 510 亿元融资,估值达 4000 亿元

DeepSeek完成510 亿元融资,估值4000 亿元,投资方包括梁文锋、腾讯、京东、网易、宁德时代、IDG 及国家人工智能产业投资基金,阿里巴巴缺席。

𝕏 Kimi K2.7 Code vs Claude Fable 落地页实验:成本低 16 倍,质量接近

实验显示,Kimi K2.7 Code生成落地页成本仅为Claude Fable1/16,质量接近。结合 MCP 设计参考后,开源模型可实现质的飞跃。

𝕏 xAI 发布 Grok Imagine Video 1.5,图片转视频模型

xAI发布Grok Imagine Video 1.5,新的图像到视频模型,具备更清晰的真实感、更好的物理效果和更快的生成速度。

𝕏 Gemini 3.5 Pro 即将发布,谷歌暗示更高定价

谷歌已经开始在 Gemini 3.1 Pro 产品页面上显示“3.5 Pro即将推出”,预计视觉能力更强、多模态推理更出色,定价可能更高。

DeepSeek 识图模式全量上线,速度极快

DeepSeek网页端和 APP 端正式上线识图模式(此前为灰度测试)。多模态团队负责人陈小康表示视觉模式已正式上线。速度非常快,准确率高,下一步将推出 API。记者测试显示能识别地标建筑等,但识别创始人梁文锋时出现错误。

𝕏 Cursor 收购编程助手 Continue

Cursor宣布收购Continue,后者是一个 AI 编程助手。近日 Cursor 因被 SpaceX 收购、发布 Agent 版 GitHub“Origin”等消息刷屏。

𝕏 OpenAI 估值超越 Anthropic

Liam Fedus 发文称OpenAI估值已超过Anthropic,具体数字未披露。这是关键竞争对手的估值逆转信号。

𝕏 Apodex 发布自进化深度研究求解器,在多项基准超越 GPT-5.5 和 Claude-Opus

Apodex发布面向深度研究的Self-evolving heavy-duty solver,可一次派出最多150个子 Agent 并行探索,执行超过15,000步。在BrowseComp上超越GPT-5.5-pro,在DeepSearchQA上超越Claude-Opus-4.8Kimi-K2.6,内置三层自我验证机制。

JetBrains 开源 Mellum2:120 亿参数编程模型

JetBrains开源Mellum2,120 亿参数混合专家(MoE)模型,每个词元仅激活 25 亿参数。专为 Agent 基础设施层设计,支持私有本地部署。思考版本在 EvalPlus 基准得分78.4%,优于 Qwen3.5-9B。基于Apache 2.0许可开源。

𝕏 SGLang-Omni 支持开源 MOSS-TTS-Local Transformer v1.5 语音模型

SGLang-Omni即日支持MOSS-TTS-Local-Transformer-v1.5,该模型基于Qwen3-4B骨干,支持31 种语言零样本语音克隆、48kHz立体声流式输出,最长可生成10 分钟语音。非流式处理速度达5.976 req/s,词错误率1.75%

𝕏 OpenAI 推出 LifeSciBench 基准测试,评估 AI 在生命科学领域的能力

OpenAI发布LifeSciBench基准测试,由173位生物技术和制药专家共同开发,包含750个专家编写的任务,覆盖7类生物研究工作流。用于衡量 AI 在证据推理、科学文档处理、不确定性应对等方面的表现。

𝕏 Aether AI 完成融资,打造全球首个因果世界模型

UCSD 教授黄碧薇创办的Aether AI完成2000 万美金融资,致力于构建以因果推理为核心的物理智能大脑,解决当前 AI 仅学相关性不学因果的问题。

𝕏 LoopCoder-v2 论文:测试时计算并非越多越好,2 次循环最佳

论文训练 7B 代码模型,发现 2 次循环使 SWE-bench Verified 从 43.0 提升至 64.4,3-4 次循环反效果。Parallel Loop Transformer架构让循环几乎并行。

𝕏 vLLM 支持在自有 GPU 上运行开源编程 Agent,兼容 GLM、Kimi、MiniMax 等模型

vLLM现在可以让编程 Agent 在自有 GPU 上运行开源模型,支持GLM 5.2Kimi K2.7MiniMax M3等,兼容 OpenAI Responses API,可作为 Codex 等工具的 drop-in 替代。

𝕏 阿里与人大人开源统一科学大模型 LOGOS

阿里中国人民大学开源首个统一科学大模型 LOGOS,用“科学语法”统一编码蛋白质、分子等,1B 参数在多个任务上匹敌领域专用方法。

𝕏 LLM 为 Walmart、Target 等零售商贡献近 2% 推荐流量,一年增长 3 倍

LLM流量为WalmartTarget等顶级零售商贡献约**2%**的推荐流量,过去一年增长3 倍多。电子产品与家居园艺品类领先。但Amazon屏蔽ChatGPT爬虫阻止产品信息收集,导致来自 LLM 的流量下降。同时 Amazon 自有 AI 助手Rufus增长缓慢,落后于 Walmart 的竞品Sparky

𝕏 OpenAI 成为 Rust 基金会白金赞助商,年捐 60 万美元

OpenAI成为Rust 基金会白金级赞助商,每年支付32.5 万美元会费并额外捐赠27.5 万美元,合计60 万美元,用于支持 Rust 项目目标。此举源于 Astral 团队加入 Codex,其作品 Ruff 是 Rust 实现的 Python 代码检查器。

𝕏 马斯克预测中国 AI 模型将在 2027 年第一季度达到 Claude Fable5 水平

马斯克预测,中国的 AI 模型(如Qwen、GLM、MiniMax、DeepSeek)将在2027 年第一季度达到 Claude Fable5 级别的能力


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。