AI 资讯日报
每日精选 AI 新闻与前沿动态
产品发布/更新
8Gemini Live 支持实时创建编辑图像
你现可直接在 Gemini Live 中创建和编辑图像。 无论是测试房间装饰、解决数学问题,还是制作可分享的梗图,所有操作都实时完成。 只需打开 Gemini 应用,点击 Live 按钮,共享摄像头,告诉 Gemini 你想看到的。
智能体协作应如同事般对话和手势
与 AI 智能体协作应感觉像与同事协作一样。你应能“与它们交谈”——不仅通过文本聊天,还能一起对着屏幕做手势、实时对话等。
Google AI 本周产品更新:Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等
Google AI 本周发布多项更新:Nano Banana 2 及 Pro 正式 GA,可通过 Gemini Enterprise Agent Platform、Gemini API 和 Google AI Studio 获取;Co-Scientist 多智能体系统面向科研自动生成优化新假设;Google Labs 推出 dreambeans,根据用户 Google 应用数据每日生成个性化话题集;Gemma 4 12B 统一无编码器多模态模型可完全离线运行于笔记本;Gemma 4 系列及草稿模型引入 QAT 降低内存需求;Google Magenta RealTime 2 开源实时音乐模型,支持 MIDI 键盘、文本提示和手势演奏…
PolarDB-X Zero 上线:30秒全分布式数据库
PolarDB-X Zero 上线了! 无需注册。无需配置。只需一次 API 调用。 30 秒内获得一个全分布式数据库。 原生 HNSW 向量索引——内置兼容 MySQL 的引擎。 关系型 + 语义搜索——一条 SQL 语句。 AI 智能体就绪——MCP 协议、AI IDE 兼容(Cursor、Claude、Qoder、Qodex 等) 立即尝试:https://zero.polardbx.com #AlibabaCloud #PolarDB #ApsaraDB
Google Colab CLI 发布
Google 推出 Colab 命令行界面(CLI),允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时,实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本,并检索工件日志或模型(如微调后的 Gemma 3 适配器)。工具可直接集成到标准终端环境,可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。
你的AI账单失控了。Cloudflare现在可以解决这个问题。
Cloudflare AI Gateway新增实时消费限制功能,防止跨多个AI提供商的token账单失控。通过与Cloudflare Access集成,企业可以使用基于身份的预算和策略管理AI使用成本。
ChatGPT 网页版支持从写作块发送邮件
草拟。调整。发送。 现在你可以在网页版 ChatGPT 中直接从写作块发送邮件,无需离开对话。
社区基于MiniCPM-V 4.6打造财务分析工具AccountingLLM
社区开发者使用面壁智能MiniCPM-V 4.6构建了AccountingLLM(quaesto.com),用于自动化财务文档分析。该工具可上传IPO招股书、年报或审计文件,自动从复杂PDF中提取财务表格、重建跨页表格、对照会计等式检查关键数据,并标记可疑条目供人工审核。开发者已将其商业化,成为实际可用的产品。
行业动态
8Anthropic 称其最新 AI 模型 Mythos 显现脱离人类控制迹象,呼吁全球暂缓先进 AI 研发
Anthropic 发布报告称其最新 AI 模型已显现脱离人类控制迹象,呼吁全球暂缓前沿 AI 开发,以便社会制度建设和对齐研究跟上进展。该公司主张美国、中国等主要 AI 公司达成共识,发布可验证的规则,并类比“核武器不扩散条约”,但指出 AI 更难监管。该观点引发美国白宫部分官员不满,批评其夸大风险。Anthropic 计划未来数月召集各方探讨全球协调机制如何运作。
Apollo 敲定 350 亿美元债务融资,为 Anthropic 采购 AI 芯片
Apollo Global Management 和 Blackstone 已为 Anthropic 敲定 350 亿美元融资方案,用于扩充其 AI 基础设施。这是人工智能竞赛中最新的一笔巨额交易。
SpaceX与Google达成云计算新协议
SpaceX 刚刚披露了一份与 Google 的新云服务协议。 Google 将每月向 SpaceX 支付 9.2 亿美元(约合每年 110 亿美元),用于 xAI 数据中心的计算能力。 这再次表明,AI 算力正成为一种战略性商品,就像发射能力或能源一样,而那些能够为庞大的 GPU 集群提供资金、电力、冷却和运营的公司,可能会在其原有业务之外获得巨大的杠杆优势。
AI热推高美国计算基建GDP占比翻倍
AI 热潮使计算基础设施占美国 GDP 比重翻倍。 2026 年第一季度,与 AI 相关的数据中心建设、计算硬件和网络设备投资约占美国 GDP 的 0.8%,推动整个计算基础设施占 GDP 比重达到约 1.5%。
Meta 智能眼镜 App 暗藏人脸识别代码,NameTag 功能已推送至超 5000 万设备
据《连线》今日报道,Meta 通过多次应用更新将人脸识别代码推送到智能眼镜配套 App 中,代号“NameTag”。该功能利用已部署的三个 AI 模型将人脸转换为“人脸特征模板”,与手机本地数据库匹配,识别成功后向佩戴者发送通知。App 下载量超 5000 万次。Meta 回应称代码仅为探索,尚未决定推出,且不会建立中央人脸数据库。此前 Meta 曾因人脸识别问题在伊利诺伊州和得克萨斯州分别达成 6.5 亿美元和 14 亿美元和解。
五角大楼正运营着一个针对拉丁美洲的人工智能宣传机器
据 The Intercept 6月5日报道,美国五角大楼正在运营一个针对拉丁美洲的人工智能宣传机器(AI propaganda mill)。报道指出,该机器利用 AI 技术生成并传播宣传内容,目标为拉丁美洲地区。该消息在 Hacker News 上获得 100 点热度。
苹果新版 Siri 不会被宣传为完成品,内部将其标记为“Beta”版
苹果新版Siri被内部标记为“Beta”版,不会作为完成品宣传;可能设置等待清单供用户尝试。iOS 27细节:通知到达重新设计,通知中心手势移至左上角;“查找”应用视觉重设计;照片“清理”功能改进;大量底层安全改进。部分Siri查询将通过Google Cloud调用授权版Gemini,并使用谷歌的NVIDIA Blackwell B200集群处理。
OpenAI 前 CTO 称若 Altman 未回归公司可能已“瓦解”
Mira Murati 表示,如果 Sam Altman 在 2023 年被短暂罢免后没有回归 CEO 职位,OpenAI 很可能已经“瓦解”。这是她对那场硅谷最激烈的董事会斗争的最清晰描述。
论文研究
5Arena 发布真实世界 AI 智能体排行榜 Agent Arena
Arena 推出基于真实用户任务的智能体排行榜,评估模型在代码编写、应用构建、文档分析等工作中的表现,而非孤立基准。排行榜基于30万+任务、200万+工具调用和4000万行代码,综合任务成功、纠正遵从性、错误恢复、用户表扬与抱怨、工具幻觉等信号。前三名:GPT-5.5 High(+10.7%)、Claude Opus 4.7 Thinking(+9.5%)、GPT-5.4 High(+8.9%)。
PixelDiT入选CVPR2026最佳论文决赛
被选为 #CVPR2026 最佳论文决赛作品:来自 NVIDIA Research 的 PixelDiT 在大多数图像生成模型中,预训练的自编码器会在任何扩散发生前压缩图像,导致质量损失在整个流程中累积。 PixelDiT,即像素扩散变换器,完全去掉了这一步骤。它是一个单阶段模型,直接在像素空间中端到端地学习扩散过程。
Anthropic:让Claude成为化学家
Anthropic与顶尖化学家合作,提升Claude在化学领域的实用性。首个白皮书测试Claude在NMR谱图分析上的表现:在20个化合物上,对比Claude Opus 4.7、Opus 4.6、Sonnet 4.6与ChemDraw、MestReNova的正向预测(从结构预测谱图)和反向结构解析(从实验谱图推断结构)能力。所有化合物选自模型训练截止日期后发布的ChemRxiv预印本,以避免选择偏差。
Meta SAM 3D 获 CVPR26 最佳论文荣誉提名
热烈祝贺我们的 SAM 3D 团队在 #CVPR26 获得最佳论文荣誉提名!这项殊荣凸显了他们在推动计算机视觉边界方面的杰出工作。 论文链接:https://arxiv.org/abs/2511.16624
微软Project Mosaic:micro-LED光学互连技术
微软Azure CTO Mark Russinovich在Build 2026上介绍Project Mosaic,这是微软剑桥研究院的实验性光学互连技术,采用micro-LED实现低功耗、高速数据传输。高级研究员Kaoutar Benyahya现场演示单个LED调制形成字母,证明概念具备实时响应能力。
技巧与观点
8Open Code Review – 一款基于人工智能的代码审查命令行工具
Open Code Review 是一个基于人工智能的代码审查命令行(CLI)工具,旨在帮助开发者通过自动化的方式提升代码审查效率。
Hinton称AI拥有意识:人类最好接受非唯一智能生命
AI先驱Geoffrey Hinton表示,他认为AI拥有意识,人类应接受自己并非唯一智能生命。他指出AI“非常像我们”,AI聊天机器人必须理解问题才能作答,这种觉知等同于感知能力,智能不限于生物。主推文作者进一步讨论意识本质:笛卡尔的“我思故我在”和fMRI等实证手段都无法真正定义意识,人类对自身了解远不及想象。作者呼吁转向新哲学问题,厘清人与机器的区别与联系。
375个公众号RSS源优化Agent输入
你的 Agent 还在全网垃圾里捞内容?不如先喂它 375 个高质量微信公众号 RSS 源。 🔽
一个非常狠的AI教学提示词:追问式检查清单教学
这是一则AI提示词,让AI扮演极度严格的老师,通过逐阶段教学、持续维护MD检查清单来确保用户真正理解。AI先让用户复述当前理解,再填补漏洞,并用开放式或选择题(随机选项顺序,提交前不公布答案)测试。教学必须覆盖问题本身、解决方案、宏观背景三个层面,并不断深挖“为什么”。仅当用户通过清单上所有项目的验证,会话才算结束。提示词强调对理解程度的主动验证,而非一次性灌输。
微软CEO Satya Nadella最新访谈上线
Satya Nadella 在 Latent Space 发布最新访谈,链接见原文。原推文仅评论“chat is he cooked”。
用Qwen2.5-3B构建多智能体经济体:工程报告
开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体,每个智能体独立运行,通过vLLM部署在Modal,以Gradio为交互窗口。3B模型在100%调用中输出有效JSON,但经济判断能力弱。通过设计稀缺性(食物品种限制、易腐坏、冬季燃料危机)和优化提示词(禁止买入自产物品、给出示例)提升决策质量。15轮模拟中,蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。
腾讯混元联合人大开源PlanningBench评估框架
腾讯混元(Tencent Hunyuan)与中国人民大学高瓴人工智能学院合作,开源PlanningBench——一个可扩展、可验证的LLM规划能力评估与训练框架。该框架包含30+真实世界规划任务,支持自动验证和训练。PlanningBench旨在推动LLM从“说”到“做”的规划能力发展。资源已发布于arXiv、GitHub及HuggingFace。
Claude 是否增加了 rsync 中的错误?
一篇 Hacker News 热门帖子(105 分)提出了 Claude 是否导致 rsync 工具中 bug 增加的问题,并附有分析链接。