Skip to content

Signal Daily 2026-01-27

Summary: 今天是 AI Agent 基础设施的爆发日。从 Kimi K2.5 的百人智能体蜂群,到 OpenAI Codex 接管 100% 内部编程,再到 Claude 确立 AI 宪法与主动记忆,行业重心已从“单体模型能力”全面转向“群体协作架构”与“记忆资产化”。

The Lede

2026 年的开局,AI 领域正在经历一场从“个体英雄主义”到“组织化作战”的范式转移。当 OpenAI 的工程师宣称 100% 代码由 Codex 编写,当 Kimi 发布能分身出 100 个 Agent 的 K2.5,我们看到的是智力的廉价化协作的规模化。Sam Altman 预言智力成本将再降 100 倍,未来的软件将不再是静态的“工具”,而是按需生成的“即时应用”。在这个新世界里,代码不再是护城河,架构(如何组织 Agent)和记忆(如何沉淀资产)才是新的核心竞争力。


🦄 Model & Architecture (模型与架构)

Kimi K2.5 发布:全能模型与 Agent Swarm

杨植麟亲自站台发布 Kimi K2.5,这一代模型不仅在视觉、代码和文本上实现了 All-in-One,更推出了震撼的 Agent Swarm(智能体集群) 能力。

  • What: 单模型可驱动 100+ 子 Agent 并行协作(基于 PARL 强化学习),端到端任务执行速度提升 4.5 倍。
  • Visual Coding: 支持输入视频/录屏,直接复刻复杂的交互级前端代码(如 HuggingFace 首页),且具备极高的审美(Taste)。
  • Insight: Scale Out, Not Just Up. Kimi 选择了横向扩展 Agent 数量来突破单体智能的瓶颈,这可能比单纯堆参数更接近 AGI 的实战形态。

OpenAI Codex 接管 100% 内部编程

OpenAI 工程师 Roon 爆料,内部团队已实现 100% 代码由 Codex 编写,人类角色转变为“指挥官”和“审查者”。

  • Efficiency: 3 天搭建 MCP 服务器,3 周发布 Sora App。
  • New Tool: Codex CLI 0.9+ 引入 Plan Mode,先调研代码库、生成详细规格文档,再执行代码,大幅提升了复杂任务的成功率。
  • Insight: 编程的终结? 当 AI 编写代码的速度 and 质量全面超越人类,软件工程的定义将从“如何写代码”变为“如何描述需求”和“如何验收结果”。

Qwen3-Max-Thinking 上线

通义千问发布 Qwen3-Max-Thinking,主打自适应工具调用结构化思考。模型在思考过程中会自动判断是否需要检索、计算或调用代码解释器,文本推理能力显著增强。


🧠 Memory & Infra (记忆与基建)

Agent 记忆:从工具转向资产

随着 Agent 深入工作流,独立的 Memory Layer 正在成为刚需。

  • Trends: Claude Cowork 引入“主动记忆”,区别于被动的 RAG 检索;MemOS 等产品尝试将记忆做成独立于模型的 OS,解决跨应用的数据孤岛问题。
  • Insight: 记忆主权。如果记忆被锁定在单一模型(如 ChatGPT)中,用户迁移成本极高。未来的趋势是记忆作为一种独立资产,可随用户在不同模型间流转。

Agent Infra 与 "Box" 抽象

文章指出长程任务中环境会逐渐“劣化”(被污染)。

  • Solution: 提出 Skill + Env = Box 的概念,即为每个 Skill 提供一个可复现、可丢弃的纯净执行环境(类似 Docker/K8s)。
  • Implementation: 开源项目 vm0 正是这一理念的实现,支持在隔离容器中运行自然语言工作流。

🔮 Future & Philosophy (未来与哲学)

Sam Altman: 智力成本将降 100 倍

在最新的研讨会上,Altman 承认 GPT-5.2 牺牲了写作能力以换取顶级编程能力,并预言 2027 年智力成本将下降 100 倍。

  • Software 2.0: 未来的软件不再是静态的,而是根据问题即时生成的。
  • Business Model: OpenAI 考虑从单纯卖 API 转向“价值共享”(Value Sharing),即从客户利用 AI 创造的收益中抽成(如药物研发)。

Neuro-AI: 时间不在大脑里

神经科学家 David Robbe 提出颠覆性观点:大脑没有内部时钟,时间感知源于运动和“绵延”(Durée)。

  • Contrast: AI 处理的是离散事件,没有这种连续的“绵延”感,这可能是生物智能与人工智能的本质区别之一。

Claude 的“新宪法”与灵魂

Anthropic 发布 2.3 万字的 Claude Constitution,不仅规定“做什么”,更解释“为什么”。

  • Soul: 开源项目 Clawd 的 SOUL.md 定义了 AI 助手的核心原则——不要表演性帮助(No performative helpfulness),要有观点,要保护隐私。

🛠️ Tools & Application (工具与应用)

  • LingBot-Depth: 蚂蚁/奥比中光开源的深度补全模型,解决了机器人看不见玻璃/透明物体的难题,利好具身智能。
  • Claude in Excel: 实测支持联网搜索、跨表引用和 Debug,办公自动化渗透率进一步加深。
  • Hyper3D: 3D 生成领域的 "NanoBanana",支持用自然语言对 3D 模型进行局部编辑(如“把头换成蜡笔小新”),大幅降低 3D 资产生产门槛。
  • DeepWay: 百度系自动驾驶卡车公司获 11 亿融资,验证了从 L2 量产升维 L4 的渐进式路线。

Synced at 2026-01-27 via Signal Writer