Signal Daily 2026-01-27
Summary: 今天是 AI Agent 基础设施的爆发日。从 Kimi K2.5 的百人智能体蜂群,到 OpenAI Codex 接管 100% 内部编程,再到 Claude 确立 AI 宪法与主动记忆,行业重心已从“单体模型能力”全面转向“群体协作架构”与“记忆资产化”。
The Lede
2026 年的开局,AI 领域正在经历一场从“个体英雄主义”到“组织化作战”的范式转移。当 OpenAI 的工程师宣称 100% 代码由 Codex 编写,当 Kimi 发布能分身出 100 个 Agent 的 K2.5,我们看到的是智力的廉价化与协作的规模化。Sam Altman 预言智力成本将再降 100 倍,未来的软件将不再是静态的“工具”,而是按需生成的“即时应用”。在这个新世界里,代码不再是护城河,架构(如何组织 Agent)和记忆(如何沉淀资产)才是新的核心竞争力。
🦄 Model & Architecture (模型与架构)
Kimi K2.5 发布:全能模型与 Agent Swarm
杨植麟亲自站台发布 Kimi K2.5,这一代模型不仅在视觉、代码和文本上实现了 All-in-One,更推出了震撼的 Agent Swarm(智能体集群) 能力。
- What: 单模型可驱动 100+ 子 Agent 并行协作(基于 PARL 强化学习),端到端任务执行速度提升 4.5 倍。
- Visual Coding: 支持输入视频/录屏,直接复刻复杂的交互级前端代码(如 HuggingFace 首页),且具备极高的审美(Taste)。
- Insight: Scale Out, Not Just Up. Kimi 选择了横向扩展 Agent 数量来突破单体智能的瓶颈,这可能比单纯堆参数更接近 AGI 的实战形态。
OpenAI Codex 接管 100% 内部编程
OpenAI 工程师 Roon 爆料,内部团队已实现 100% 代码由 Codex 编写,人类角色转变为“指挥官”和“审查者”。
- Efficiency: 3 天搭建 MCP 服务器,3 周发布 Sora App。
- New Tool: Codex CLI 0.9+ 引入 Plan Mode,先调研代码库、生成详细规格文档,再执行代码,大幅提升了复杂任务的成功率。
- Insight: 编程的终结? 当 AI 编写代码的速度 and 质量全面超越人类,软件工程的定义将从“如何写代码”变为“如何描述需求”和“如何验收结果”。
Qwen3-Max-Thinking 上线
通义千问发布 Qwen3-Max-Thinking,主打自适应工具调用和结构化思考。模型在思考过程中会自动判断是否需要检索、计算或调用代码解释器,文本推理能力显著增强。
🧠 Memory & Infra (记忆与基建)
Agent 记忆:从工具转向资产
随着 Agent 深入工作流,独立的 Memory Layer 正在成为刚需。
- Trends: Claude Cowork 引入“主动记忆”,区别于被动的 RAG 检索;MemOS 等产品尝试将记忆做成独立于模型的 OS,解决跨应用的数据孤岛问题。
- Insight: 记忆主权。如果记忆被锁定在单一模型(如 ChatGPT)中,用户迁移成本极高。未来的趋势是记忆作为一种独立资产,可随用户在不同模型间流转。
Agent Infra 与 "Box" 抽象
文章指出长程任务中环境会逐渐“劣化”(被污染)。
- Solution: 提出
Skill + Env = Box的概念,即为每个 Skill 提供一个可复现、可丢弃的纯净执行环境(类似 Docker/K8s)。 - Implementation: 开源项目 vm0 正是这一理念的实现,支持在隔离容器中运行自然语言工作流。
🔮 Future & Philosophy (未来与哲学)
Sam Altman: 智力成本将降 100 倍
在最新的研讨会上,Altman 承认 GPT-5.2 牺牲了写作能力以换取顶级编程能力,并预言 2027 年智力成本将下降 100 倍。
- Software 2.0: 未来的软件不再是静态的,而是根据问题即时生成的。
- Business Model: OpenAI 考虑从单纯卖 API 转向“价值共享”(Value Sharing),即从客户利用 AI 创造的收益中抽成(如药物研发)。
Neuro-AI: 时间不在大脑里
神经科学家 David Robbe 提出颠覆性观点:大脑没有内部时钟,时间感知源于运动和“绵延”(Durée)。
- Contrast: AI 处理的是离散事件,没有这种连续的“绵延”感,这可能是生物智能与人工智能的本质区别之一。
Claude 的“新宪法”与灵魂
Anthropic 发布 2.3 万字的 Claude Constitution,不仅规定“做什么”,更解释“为什么”。
- Soul: 开源项目 Clawd 的
SOUL.md定义了 AI 助手的核心原则——不要表演性帮助(No performative helpfulness),要有观点,要保护隐私。
🛠️ Tools & Application (工具与应用)
- LingBot-Depth: 蚂蚁/奥比中光开源的深度补全模型,解决了机器人看不见玻璃/透明物体的难题,利好具身智能。
- Claude in Excel: 实测支持联网搜索、跨表引用和 Debug,办公自动化渗透率进一步加深。
- Hyper3D: 3D 生成领域的 "NanoBanana",支持用自然语言对 3D 模型进行局部编辑(如“把头换成蜡笔小新”),大幅降低 3D 资产生产门槛。
- DeepWay: 百度系自动驾驶卡车公司获 11 亿融资,验证了从 L2 量产升维 L4 的渐进式路线。
Synced at 2026-01-27 via Signal Writer