蚂蚁数科Harness工程实践：从 AI Coding 到可验收的研发闭环｜AICon上海

过去一年，“Agent”这个词从实验室走进了生产环境。工程师们开始真正面对一个新的问题：不是“AI 能不能做到”，而是“我们能不能把它跑稳、跑对、跑出规模”。架构怎么设计？记忆怎么管理？多智能体之间如何协调？研发团队的工作方式又该如何重构？这些，正是 AICon 2026 上海站试图回答的问题。 6 月 26 日-27 日，本次大会将以“构建可信赖、可规模化、可商业化的 Agentic 操作系统”为核心命题，集结清华、复旦等知名高校教授，以及来自阿里、腾讯、蚂蚁、字节、快手、小红书、华为、Google Cloud 等数十家头部公司的技术专家登台分享。2天、13大专题、1个动手实验室、近60场重磅议题，将深度探讨Agent工程化落地等相关话题。蚂蚁数字科技资深技术专家魏长征已确认出席 “ AI 开发生产力重构：Coder to Builder "” 专题，发表题为《从 AI Coding 到可验收的研发闭环：蚂蚁数科Harness工程实践 "》的主题分享。这次分享主要复盘在 AI Coding 落地过程中的一些观察和实践。随着 Agent 能力变强，研发中的问题往往会从“能不能写代码”转向“需求有没有对齐、测试够不够深、证据能不能复查、多人并行会不会失控”。他们尝试用 Harness 工程做一层约束，把需求说明、方案计划、多角色 Review、CI 对账、状态记录和质量门禁串起来，让 Agent 的执行过程更容易被检查、恢复和验收。分享会结合五层 Harness 的实践，包括约束层、对抗验证、证据层、状态写入和边界对齐，讨论它在个人 AI Coding、团队并行协作、长时间任务执行中的作用。整体目标比较朴素：让 AI 参与研发时，产出不只更快，也更稳、更可追踪。魏长征，蚂蚁数科技术总监、资深技术专家，上海市数字技术领域高级工程师 (职称)，在蚂蚁数科工作超 7 年，负责智能体工程、蚂蚁区块链技术、隐私计算、软硬件结合技术等方向。具备长期的软件工程研发经验，领导团队完成多个商业化平台的建设与落地。带领团队实现 AGI 研发范式转型。曾发表 10 余篇 CCF A 类国际会议和期刊论文，曾获得 2021 CCF 科技进步优秀奖（第一完成人），国内外授权专利超过 50 项，并主导或参与多项国内外技术标准制定。他在本次会议的详细演讲内容如下：演讲提纲：AI Coding 在真实研发中的常见问题：需求漂移、测试偏浅、证据不足、并行协作成本上升Harness 工程的基本思路：让 Agent 在明确的规则、边界和验收标准下工作五层 Harness 实践：约束层、对抗验证、证据层、状态写入、边界对齐约束层：用 SDD、SSOT、ADR、Design Doc 等材料提前说明目标、边界和事实源对抗验证：用不同角色做 Review，分别关注契约、设计、实现、测试、根因和冗余证据层：让 CI 做代码、配置、文档、测试和验证报告的对账状态写入：用 Change Doc、过程记录和测试资产，让长任务可接续、可复盘边界对齐：通过 CI Gates、权限边界、人工审批和回滚机制降低不可控风险4. 团队实践：多会话并行、24 小时持续研发，以及次日验收的工作方式5. 落地路径：新项目从最小 Harness 开始，老项目优先从高痛点环节改造听众收益：了解 AI Coding 在复杂研发任务中容易出现的失控点，以及这些问题通常发生在哪些工程环节获得一套相对可落地的 Harness 实践框架，可用于改造需求、Review、CI、证据和门禁流程建立更务实的 AI 研发质量判断标准：看边界是否清楚、证据是否可查、任务是否可恢复、结果是否能验收除此之外，本次大会还策划了端侧 AI、物理与数字空间智能化 "、世界模型与多模态智能突破 "、 Agent 架构与工程化实践 "、 Agent 安全与可信治理 "、企业级研发体系重构 "、 AI 原生数据工程 "、 AI 时代的个人提效与组织变革 "等14个专题论坛，届时将有来自不同行业、不同领域、不同企业的50+资深专家在现场带来前沿技术洞察和一线实践经验。更多详情可扫码或联系票务经理 13269078023 进行咨询。