蚂蚁数科Harness工程实践:从 AI Coding 到可验收的研发闭环|AICon上海

2026-06-09 1 阅读 AICon 全球人工智能开发与应用大会
过去一年,“Agent”这个词从实验室走进了生产环境。工程师们开始真正面对一个新的问题:不是“AI 能不能做到”,而是“我们能不能把它跑稳、跑对、跑出规模”。架构怎么设计?记忆怎么管理?多智能体之间如何协调?研发团队的工作方式又该如何重构? 这些,正是 AICon 2026 上海站试图回答的问题。 6 月 26 日-27 日,本次大会将以“构建可信赖、可规模化、可商业化的 Agentic 操作系统”为核心命题,集结清华、复旦等知名高校教授,以及来自阿里、腾讯、蚂蚁、字节、快手、小红书、华为、Google Cloud 等数十家头部公司的技术专家登台分享。2天、13大专题、1个动手实验室、近60场重磅议题,将深度探讨Agent工程化落地等相关话题。 蚂蚁数字科技资深技术专家魏长征已确认出席 “ AI 开发生产力重构:Coder to Builder "” 专题,发表题为《 从 AI Coding 到可验收的研发闭环:蚂蚁数科Harness工程实践 "》的主题分享。这次分享主要复盘在 AI Coding 落地过程中的一些观察和实践。随着 Agent 能力变强,研发中的问题往往会从“能不能写代码”转向“需求有没有对齐、测试够不够深、证据能不能复查、多人并行会不会失控”。他们尝试用 Harness 工程做一层约束,把需求说明、方案计划、多角色 Review、CI 对账、状态记录和质量门禁串起来,让 Agent 的执行过程更容易被检查、恢复和验收。分享会结合五层 Harness 的实践,包括约束层、对抗验证、证据层、状态写入和边界对齐,讨论它在个人 AI Coding、团队并行协作、长时间任务执行中的作用。整体目标比较朴素:让 AI 参与研发时,产出不只更快,也更稳、更可追踪。 魏长征,蚂蚁数科技术总监、资深技术专家,上海市数字技术领域高级工程师 (职称),在蚂蚁数科工作超 7 年,负责智能体工程、蚂蚁区块链技术、隐私计算、软硬件结合技术等方向。具备长期的软件工程研发经验,领导团队完成多个商业化平台的建设与落地。带领团队实现 AGI 研发范式转型。曾发表 10 余篇 CCF A 类国际会议和期刊论文,曾获得 2021 CCF 科技进步优秀奖(第一完成人),国内外授权专利超过 50 项,并主导或参与多项国内外技术标准制定。他在本次会议的详细演讲内容如下: 演讲提纲:AI Coding 在真实研发中的常见问题:需求漂移、测试偏浅、证据不足、并行协作成本上升Harness 工程的基本思路:让 Agent 在明确的规则、边界和验收标准下工作五层 Harness 实践:约束层、对抗验证、证据层、状态写入、边界对齐约束层:用 SDD、SSOT、ADR、Design Doc 等材料提前说明目标、边界和事实源对抗验证:用不同角色做 Review,分别关注契约、设计、实现、测试、根因和冗余证据层:让 CI 做代码、配置、文档、测试和验证报告的对账状态写入:用 Change Doc、过程记录和测试资产,让长任务可接续、可复盘边界对齐:通过 CI Gates、权限边界、人工审批和回滚机制降低不可控风险4. 团队实践:多会话并行、24 小时持续研发,以及次日验收的工作方式5. 落地路径:新项目从最小 Harness 开始,老项目优先从高痛点环节改造听众收益:了解 AI Coding 在复杂研发任务中容易出现的失控点,以及这些问题通常发生在哪些工程环节获得一套相对可落地的 Harness 实践框架,可用于改造需求、Review、CI、证据和门禁流程建立更务实的 AI 研发质量判断标准:看边界是否清楚、证据是否可查、任务是否可恢复、结果是否能验收 除此之外,本次大会还策划了 端侧 AI、物理与数字空间智能化 "、 世界模型与多模态智能突破 "、 Agent 架构与工程化实践 "、 Agent 安全与可信治理 "、 企业级研发体系重构 "、 AI 原生数据工程 "、 AI 时代的个人提效与组织变革 "等14个专题论坛,届时将有来自不同行业、不同领域、不同企业的50+资深专家在现场带来前沿技术洞察和一线实践经验。 更多详情可扫码或联系票务经理 13269078023 进行咨询。