DynaSchedBench：基于 LLM 的调度代理中校准的动态调度基准和可观测性悖论

摘要

arXiv:2605.27566v1 Announce Type: new Abstract: Progress in neural combinatorial optimization for Dynamic Flexible Job Shop Scheduling Problem (DFJSP) is currently hindered by a methodological tension

for agents and that based

2026-05-28 1 阅读约1分钟阅读 Shijie Cao, Yuan Yuan, Jing Liu

arXiv:2605.27566v1 公告类型：新摘要：动态灵活作业车间调度问题 (DFJSP) 的神经组合优化的进展目前受到方法论紧张的阻碍：静态基准鼓励基准过度拟合，而未经校准的生成器则用随机噪声掩盖了算法能力。为了解决这个问题，我们引入了 \textbf{DynaSchedBench}，这是一个严格控制实例生成过程的 DFJSP 诊断框架。我们的方法不依赖参数采样，而是利用顺序事件空间校准器（SESC）计算新颖的进度压力指数（SSI）来按难度对实例进行分层。我们证明，SESC 的计算效率明显高于进化基线，同时可靠地收敛到目标指标。该框架集成了实例生成、基于快照的模拟、代理、评估和可视化等模块化组件，从而能够对反应性和基于前瞻的策略进行严格测试。利用这种经过校准的环境，我们确定了基于 LLM 的调度代理的主要局限性。具体来说，在动态调度的逐步在线决策中，我们发现了一个“可观察性悖论”：为代理提供对完整结构信息的预言机访问可能会降低策略性能，导致简洁信息表现不佳。此外，尽管有大量的令牌开销，但工具增强和细化策略无法可靠地提高性能，并且大多数 LLM 代理无法始终超越强大的调度基线 - 其行为更像是强大的启发式逼近器，而不是高级优化器。

订阅66必读