智能AI
morning
DynaSchedBench:基于 LLM 的调度代理中校准的动态调度基准和可观测性悖论
2026-05-28
1 阅读
Shijie Cao, Yuan Yuan, Jing Liu
arXiv:2605.27566v1 公告类型:新 摘要:动态灵活作业车间调度问题 (DFJSP) 的神经组合优化的进展目前受到方法论紧张的阻碍:静态基准鼓励基准过度拟合,而未经校准的生成器则用随机噪声掩盖了算法能力。为了解决这个问题,我们引入了 \textbf{DynaSchedBench},这是一个严格控制实例生成过程的 DFJSP 诊断框架。我们的方法不依赖参数采样,而是利用顺序事件空间校准器(SESC)计算新颖的进度压力指数(SSI)来按难度对实例进行分层。我们证明,SESC 的计算效率明显高于进化基线,同时可靠地收敛到目标指标。该框架集成了实例生成、基于快照的模拟、代理、评估和可视化等模块化组件,从而能够对反应性和基于前瞻的策略进行严格测试。利用这种经过校准的环境,我们确定了基于 LLM 的调度代理的主要局限性。具体来说,在动态调度的逐步在线决策中,我们发现了一个“可观察性悖论”:为代理提供对完整结构信息的预言机访问可能会降低策略性能,导致简洁信息表现不佳。此外,尽管有大量的令牌开销,但工具增强和细化策略无法可靠地提高性能,并且大多数 LLM 代理无法始终超越强大的调度基线 - 其行为更像是强大的启发式逼近器,而不是高级优化器。