# 变更记录

## 2025-09-30

- **BacktestEngine 风险闭环强化**
  - 调整撮合逻辑，统一考虑仓位上限、换手约束、滑点与手续费。
  - 新增 `bt_risk_events` 表及落库链路，回测报告输出风险事件统计。
  - 效果：回测结果可复盘风险拦截与执行成本，为 LLM 策略调优提供可靠反馈。

- **DecisionEnv 风险感知奖励**
  - Episode 观测新增换手、风险事件等字段，默认奖励将回撤、风险与换手纳入惩罚项。
  - 效果：强化学习/ Bandit 调参能够权衡收益与风险，符合多智能体自治决策目标。

- **Bandit 调参与权重回收工具**
  - 新增 `EpsilonGreedyBandit` 与 `run_bandit_optimization.py`，自动记录调参结果。
  - 提供 `apply_best_weights.py` 和 `select_best_tuning_result()`，支持一键回收最优权重并写入配置。
  - 效果：建立起“调参→记录→回收”的闭环，便于持续优化 LLM 多智能体参数。

- **DataBroker 取数方式优化**
  - `fetch_latest` 改为整行查询后按需取值，避免列缺失导致的异常。
  - 效果：新增因子或字段时无需调整查询逻辑，降低维护成本。