llm-quant/docs/CHANGELOG.md
2025-09-30 18:46:14 +08:00

22 lines
1.2 KiB
Markdown

# 变更记录
## 2025-09-30
- **BacktestEngine 风险闭环强化**
- 调整撮合逻辑,统一考虑仓位上限、换手约束、滑点与手续费。
- 新增 `bt_risk_events` 表及落库链路,回测报告输出风险事件统计。
- 效果:回测结果可复盘风险拦截与执行成本,为 LLM 策略调优提供可靠反馈。
- **DecisionEnv 风险感知奖励**
- Episode 观测新增换手、风险事件等字段,默认奖励将回撤、风险与换手纳入惩罚项。
- 效果:强化学习/ Bandit 调参能够权衡收益与风险,符合多智能体自治决策目标。
- **Bandit 调参与权重回收工具**
- 新增 `EpsilonGreedyBandit``run_bandit_optimization.py`,自动记录调参结果。
- 提供 `apply_best_weights.py``select_best_tuning_result()`,支持一键回收最优权重并写入配置。
- 效果:建立起“调参→记录→回收”的闭环,便于持续优化 LLM 多智能体参数。
- **DataBroker 取数方式优化**
- `fetch_latest` 改为整行查询后按需取值,避免列缺失导致的异常。
- 效果:新增因子或字段时无需调整查询逻辑,降低维护成本。