add suspended stock filtering and reward chart visualization

2025-10-20 08:22:35 +08:00 · 2025-10-20 08:22:35 +08:00 · d85efae082
commit d85efae082
parent 2779d21d97
3 changed files with 86 additions and 6 deletions
--- a/app/backtest/decision_env.py
+++ b/app/backtest/decision_env.py
@ -12,6 +12,7 @@ from datetime import date
 from .engine import BacktestEngine, BacktestResult, BacktestSession, BtConfig
 from app.agents.registry import weight_map
 from app.utils.db import db_session
 from app.utils.data_access import DataBroker
 from app.utils.logging import get_logger
 LOGGER = get_logger(__name__)
@ -83,6 +84,7 @@ class DecisionEnv:
        self._session: Optional[BacktestSession] = None
        self._cumulative_reward = 0.0
        self._day_index = 0
        self._data_broker = DataBroker()
    @property
    def action_dim(self) -> int:
@ -101,6 +103,9 @@ class DecisionEnv:
        self._day_index = 0
        cfg = replace(self._template_cfg)
        filtered_universe = self._filter_active_universe(cfg.universe, cfg.start_date, cfg.end_date)
        if filtered_universe:
            cfg = replace(cfg, universe=filtered_universe)
        self._engine = BacktestEngine(cfg)
        self._engine.weights = weight_map(self._baseline_weights)
        if self._disable_departments:
@ -145,7 +150,8 @@ class DecisionEnv:
        if engine is None or session is None:
            raise RuntimeError("environment not initialised; call reset() before step()")
-        engine.weights = weight_map(weights)
+        normalized_weights = weight_map(weights)
        engine.weights = normalized_weights
        if self._disable_departments:
            applied_controls = {}
            engine.department_manager = None
@ -165,7 +171,7 @@ class DecisionEnv:
            observation["failure"] = 1.0
            info = {
                "error": str(exc),
-                "weights": weights,
+                "weights": normalized_weights,
                "department_controls": applied_controls,
                "nav_series": failure_metrics.nav_series,
                "trades": failure_metrics.trades,
@ -192,7 +198,7 @@ class DecisionEnv:
        info = {
            "nav_series": metrics.nav_series,
            "trades": metrics.trades,
-            "weights": weights,
+            "weights": normalized_weights,
            "risk_breakdown": metrics.risk_breakdown,
            "risk_events": getattr(session.result, "risk_events", []),
            "portfolio_snapshots": snapshots,
@ -585,6 +591,64 @@ class DecisionEnv:
        return snapshots, trades
    def _filter_active_universe(
        self,
        universe: Sequence[str],
        start_date: date,
        end_date: date,
    ) -> List[str]:
        if not universe:
            return list(universe)
        broker = self._data_broker
        start_key = start_date.strftime("%Y%m%d")
        end_key = end_date.strftime("%Y%m%d")
        active: List[str] = []
        filtered: List[str] = []
        for ts_code in universe:
            try:
                suspended_start = broker.fetch_flags(
                    "suspend",
                    ts_code,
                    start_key,
                    "",
                    [],
                    auto_refresh=False,
                )
                suspended_end = broker.fetch_flags(
                    "suspend",
                    ts_code,
                    end_key,
                    "",
                    [],
                    auto_refresh=False,
                )
            except Exception:  # noqa: BLE001
                LOGGER.debug(
                    "检测停牌状态失败 ts_code=%s start=%s end=%s",
                    ts_code,
                    start_key,
                    end_key,
                    extra=LOG_EXTRA,
                )
                active.append(ts_code)
                continue
            if suspended_start and suspended_end:
                filtered.append(ts_code)
                continue
            active.append(ts_code)
        if filtered:
            LOGGER.info(
                "过滤停牌标的 %s/%s：%s",
                len(filtered),
                len(universe),
                filtered[:10],
                extra=LOG_EXTRA,
            )
        return active or list(universe)
    @staticmethod
    def _loads(payload: Any, default: Any) -> Any:
        if not payload:
--- a/app/ui/views/tuning.py
+++ b/app/ui/views/tuning.py
@ -87,7 +87,8 @@ def _render_bandit_summary(
    if weights_payload:
        st.write("对应代理权重：")
        st.json(weights_payload)
-        if st.button("将最佳权重写入默认配置", key="save_decision_env_bandit_weights"):
+        button_key = f"save_decision_env_bandit_weights_{bandit_state.get('experiment_id','current')}"
        if st.button("将最佳权重写入默认配置", key=button_key):
            try:
                app_cfg.agent_weights.update_from_dict(weights_payload)
                save_config(app_cfg)
@ -107,6 +108,19 @@ def _render_bandit_summary(
    st.caption("完整的 RL/BOHB 日志请切换到“RL/BOHB 日志”标签查看。")
    episodes = bandit_state.get("episodes") or []
    if episodes:
        df_rewards = pd.DataFrame(episodes)
        reward_columns = [col for col in df_rewards.columns if "奖励" in col]
        index_column = next((col for col in df_rewards.columns if "序号" in col), None)
        if reward_columns and index_column:
            chart_df = (
                df_rewards[[index_column, reward_columns[0]]]
                .rename(columns={index_column: "迭代序号", reward_columns[0]: "奖励"})
                .set_index("迭代序号")
            )
            st.line_chart(chart_df, height=200)
 def _render_bandit_logs(bandit_state: Optional[Dict[str, object]]) -> None:
    """Render the detailed BOHB/Bandit episode logs."""
@ -554,7 +568,7 @@ def _render_experiment_management(
    selected_agents = st.multiselect(
        "选择调参的代理权重",
        agent_names,
-        default=agent_names[:2],
+        default=agent_names,
        key="decision_env_agents",
    )
@ -614,7 +628,7 @@ def _render_experiment_management(
        selected_departments = st.multiselect(
            "选择需要调整的部门",
            dept_codes,
-            default=[],
+            default=dept_codes,
            key="decision_env_departments",
        )
        tool_policy_values = ["auto", "none", "required"]
--- a/app/utils/data_access.py
+++ b/app/utils/data_access.py
@ -770,6 +770,8 @@ class DataBroker:
            query = (
                "SELECT 1 FROM suspend "
                "WHERE ts_code = ? "
                "AND suspend_date IS NOT NULL "
                "AND suspend_date <> '' "
                "AND suspend_date <= ? "
                "AND (resume_date IS NULL OR resume_date = '' OR resume_date > ?) "
                "LIMIT 1"