11 KiB
11 KiB
多智能体投资助理骨架
项目简介
本仓库提供一个面向 A 股日线级别的多智能体投资助理原型,覆盖数据采集、特征抽取、策略博弈、回测展示和 LLM 解释链路。代码以模块化骨架形式呈现,方便在单机环境下快速搭建端到端的量化研究和可视化决策流程。
架构总览
- 数据与存储层:
app/ingest封装 TuShare/RSS 拉数与限频处理,app/data/schema.py初始化 SQLite 表结构,所有模块通过app/utils/db.py的db_session访问app/data/llm_quant.db,数据抽象层由app/utils/data_access.py的DataBroker统一提供字段查询与时间序列切片。 - 工具与配置层:
app/utils聚合配置、日志、交易日历及 provider 管理,app/utils/config.py定义 LLM/部门/代理权重等全局设置。 - 特征与策略层:
app/features负责信号构建(当前为占位实现),app/agents实现六类规则型代理与部门级 LLM 协同,app/backtest/engine.py通过DataBroker装配特征/上下文后运行多智能体博弈并将结果写入agent_utils。 - LLM 与协作层:
app/llm提供统一的模型调用与 Prompt 构建,支持 single/majority/leader 策略,部门输出再与规则代理共同决策。 - 可视化层:
app/ui/streamlit_app.py提供今日计划、回测、设置、自检四大页签,实时读取agent_utils、run_log追踪决策链路。
经典模块划分仍保留在文末《实施步骤》中,便于对照逐项推进。
智能体策略速览
- 动量 (
A_mom):基于mom_20/mom_60的 Sigmoid 强度判定买卖梯度。 - 价值 (
A_val):组合 PE/PB/ROE 分位,低估值与高质量越倾向买入。 - 新闻 (
A_news):按新闻热度与情绪正负分配买卖权重,热度低时偏好持有。 - 流动性 (
A_liq):衡量liquidity_score与交易成本惩罚,约束加仓节奏。 - 宏观 (
A_macro):关注行业热度与相对强弱,多头动能越强,则买入级别越高。 - 风险 (
A_risk):根据risk_penalty调整信心,并在停牌/涨停/仓位限制场景下行使否决权。
部门级智能体通过 DepartmentManager → DepartmentAgent → department_prompt() 的链路向 LLM 请求 JSON 化决策(动作、置信度、摘要、信号、风险),输出在 app/agents/game.py 中与规则代理共同参与纳什谈判或加权投票。
当前瓶颈
- 数据获取:
BacktestEngine.load_market_data()仍为空实现,规则型代理依赖外部写入的AgentContext.features,缺乏统一的取数协议。 - 角色提示:部门
description尚未注入 Prompt,代理职责依旧“写死”在 Python 逻辑中。 - 过程记录:缺少对“请求了哪些数据、执行了哪些 SQL、LLM 收到什么上下文”的显式追踪,不利于复盘。
提示词驱动的改造方向
- 配置声明角色:在
config.json/DepartmentSettings中补充description与data_scope,department_prompt()拼接角色指令,实现职责以 Prompt 管理而非硬编码。 - 统一数据层:新增
DataBroker(或同类工具)封装常用查询,代理与部门通过声明式 JSON 请求所需表/字段/窗口,由服务端执行并返回特征。 - 双阶段 LLM 工作流:第一阶段让 LLM 输出结构化
data_requests,服务端取数后将摘要回填,第二阶段再生成最终行动与解释,形成闭环。 - 审计与前端联动:把角色提示、数据请求与执行摘要写入
agent_utils附加字段,使 Streamlit 能完整呈现“角色 → 请求 → 决策”的链条。
目前部门 LLM 已支持通过在 JSON 中返回 data_requests 触发追加查询:系统会使用 DataBroker 验证字段后补充最近数据窗口,再带着查询结果进入下一轮提示,从而形成“请求→取数→复议”的闭环。
上述调整可在单个部门先行做 PoC,验证闭环能力后再推广至全部角色。
核心技术原理
- 多智能体博弈:通过
app/agents定义六类风格化代理,利用纳什谈判与加权投票在app/agents/game.py中聚合交易动作与信心水平。 - 数据覆盖自检:
app/ingest/tushare.py封装 TuShare 拉取、增量更新与覆盖统计,app/ingest/checker.py提供强制补数与窗口化覆盖报告。 - 事件驱动回测:
app/backtest/engine.py构建日频回测循环,将代理决策与投资组合状态解耦,便于扩展成交撮合与绩效统计。 - 可视化与解释:
app/ui/streamlit_app.py提供四大页签(今日计划、回测与复盘、数据与设置、自检测试),结合 Plotly 图形展示和app/llm提示卡片生成器,支撑人机协作分析。 - 统一日志与持久化:SQLite 统一存储行情、回测与日志,配合
DatabaseLogHandler在 UI/抓数流程中输出结构化运行轨迹,支持快速追踪与复盘。 - 跨市场数据扩展:
app/ingest/tushare.py追加指数、ETF/公募基金、期货、外汇、港股与美股的增量拉取逻辑,确保多资产因子与宏观代理所需的行情基础数据齐备。 - 部门化多模型协作:
app/agents/departments.py封装部门级 LLM 调度,app/llm/client.py支持 single/majority/leader 策略,部门结论在app/agents/game.py与六类基础代理共同博弈,并持久化至agent_utils供 UI 展示。 - LLM Provider 管理:
app/utils/config.py集中维护供应商的 URL、API Key、可用模型及默认参数,Streamlit UI 可视化配置,全局与部门直接在 Provider 基础上设置模型、温度与 Prompt。
LLM + 多智能体最佳实践
- 强化结构化特征:除 A 股行情外,引入资金流、因子、宏观等数据,为六类代理提供更丰富上下文。
- 场景化 Prompt:在
app/llm中注入代理贡献、宏观状态和风险事件,让 LLM 输出的策略解释与信号一致。 - 闭环反馈机制:将回测或实盘的真实收益、成交等结果写回 SQLite,用于调整代理权重与 Prompt 语料。
- 多层日志监控:保留代理评分、决策信心、LLM 提示与 UI 操作日志,帮助定位“谁做的决策、为何失败”。
- 人机协同流程:在 UI 呈现代理分歧与 LLM 风险提示,分析师可调权、重跑或复核,实现人在环路的策略流程。
环境依赖与安装
建议使用 Python 3.10+,并在虚拟环境中安装依赖。
# 1. 创建并激活 Conda 环境
conda create -n llm-quant python=3.11 -y
conda activate llm-quant
# 2. 安装项目依赖
pip install -r requirements.txt
# 3. 设置 TuShare Token
export TUSHARE_TOKEN="<your-token>"
requirements.txt 当前涵盖运行框架所需的核心三方库:
- Pandas:数据表结构与指标处理
- Streamlit:交互式前端
- Plotly:行情与指标可视化
- TuShare:行情与基础面数据源
- Requests:统一访问 Ollama / OpenAI 兼容 API
LLM 配置与测试
- 通过 Provider 管理供应商连接参数(Base URL、API Key、默认温度/超时/Prompt 模板),并支持在界面内一键调用
client.models.list()拉取可用模型列表,便于扩展本地 Ollama 或各类云端服务(DeepSeek、文心一言、OpenAI 等)。 - 全局与部门配置直接选择 Provider,并根据需要覆盖模型、温度、Prompt 模板、投票策略;保存后写入
app/data/config.json,下次启动自动加载。 - Streamlit “数据与设置” 页提供 Provider/全局/部门三栏编辑界面,保存后即时生效,并通过
llm_config_snapshot()输出脱敏检查信息。 - 支持使用环境变量注入敏感信息:
TUSHARE_TOKEN、LLM_API_KEY。
快速开始
# 启动交互界面(内含数据库初始化、开机检查、样例回测入口)
streamlit run app/ui/streamlit_app.py
Streamlit 自检测试 页签提供:
- 数据库初始化快捷按钮;
- TuShare 小范围拉取测试;
- 一键开机检查(可自动补数并展示覆盖摘要);
- 股票行情可视化(自动加载近段时间价格、成交量,并展示核心指标)。
- 开机检查带进度指示与详细日志,便于排查 TuShare 拉取问题。
回测与复盘 页签提供快速回测表单,可调整时间区间、股票池与参数并即时查看回测输出。
下一步
- 在
app/features和app/backtest中完善信号计算、事件驱动撮合与绩效指标输出。 - 丰富
DepartmentContext(行情快照、风险指标),让部门评估拥有更完整的上下文。 - 使用轻量情感分析与热度计算填充
news、heat_daily与热点指数。 - 在 Streamlit 今日计划页增加“重新评估”与日志追踪能力,串联实时调度链路。
License
本项目采用定制的 “LLM Quant Framework License v1.0”。个人使用、修改与分发需保留出处,任何商业用途须事先与版权方协商并签署付费协议。详情参见仓库根目录的 LICENSE 文件。
多智能体 LLM 投资流程
- 部门化结构:动量、价值、新闻、流动性、宏观、风险等代理视作独立业务部门,利用项目现有的数据/特征处理流程向每个部门提供上下文。
- 多 LLM 协作:每个部门内部可配置多家 LLM 提供商(如 DeepSeek、OpenAI、文心等)作为智能体助手,分别生成分析意见和风险提示;可通过多数投票、仲裁等策略确定部门结论。
- 部门输出:统一返回部门行动(买入/卖出/持有)、信心水平以及核心理由 (context + LLM 摘要),当前实现会将摘要、风险提示与票权写入
agent_utils。 - 跨部门协调:沿用
app/agents/game.py的纳什谈判/投票结构,将各部门的结论与六类基础代理共同建模,必要时触发冲突检测并标记复核。 - 日志与可视化:Streamlit 今日计划页读取
agent_utils展示部门意见、投票细节与全局行动,可快速核查部门分歧与置信度。
实施步骤
-
配置扩展 (
app/utils/config.py+config.json) ✅- 引入
llm_providers集中管理供应商参数,全局与部门直接绑定 Provider 并自定义模型/温度/Prompt,Provider 页面提供模型列表自动获取;Streamlit 提供可视化维护表单。
- 引入
-
部门管控器 ✅
app/agents/departments.py提供DepartmentAgent/DepartmentManager,封装 Prompt 构建、多模型协商及异常回退。
-
集成决策链 ✅
app/agents/game.py将部门评分嵌入纳什谈判/加权投票,并对冲突设置复核标记;app/backtest/engine.py将结果落库。
-
UI 与日志(进行中)
- 今日计划页展示部门意见、票权与全局策略,后续补充一键重评估、日志钻取。
-
测试与验证(待补充)
- 需完善部门上下文构造与多模型调用的单元/集成测试,结合回测指标对比多 LLM 策略收益差异。