1. 建样本表
发送样本需求
命令里包含建模、样本筛选、样本要求、样本创建、样本表等关键词时,会进入样本表流程。
检查机器人返回的 SQL
确认来源表、字段、时间范围、目标变量、样本量控制是否正确。
确认执行
SQL 无误后回复确认命令,系统会执行建表并返回 JOB 状态。
输入示例
建模样本:取近30天进件样本,目标变量 is_pihe,字段包含 uid、create_dt、pid,样本量 30 万左右
贷后样本,取 2026-05-01 到 2026-05-31,目标变量 flag_fpd30,样本表名 testdb2.auto_risk_demo
确认执行
JOB-20260615-120000 确认执行
JOB-20260615-120000 不执行
执行成功后会返回目标样本表,并提示可以继续做特征回溯。
2. 特征回溯
基于样本 JOB 回溯
JOB-20260615-120000 1、2、3、4
JOB-20260615-120000 用户基本信息特征_v1、DTS批量特征_V1
直接指定样本表回溯
testdb2.auto_risk_20260427163918 1、3
testdb2.auto_risk_20260427163918 特征回溯 APP埋点特征_v2、AppList特征_v1
| 编号 | 特征名称 | 接口模型名 | 合并支持 |
|---|---|---|---|
| 1 | 信贷行为特征_v2_在贷类 | plat_behavior_fea_v2_inloan | 支持 |
| 2 | 信贷行为特征_v2_非在贷类 | plat_behavior_fea_v2_other | 支持 |
| 3 | 用户基本信息特征_v1 | baseinfo_fea_v1 | 支持 |
| 4 | DTS批量特征_V1 | dtsinfo_fea_v1 | 支持 |
| 5 | 三要素匹配_MD5 | md5_3factors_fea | 不支持 |
| 6 | 三要素匹配_SHA256 | sha256_3factors_fea | 不支持 |
| 7 | APP埋点特征_v2 | app_event_v2 | 不支持 |
| 8 | 人脸特征_v1 | user_face_fea_v1 | 支持 |
| 9 | 存量新客营销dts特征_周更版 | policymkt_dts_fea_weekly | 支持 |
| 10 | 用户画像_榕树用户行为特征_v1 | rs_action_fea_v1 | 支持 |
| 11 | 用户画像_榕树用户营销特征_v1 | rs_marketing_fea_v1 | 支持 |
| 12 | AppList特征_v1 | rs_applist_fea_v1 | 不支持 |
APP埋点、AppList、三要素 MD5、三要素 SHA256 不支持合并;一次选择多个这类特征时,可能返回多个独立结果表。
3. 自动建模
使用回溯 JOB 建模
JOB-20260615-120000 自动建模 评分转换类型 dh
适用于该 JOB 只有一个特征结果表的情况。
多结果表时指定特征表
自动建模
JOB-20260615-120000
特征表 testdb2.tmp_demo_app_event_features
评分转换类型 ph
直接指定两张表
自动建模
样本表 testdb2.auto_risk_demo
特征表 testdb2.auto_risk_demo_merge_features
目标变量 flag_fpd30
时间字段 loan_dt
评分转换类型 ph
自动建模必须填写评分转换类型,支持 dh / ph;直接指定样本表和特征表时还必须填写目标标签。自动建模返回模型路径和模型报告下载链接。
4. 智能策略
覆盖端外渠道策略、信息流策略。
输入示例
type: 特征分析
strategy_type: 端外渠道
zh_sample_table: testdb2.tjj_borrow_sample_haluo_0318_auto
zh_target: is_pihe,is_fk
dh_sample_table: testdb2.tjj_risk_sample_haluo_0324_auto_nojdd
dh_target: flag_fpd30,flag_mob2_30,flag_mob3_30
data_dim: undefined
feature_list:['scoreafylbase','scoreafysbase','scoreafywbase','scoreafyxbasea']
5. 用户增长周月报
只有白名单用户可以使用。
输入示例
用户增长周报/用增周报
用户增长月报/用增月报
榕树首贷风险月报
输入示例指定周期
用户增长周报 2026-05-14 2026-05-20
用户增长月报 2026-05
榕树首贷风险月报 2026-05
6. L标签扩量分析
按用户分层版本生成运营及扩量分析报表。
输入示例
L标签扩量分析
customer_type: 榕树新客
base_version: v2
expand_version: v3_1
expand_before_ratio: 20%
expand_after_ratio: 70%
start_dt: 2026-01-28
end_dt: 2026-03-03
返回结果
| 报表 | 下载链接 |
| --- | --- |
| 运营及扩量分析 | [点击下载](https://biservice.shurongdai.cn/api/push/xxx.xlsx) |
任务完成后返回 Excel 报告下载链接,钉钉里会渲染为点击下载。
| 参数 | 说明 |
|---|---|
| customer_type | 客群,例如 榕树新客。 |
| base_version | 扩量前版本。 |
| expand_version | 扩量后版本。 |
| expand_before_ratio | 扩量前比例,例如 20%。 |
| expand_after_ratio | 扩量后比例,例如 70%。 |
| start_dt / end_dt | 分析周期,格式为 YYYY-MM-DD。 |
7. Hive 表导出 CSV 并传到环境
把 Hive 表导出成 CSV,并传到环境 1 / 2 / 3 的 Jupyter 工作目录。
默认目录
testdb2.sample_table 传到环境1
testdb2.sample_table 传到环境2
testdb2.sample_table 传到环境3
默认传到对应环境的 /opt/jupyter/workspace/samples/。
指定目标位置
testdb2.sample_table 传到环境2 目标位置: /yanzijie/
testdb2.sample_table 传到环境2 目标位置: risk@172.18.32.69:/opt/jupyter/workspace/yanzijie/
| 环境 | 默认目标 |
|---|---|
| 环境1 | risk@172.18.34.114:/opt/jupyter/workspace/samples/ |
| 环境2 | risk@172.18.32.69:/opt/jupyter/workspace/samples/ |
| 环境3 | risk@172.18.33.22:/opt/jupyter/workspace/samples/ |
8. CSV 导入 Hive
从环境 1 / 2 / 3 拉取 CSV 到 215,并按表头创建 Hive 表。
常用输入
环境1 demo.csv 导入Hive
环境2 zxj/300148省呗/增加L层推送占比/data/sb_to_br.csv 导入 hive
路径规则
相对路径会默认基于 /opt/jupyter/workspace/ 补全。
导入到 215 的 /opt/rsdata/auto_ml/from_jupyter_data/,Hive 库默认是 testdb2。
如果 CSV 内容里有逗号、括号、特殊字符等导致串列,建议优先使用标准 CSV 引号转义;必要时再扩展分隔符识别或让用户指定分隔符。