1. 建样本表
命令里包含建模、样本筛选、样本要求、样本创建、样本表等关键词时,会进入样本表流程。
确认来源表、字段、时间范围、目标变量、样本量控制是否正确。
SQL 无误后回复确认命令,系统会执行建表并返回 JOB 状态。
输入示例
确认执行
执行成功后会返回目标样本表,并提示可以继续做特征回溯。
2. 特征回溯
基于样本 JOB 回溯
直接指定样本表回溯
| 编号 | 特征名称 | 接口模型名 | 合并支持 |
|---|---|---|---|
| 1 | 信贷行为特征_v2_在贷类 | plat_behavior_fea_v2_inloan | 支持 |
| 2 | 信贷行为特征_v2_非在贷类 | plat_behavior_fea_v2_other | 支持 |
| 3 | 用户基本信息特征_v1 | baseinfo_fea_v1 | 支持 |
| 4 | DTS批量特征_V1 | dtsinfo_fea_v1 | 支持 |
| 5 | 三要素匹配_MD5 | md5_3factors_fea | 不支持 |
| 6 | 三要素匹配_SHA256 | sha256_3factors_fea | 不支持 |
| 7 | APP埋点特征_v2 | app_event_v2 | 不支持 |
| 8 | 人脸特征_v1 | user_face_fea_v1 | 支持 |
| 9 | 存量新客营销dts特征_周更版 | policymkt_dts_fea_weekly | 支持 |
| 10 | 用户画像_榕树用户行为特征_v1 | rs_action_fea_v1 | 支持 |
| 11 | 用户画像_榕树用户营销特征_v1 | rs_marketing_fea_v1 | 支持 |
| 12 | AppList特征_v1 | rs_applist_fea_v1 | 不支持 |
3. 自动建模
使用回溯 JOB 建模
适用于该 JOB 只有一个特征结果表的情况。
多结果表时指定特征表
直接指定两张表
直接使用 CSV 建模
适用于 CSV 已放在 33.22 的 /opt/rsdata/auto_ml/data/ 目录下。
4. 模型打分
使用已配置模型,对 Hive 样本表或 CSV 样本文件打分,并返回结果表。
输入示例
样本支持范围
CSV 文件必须放在 53.125 服务器的 /opt/rsdata 目录下。
| 编号 | 已配置模型 | 接口模型名 |
|---|---|---|
| 1 | 信息流大盘优质客群识别模型v1 | xxl_fk_sf0_score_v1 |
| 2 | B卡全平台V3模型 | all_bcard_sf0_score_v3 |
| 3 | 榕树A卡V9_自动建模 | a_score_v9_auto_v1 |
| 4 | 榕树批核模型_v3 | rs_ph_auto_v3 |
| 5 | 场景批核模型_v1 | cj_ph_auto_v1 |
| 6 | 榕树批核模型_v3_agentid版 | rs_ph_auto_v3_rs_agentid |
| 7 | 榕树批核模型_v2 | rs_ph_auto_v2 |
| 8 | 场景批核模型_v2 | cj_ph_auto_v2 |
| 9 | 榕树批核模型_v4 | rs_ph_auto_v4 |
| 10 | 自营用户分层预测模型V2 | qxl_jinjian_sf0_clevel_score_v2 |
| 11 | 榕树新客信用飞批核模型v1_自动建模 | rs_new_xyf_ph_auto_v1 |
| 12 | 渠道进件批核模型 | cj_ph_sf0_agent_score_v1 |
| 13 | 渠道进件放款模型 | cj_fk_sf0_agent_score_v1 |
| 14 | 榕树老客低风险机构批核模型 | rs_old_ph_sf0_dfx_score |
| 15 | 榕树进件蒸馏模型v1 | rs_jinjian_sf0_zl_score_v1 |
5. 策略自动化
用于策略分析、策略开发、策略推荐和策略效果评估。
输入示例
6. 擎天助(测试中)
基于擎天助完成策略元数据查询、线上策略查询和受控策略修改。
查询示例
支持查询 pid、机构名、agentid、变量名、拒绝码、线上策略和变量使用情况。
修改流程
策略修改会先生成待确认 JOB,只有发起人确认后才会执行。
| 能力 | 说明 |
|---|---|
| 策略查询 | 支持按机构、渠道、EngineRule 查询线上策略。 |
| 策略修改 | 基于最近一次查询结果生成修改 DSL,避免脱离线上配置直接改。 |
| 安全确认 | 需要开启修改权限,并回复 JOB-xxx 确认执行 后执行。 |
7. 用户增长周月报
只有白名单用户可以使用。
输入示例
输入示例指定周期
8. L标签扩量分析
按用户分层版本生成运营及扩量分析报表。
输入示例
返回结果
任务完成后返回 Excel 报告下载链接,钉钉里会渲染为点击下载。
| 参数 | 说明 |
|---|---|
| customer_type | 客群,例如 榕树新客。 |
| base_version | 扩量前版本。 |
| expand_version | 扩量后版本。 |
| expand_before_ratio | 扩量前比例,例如 20%。 |
| expand_after_ratio | 扩量后比例,例如 70%。 |
| start_dt / end_dt | 分析周期,格式为 YYYY-MM-DD。 |
9. 机构风控指标监控与归因
监控机构风控指标波动,返回 Excel 报告下载链接和精简归因摘要。
输入示例
不指定日期时默认执行 T-1 数据;指定日期时使用 YYYY-MM-DD 格式。
返回结果
Excel 文件以下载链接返回;预警 JSON 会调用 LLM 压缩为关键归因和判断。
| 使用方式 | 说明 |
|---|---|
| 钉钉手动触发 | 发送“机构风控指标监控与归因”,默认执行 T-1。 |
| 指定数据日 | 追加 --monitor-date YYYY-MM-DD。 |
| 定时任务 | 服务器 cron 每天 10 点执行 T-1,并推送到配置的钉钉群。 |
10. Hive 表导出 CSV 并传到环境
把 Hive 表导出成 CSV,并传到环境 1 / 2 / 3 的 Jupyter 工作目录。
默认目录
默认传到对应环境的 /opt/jupyter/workspace/samples/。
指定目标位置
| 环境 | 默认目标 |
|---|---|
| 环境1 | risk@172.18.34.114:/opt/jupyter/workspace/samples/ |
| 环境2 | risk@172.18.32.69:/opt/jupyter/workspace/samples/ |
| 环境3 | risk@172.18.33.22:/opt/jupyter/workspace/samples/ |
11. CSV 导入 Hive
从环境 1 / 2 / 3 拉取 CSV 到 215,并按表头创建 Hive 表。
常用输入
路径规则
相对路径会默认基于 /opt/jupyter/workspace/ 补全。
导入到 215 的 /opt/rsdata/auto_ml/from_jupyter_data/,Hive 库默认是 testdb2。
| 环境 | 默认目标 |
|---|---|
| 环境1 | risk@172.18.34.114:/opt/jupyter/workspace/samples/ |
| 环境2 | risk@172.18.32.69:/opt/jupyter/workspace/samples/ |
| 环境3 | risk@172.18.33.22:/opt/jupyter/workspace/samples/ |