2018-ORANGE-FINANCIAL-BIG-DATA-top9

July 9, 2020 · View on GitHub

2018-2018年甜橙金融杯大数据建模大赛-初赛第四-复赛线上11-决赛9-复现top1解决方案

=================================================================================
赛题链接
赛程时间:2018.10.20-2018.12.14
队名:火锅肠粉烤鸭
参与人狗头哥wangjx小兔子乖乖
百度云盘下载链接:为避免数据丢失,提供数据集下载地址链接:

1.1数据说明 操作详单数据字典

字段名中文解释字段说明
UID用户编号/
day操作日期连续的日期标识,E.g,1为第一天,2为第二天,以此类推
mode操作类型操作类型(例如:修改密码、查询余额...)
success操作状态/
time操作时间点/
os操作系统/
version客户端版本号/
device1操作设备参数1设备名称加密,原字段加“Jack's iphone”
device2操作设备参数2设备型号
device1操作设备唯一标识1设备号唯一标识加密,可用于安卓类设备的唯一标识
device2操作设备唯一标识2设备号唯一标识加密,可用于安卓类设备的唯一标识
mac1MAC地址操作设备MAC地址编码加密,原字段如“38:XX:XX:XX:XX:92”
ip1ip地址操作设备IP地址编码加密
ip2ip地址操作电脑IP地址编码加密
device_code3操作设备唯一标识3设备号唯一标识加密,可用于苹果类设备的唯一标识
mac2mac地址WIFI MAC地址编码加密,原字段如“02:XX:XX:XX:XX:03”
wifiWIFI名称WIFI名称,原字段“A的wifi”
geo_code地理信息经纬度GeoHash编码
ip1_subIP地址前三位操作设备IP地址编码加密(ip前三位IP地址)比如,原字段为12,34,56,7和12,34,56,8的ip地址前三位都为12,34,56,故脱敏后的值是一样的
ip2_subip地址前三位操作电脑IP地址编码加密(ip2前三位IP地址)

1.2数据说明 交易详单数据字典

字段名中文解释字段说明
UID用户编号/
channel平台平台类型
day交易日期连续的日期标识,1为第一天,2为第二天,以此类推
time交易时间点/
trans_amt脱敏后交易时间点/
amt_src1资金类型交易资金源类型,例如“金额”、“银行卡”
merchant商户标识商户编码加密
code1商户标识商户子门店编码加密
code2商户终端设备标识商户交易终端设备编码加密
trans_type1交易类型1交易类型,例如“消费” “退款”
acc_id1账户相关用户交易账户号编码加密
device_code1操作设备唯一标识1设备号唯一标识加密,可用于安卓类设备的唯一标识
device_code2操作设备唯一标识2设备号唯一标识加密,可用于安卓类设备的唯一标识(唯一标识并不会只是一种 但都能达到效果)
device_code3操作设备唯一标识3设备号唯一标识加密,可用于苹果类设备的唯一标识
device1操作设备参数1设备名称加密,原字段如“Jack's iphone”
device2操作设备参数2设备类型
mac1MAC地址操作设备MAC地址编码加密,原字段如“38:XX:XX:XX:XX:92”
ip1IP地址操作设备IP地址编码加密
bal脱敏后账户余额保留大小关系
amt_src2资金类型交易资金源类型,与1类型相似,2对银行卡做了细分
acc_id2账户相关转账操作的转出账户号编码加密
acc_id3账户相关转账操作的转入账户号编码加密
geo_code地理信息经纬度GeoHash编码
trans_type2交易类型2交易类型,例如“线上”、“线下”trans_type2与trans_type1的维度和侧重点不同
market_code营销活动号编码营销活动号编码加密
market_type营销活动标识营销活动类型
ip1_subIP地址前三位操作设备IP地址编码加密(ip1前三位IP地址)

2.配置环境和依赖库

  • python3
  • sklearn
  • python notebook

3.代码运行步骤说明

首先运行

1.dx_base_drop_black_list.ipynb
2.submission.ipynb

4.特征工程

5.模型训练