2020腾讯游戏安全技术竞赛机器学习组优秀奖(LightGBM单模)
赛道链接:https://gslab.qq.com/html/competition/2020/index.htm
赛程时间:2019.04.03-2020.04.10
百度云盘下载链接:为避免数据丢失,提供数据集下载地址链接:https://pan.baidu.com/s/1yhXwmtyap-CR2aj8qq_Pag 密码: mg41
- 数据来自某MMORPG(大型多人在线角色扮演游戏), 并经过脱敏处理
- 日期
- 2020年03月01日的数据(含标签) 为训练集
- 2020年03月05日的数据为测试集
- 基础知识
*uin: 唯一标识游戏内的一个用户, 比如你的qq或微信
- roleid: 一个uin可能有多个角色
- 存储格式
- 文件名为: 年月日.txt
- 以文本存储
- 以竖线|分隔
- 空 或 \N 表示数据缺失
- 目录说明
- label_black 黑标签: 打金工作室帐号
- label_white 白标签: 非打金工作室帐号
- role_login 角色登入游戏
- role_logout 角色登出游戏
- role_create 创建新角色
- uin_chat 按天统计的帐号发言次数
- 以下数据仅在决赛时提供
- role_moneyflow 角色的详细金钱流水信息(当天按时间顺序前300条记录)
- role_itemflow 角色的详细物品流水信息(当天按时间顺序前300条记录)
# | 列名 | 类型 | 备注 |
---|---|---|---|
1 | dteventtime | STRING | 时间,格式YYYY-MM-DD HH:MM:SS |
2 | platid | BIGINT | ios=0/android=1 |
3 | areaid | BIGINT | 微信=1/手Q=2/游客=3 |
4 | worldid | BIGINT | 游戏小区(已加密) |
5 | uin | STRING | openid(已加密) |
6 | roleid | STRING | 角色id(已加密) |
7 | rolename | STRING | 角色名(已置空) |
8 | job | STRING | 职业 |
9 | rolelevel | BIGINT | 等级 |
10 | power | BIGINT | 战力 |
11 | friendsnum | BIGINT | 好友数量 |
12 | network | STRING | 3G/WIFI/2G/NULL |
13 | clientip | STRING | 客户端IP(已加密) |
14 | deviceid | STRING | 设备ID(已加密) |
# | 列名 | 类型 | 备注 |
---|---|---|---|
1 | dteventtime | STRING | 时间,格式YYYY-MM-DD HH:MM:SS |
2 | platid | BIGINT | ios=0/android=1 |
3 | areaid | BIGINT | 微信=1/手Q=2/游客=3 |
4 | worldid | BIGINT | 游戏小区(已加密) |
5 | uin | STRING | openid(已加密) |
6 | roleid | STRING | 角色id(已加密) |
7 | rolename | STRING | 角色名(已置空) |
8 | job | STRING | 职业 |
9 | rolelevel | BIGINT | 等级 |
10 | power | BIGINT | 战力 |
11 | friendsnum | BIGINT | 好友数量 |
12 | network | STRING | 3G/WIFI/2G/NULL |
13 | clientip | STRING | 客户端IP(已加密) |
14 | deviceid | STRING | 设备ID(已加密) |
15 | onlinetime | BIGINT | 在线时长(秒) |
# | 列名 | 类型 | 备注 |
---|---|---|---|
1 | dteventtime | STRING | YYYY-MM-DD HH#MM#SS |
2 | platid | BIGINT | ios=0/android=1 |
3 | areaid | BIGINT | 微信=1/手Q=2/游客=3 |
4 | worldid | BIGINT | 游戏小区(已加密) |
5 | uin | STRING | openid(已加密) |
6 | roleid | STRING | 角色id(已加密) |
7 | rolename | STRING | 角色名(已置空) |
8 | job | STRING | 职业 |
9 | regchannel | STRING | 注册渠道 |
10 | network | STRING | 3G/WIFI/2G |
11 | clientip | STRING | 客户端IP(已加密) |
12 | deviceid | STRING | 设备ID(已加密) |
# | 列名 | 类型 | 备注 |
---|---|---|---|
1 | uin | STRING | openid(已加密) |
2 | chat_cnt | BIGINT | 发言条数 |
# | 列名 | 类型 | 备注 |
---|---|---|---|
1 | dteventtime | STRING | 时间,格式YYYY-MM-DD HH:MM:SS |
2 | worldid | BIGINT | 游戏小区(已加密) |
3 | uin | STRING | openid(已加密) |
4 | roleid | STRING | 角色id(已加密) |
5 | rolelevel | BIGINT | 等级 |
6 | iMoneyType | STRING | 货币类型 |
7 | iMoney | BIGINT | 货币变化数 |
8 | AfterMoney | BIGINT | 动作后的货币存量 |
9 | AddOrReduce | BIGINT | 货币增加 0/减少 1 |
10 | Reason | STRING | 货币流动一级原因 |
11 | SubReason | STRING | 货币流动二级原因 |
# | 列名 | 类型 | 备注 |
---|---|---|---|
1 | dteventtime | STRING | 时间,格式YYYY-MM-DD HH:MM:SS |
2 | worldid | BIGINT | 游戏小区(已加密) |
3 | uin | STRING | openid(已加密) |
4 | roleid | STRING | 角色id(已加密) |
5 | rolelevel | BIGINT | 等级 |
6 | Itemtype | STRING | 道具类型 |
7 | Itemid | STRING | 道具ID |
8 | Count | BIGINT | 道具变动数量 |
9 | Aftercount | BIGINT | 动作后道具剩余数量 |
10 | Addorreduce | BIGINT | 增加 0/减少 1 |
11 | Reason | STRING | 道具流动一级原因 |
12 | SubReason | STRING | 道具流动二级原因 |
- python3
- scikit-learn
- gensim
- Ubuntu
- LightGBM
python main.py --data_dir 数据所在文件夹路径 --res_file 结果保存文件
单模,线下0.957左右