Commit Graph

22 Commits

Author SHA1 Message Date
zhiyang7 9b9b9219e0 随机切换明牌模式进行训练 2022-01-06 15:35:51 +08:00
zhiyang7 8980a97324 修复BUG 2022-01-05 11:22:11 +08:00
zhiyang7 8dd95e3e59 修复BUG 2022-01-04 18:21:13 +08:00
zhiyang7 08e05dbc83 unified_model 2022-01-04 18:15:35 +08:00
ZaneYork 4571bb3dfc 移除无效参数 2022-01-02 22:33:48 +08:00
zhiyang7 f12e051100 调整循环拼接逻辑为concatenate 2021-12-24 10:12:55 +08:00
zhiyang7 fb22ab2649 旧模型压缩模式 2021-12-23 09:55:49 +08:00
zhiyang7 177cb04c03 修复BUG 2021-12-23 09:34:03 +08:00
ZaneYork b5982b7195 新增压缩版模型 2021-12-22 21:19:10 +08:00
zhiyang7 d5401cefc9 移除无效代码 2021-12-22 18:07:43 +08:00
zhiyang7 42066ae7a9 提速降费 2021-12-21 15:34:27 +08:00
zhiyang7 84775d52e6 提速降费 2021-12-21 14:58:28 +08:00
zhiyang7 7e190c2353 调整reward 2021-12-20 16:04:33 +08:00
zhiyang7 dba179db0e 取回legacy_mode参数代码 2021-12-20 10:02:55 +08:00
ZaneYork 5055a5c84d 修复游戏规则BUG, 移除BID模型 2021-12-19 17:19:32 +08:00
ZaneYork 64bf792d15 调整obs,增加炸弹作为特征之一 2021-12-11 22:10:40 +08:00
zhiyang7 05aa179ba6 新增vanilla模型训练逻辑及开关项 2021-12-10 16:12:50 +08:00
zhiyang7 0df61c62e3 reward调整 2021-12-09 22:07:11 +08:00
zhiyang7 c239085c24 移除根据胜率叫地主逻辑(4人场景下,胜率计算未适配) 2021-12-09 20:02:40 +08:00
zhiyang7 c7f105d20d 调整激励算法 2021-12-07 10:33:18 +08:00
zhiyang7 aab93d66c6 改造为4人斗地主 2021-12-05 12:03:30 +08:00
Vincentzyx 3381e96932 Env 2021-09-07 17:19:25 +08:00