czzhangheng
|
140ead3975
|
为model添加num_nodes
|
2025-12-03 08:40:00 +08:00 |
czzhangheng
|
f64144f5c1
|
为其他模型添加配置文件
|
2025-12-01 20:45:30 +08:00 |
czzhangheng
|
6e94ae90d2
|
修复冗余参数项
|
2025-12-01 19:52:08 +08:00 |
czzhangheng
|
a1a50880dc
|
删除冗余参数项
|
2025-12-01 19:13:23 +08:00 |
czzhangheng
|
d7d428e434
|
更改配置为字典序
|
2025-12-01 19:04:14 +08:00 |
czzhangheng
|
9b3bb44552
|
修复配置, trainer
|
2025-11-09 22:30:23 +08:00 |
czzhangheng
|
bc9a2667c2
|
新增了模型蒸馏STMLP
现在Trainer每次epoch完后都会保存模型checkpoint
其中STMLP会自动教师模型到pre-train
根据教师模型的存在情况启动/预训练or蒸馏模式
|
2025-04-07 17:05:59 +08:00 |