Commit Graph

9 Commits

Author SHA1 Message Date
czzhangheng bef30b9c2f 解决合并冲突,整合dev和main分支的更改 2025-05-14 13:13:11 +08:00
czzhangheng eb8684bf91 收到垃圾堆 2025-04-22 14:54:39 +08:00
czzhangheng e851eb21d6 e21-e26无改进 2025-04-21 20:31:09 +08:00
czzhangheng 86fabd4ca7 增加 exp9 混合专家
exp8 动态图manba
2025-04-17 18:41:57 +08:00
czzhangheng bc9a2667c2 新增了模型蒸馏STMLP
现在Trainer每次epoch完后都会保存模型checkpoint
其中STMLP会自动教师模型到pre-train
根据教师模型的存在情况启动/预训练or蒸馏模式
2025-04-07 17:05:59 +08:00
czzhangheng 229b6320b9 添加固定种子 2025-04-04 14:37:05 +08:00
czzhangheng 0a9ac1a025 fix bugs 2025-03-03 16:31:04 +08:00
HengZhang 44517219b7 add dl function 2025-03-03 11:34:36 +08:00
HengZhang 26758e761b init 2025-03-02 23:41:12 +08:00