harry.zhang
|
8025a46baa
|
更新.gitignore以忽略Result.xlsx文件,修改run.py以优先使用macOS的MPS设备,优化设备设置逻辑
|
2025-08-18 14:32:20 +08:00 |
czzhangheng
|
bef30b9c2f
|
解决合并冲突,整合dev和main分支的更改
|
2025-05-14 13:13:11 +08:00 |
czzhangheng
|
eb8684bf91
|
收到垃圾堆
|
2025-04-22 14:54:39 +08:00 |
czzhangheng
|
bd94d3fdd3
|
exp12 残差
|
2025-04-18 10:20:55 +08:00 |
czzhangheng
|
bc9a2667c2
|
新增了模型蒸馏STMLP
现在Trainer每次epoch完后都会保存模型checkpoint
其中STMLP会自动教师模型到pre-train
根据教师模型的存在情况启动/预训练or蒸馏模式
|
2025-04-07 17:05:59 +08:00 |
czzhangheng
|
229b6320b9
|
添加固定种子
|
2025-04-04 14:37:05 +08:00 |
czzhangheng
|
5306d24408
|
新增消耗分析模式,只需在原有的mode中调整为benchmark即可
|
2025-03-26 12:38:57 +08:00 |
czzhangheng
|
c07bf05324
|
add PDF2SeQ
|
2025-03-10 19:02:42 +08:00 |
czzhangheng
|
0a9ac1a025
|
fix bugs
|
2025-03-03 16:31:04 +08:00 |
HengZhang
|
44517219b7
|
add dl function
|
2025-03-03 11:34:36 +08:00 |
HengZhang
|
26758e761b
|
init
|
2025-03-02 23:41:12 +08:00 |