小天管理 发表于 2024年9月30日 发表于 2024年9月30日 使用 LoRA 进行微调大约 1W 条微调数据,大概是四个维度各十几种排列组合来的学习率:1e-6训练轮数:10学习率调节器:Inverse Square Root学习的参数大概是这么多trainable params: 20971520 || all params: 8051232768 || trainable%: 0.2605图像看着倒还不错但实际生成的 SQL 效果不升反降求助这可能是什么原因啊?
已推荐帖子