小天管理 发表于 9月30日 发表于 9月30日 使用 LoRA 进行微调大约 1W 条微调数据,大概是四个维度各十几种排列组合来的学习率:1e-6训练轮数:10学习率调节器:Inverse Square Root学习的参数大概是这么多trainable params: 20971520 || all params: 8051232768 || trainable%: 0.2605图像看着倒还不错但实际生成的 SQL 效果不升反降求助这可能是什么原因啊?
已推荐帖子
创建帐户或登录来提出意见
您需要成为会员才能提出意见
创建帐户
注册成为会员.只要几个简单步骤!
注册帐户登录
已经有帐户? 请在此处登录.
现在登录