🦙EarlyLlama38B评估-基础模型对于微调来说看起-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

未眠叹流年、

2 年前

truedevmaximelabonne

🦙 Early Llama 3 8B评估

- 基础模型对于微调来说看起来很棒
- 指令模型令人失望：与OpenChat/OpenHermes水平相当（但用了1000万样本！）
- ORPO只用了1000个样本（和非常低的学习率）就取得了显著进展

需要等待微调合并，但有趣的是它显著提高了GPT4All得分。

🏆 排行榜：https://huggingface.co/spaces/mlabonne/Yet_Another_LLM_Leaderboard

CSDN App 扫码分享

分享

6

71

复制链接
举报

下一条：

昨天尝试了一个手部修复模型 https://replicate.com/973398769/hands-restoration效果还行，但速度超慢，每张照片大概需要1.5分钟手部在经过针对个人照片训练的Dreambooth模型处理后仍然会变形，但使用非Dreambooth模型的效果似乎好了100倍我认为一个办法可能就是自己制作一个手部修复器检测手部的x, y坐标、宽度和高度然后用提示词hands来进行图片到图片的拼接放大处理这就是这个手部修复模型的工作方式，但它实在是太慢了