热门

最新

红包

立Flag

投票

同城

我的

发布
devblinkdl
徐来!
2 年前
truedevblinkdl

RWKV状态调整对齐:因为RWKV是100%的RNN,我们可以直接调整其RNN状态来控制它的行为🤯。例如,一个经过状态调整的RWKV-6 "Finch" 1.6B版本可以使用表情符号,即使是对于未见过的提示也能够保持趣味性🐦。演示模型:https://huggingface.co/BlinkDL/temp-latest-training-models/blob/main/RWKV-x060-eng_single_round_test-1B6-20240427-ctx1024.pth(使用rwkv pip 包0.8.26及以上版本,并使用“User: xxx\n\nAssistant:”提示。为单轮问答调整过)。

CSDN App 扫码分享
分享
9
99
  • 复制链接
  • 举报
下一条:
QA保真过程中定的责,PM自己开小会定的结论不认,你好歹叫上QA啊,不知道大家所在的团队健康不?
立即登录