热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_41975548
umiyuki_ai
1 年前
trueweixin_41975548

llmsearch。LLM推理时的temperature和top_k等参数的各种组合进行逐一评估,寻找最佳参数设置的工具。这种工具也很重要。
https://www.reddit.com/r/LocalLLaMA/comments/1dbkqc1/i_built_a_small_tool_to_run_hyperparameter_search/

CSDN App 扫码分享
分享
评论
8
  • 复制链接
  • 举报
下一条:
Claude3似乎进行了一种叫“角色训练”的东西。就是说,有角色设定和性格设定。确实,我使用Opus可能比使用GPT-4o或者Gemini更多是因为它的性格更好。首先,许多AI公司为了避免AI说出有害的内容会进行对齐(alignment),但仅仅是无害化就够了吗?在社会上,无害的人能活跃吗?总是保持中立,只回答“这样说也对,但也有不同意见,所以不好说”的人是无能的。然而,如果只是迎合用户意见的阿谀奉承者也很令人困扰。我希望有一个有自己立场,并在需要时能说出事实的角色设定。因此,他们似乎是通过宪法AI的方法进行调整的。简而言之,就是给出“请扮演这样的角色”的角色设定,然后让AI去扮演,并让Claude3自己对其角色扮演的表现进行评分,进行类似DPO的微调。这种角色设定主要是为了对齐,但用户觉得性格很有魅力,评价很好。→RT
立即登录