llmsearch。LLM推理时的temperature和t-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

1 年前

trueweixin_41975548

llmsearch。LLM推理时的temperature和top_k等参数的各种组合进行逐一评估，寻找最佳参数设置的工具。这种工具也很重要。
https://www.reddit.com/r/LocalLLaMA/comments/1dbkqc1/i_built_a_small_tool_to_run_hyperparameter_search/

CSDN App 扫码分享

分享

评论

8

复制链接
举报

下一条：

Claude3似乎进行了一种叫“角色训练”的东西。就是说，有角色设定和性格设定。确实，我使用Opus可能比使用GPT-4o或者Gemini更多是因为它的性格更好。首先，许多AI公司为了避免AI说出有害的内容会进行对齐（alignment），但仅仅是无害化就够了吗？在社会上，无害的人能活跃吗？总是保持中立，只回答“这样说也对，但也有不同意见，所以不好说”的人是无能的。然而，如果只是迎合用户意见的阿谀奉承者也很令人困扰。我希望有一个有自己立场，并在需要时能说出事实的角色设定。因此，他们似乎是通过宪法AI的方法进行调整的。简而言之，就是给出“请扮演这样的角色”的角色设定，然后让AI去扮演，并让Claude3自己对其角色扮演的表现进行评分，进行类似DPO的微调。这种角色设定主要是为了对齐，但用户觉得性格很有魅力，评价很好。→RT