热门
最新
红包
立Flag
投票
同城
我的
发布
Cintas1995
10 月前
truedevalvarocintas
Claude 3.5 Sonnet 是一个重大变化。
人们正在分享许多成功案例和疯狂的使用场景。
10 个狂野的例子:
下一条:
我在撰写此概述时阅读的前五篇论文是:1. LLM-as-a-Judge:
https://arxiv.org/abs/2306.056852.
G-Eval:
https://arxiv.org/abs/2303.166343.
LLMs作为人类评估的替代方案:
https://arxiv.org/abs/2305.019374.
Length-Controlled AlpacaEval:
https://arxiv.org/abs/2404.044755.
LLMs容易分心:
https://arxiv.org/abs/2302.00093
立即登录