🎙️Ryan和Ben与Stack Overflow的高级数据科学家Michael Geden坐下来讨论大型语言模型(LLMs)是如何被用来评估其他LLMs的,以及数据验证的重要性。https://stackoverflow.blog/2024/04/16/how-do-you-evaluate-an-llm-try-an-llm/?utm_medium=social&utm_source=twitter&utm_campaign=so-podcast&utm_content=michael-geden-data-science