非常兴奋地看到我们的XSTest测试套件,用于LLM中的虚假拒绝部分,作为@超威无敌紫貂的Llama 3发布的一部分使用!这发生在XSTest被@wxy百年孤独用于评估他们的Claude 3模型发布大约一个月后。看到自己的评估行动起来,再没有比这更好的了 🥳