听说通过反思(Reflection)可以提升LLM(大语言模型)的回答质量,于是我试着让Gemini1.5Flash进行反思,并在Shaberi3基准测试中测试了一下,结果分数反而从8.03下降到了7.98。2024/09/09 反思能提升LLM的性能吗?https://six-loganberry-ba7.notion.site/24-09-09-LLM-7ca58be8eecd42db9c1b8f4743ab6222?pvs=4