很容易找到LLM(大型语言模型)无法完成的简单任务,例如数一个词中的字母数量。这是因为LLM有一些关键的局限性,包括这篇论文所展示的计数能力的不足。但这并不意味着它们不能在其他任务上表现得比我们更好(并且工具/架构可能会有所帮助)。