想知道 GPT 和 Llama 的内部结构如何比较吗?我编写了一个逐步代码笔记本来分解关键差异:https://github.com/rasbt/LLMs-from-scratch/blob/main/ch05/07_gpt_to_llama/converting-gpt-to-llama2.ipynb