我们提出使用模型生成的问答(QA)来解决当前阶段长文本数据有限的问题:我们将文档分割成固定大小的块,然后让我们的短上下文模型为每个块生成问答对。接着,我们通过合并相邻的块并在末尾附加问答对来构建长上下文示例。