我正在招聘1-2名全职人员,从事合成文本数据创建工作,用于训练具有代理能力的大型语言模型,以提高数据质量。
我有大约40多名申请者,我只能挑选最适合这份工作的人。
加分项包括:
- 有合成数据相关经验,能够创建、清洗、评估等
- 代理构建 - 利用检索增强生成(RAG)、网页浏览、函数调用、外部增强、代码解释器等
- 数据科学和数据工程,改进我们的数据处理管道、优化这些管道以及创建高效的管道
- 理解大型语言模型的论文并有能力实现它们
- 曾在前沿实验室工作过
- 目标、理念和文化上的契合
理想情况下,我将找到1-2名具备以上所有技能的人。请通过Twitter私信我或发送邮件至Teknium@nousresearch。
你应该包括你在上述哪些技能方面有经验。你还有哪些其他资格,以及你的工作经验或你完成的项目。
我的目标是达到最先进的、前沿级别的训练后水平和开创性的通用模型,我需要你的帮助来实现这一点。
接下来几周我会和很多人交流。