我们听到了一些用户反映,如果你只想要一个语言的数据,要从庞大的Aya数据集中筛选出来是很困难的。🌍考虑到有101种语言和5.13亿的数据点,这是可以理解的。:) 很兴奋地分享我们现在有了按语言划分的版本。🥳https://huggingface.co/datasets/CohereForAI/aya_collection_language_split