热门
最新
红包
立Flag
投票
同城
我的
发布
查看我们的模型 🤗 https://huggingface.co/jinaai/reader-lm-0.5b https://huggingface.co/jinaai/reader-lm-1.5b
AWS SageMaker 和 Azure Marketplace 敬请期待!
另外,请务必阅读第一条线程中的完整博客文章,了解我们在训练 SLM 时的独到见解。当然,在效率和质量方面仍有很大的提升空间:扩展上下文长度、加快解码速度以及在输入中添加对指令的支持,这将使 Reader-LM 能够将网页的特定部分提取为 markdown。
CSDN App 扫码分享
5
56
- 复制链接
- 举报
下一条:
宣布 reader-lm-0.5b 和 reader-lm-1.5b,https://jina.ai/news/reader-lm-small-language-models-for-cleaning-and-converting-html-to-markdown?nocache=1 两个小型语言模型(SLMs),受 Jina Reader 启发,专门训练用于从噪声较大的原始 HTML 中生成干净的 Markdown。这两个模型都是多语言支持的,并且支持最长 256K tokens 的上下文长度。尽管它们体积较小,但在 HTML2Markdown 任务中,这些模型的表现达到了最先进的水平,超越了更大规模的 LLM 对手,而它们的体积仅为后者的 1/50。