热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_43717681
黄乐荣
2 年前
trueweixin_43717681

基础组件之Model
模型类型:
编码器模型:自编码模型,使用encoder,拥有双向的注意力机制,即计算每一个词的特征时候都能看到完整的上下文

解码器模型:自回归模型,使用decoder,拥有单向的注意力机制,即计算每一个词的特征都只能看到上文,无法看到下文

编码器解码器模型:序列到序列的模型,使用encoder+decoder,encoder部分使用双向的注意力,decoder部分使用单向注意力

编码器模型-自编码模型——常用预训练模型(ALBERT、Bert、DistillBert、RoBERTa)——使用任务(文本分类、命名实体识别、阅读理解)

解码器模型-自回归模型——常用预训练模型(GPT、GPT-2、Bloom、LLamA)——适用任务(文本生成)

编码器解码器模型-序列到序列模型——(BART、T5、Marian、mBert、GLM)——文本摘要、机器翻译

Model Head是连接在模型后的层,通常为1个或多个全连接层
Model Head将模型的编码的表示结果进行映射,依次解决不同类型的任务
Model Inputs——Full Model(Transformer Network(Embeddings——layers)——Hidden States——Head)——Model output

CSDN App 扫码分享
分享
评论
点赞
打赏
  • 复制链接
  • 举报
下一条:
Arduino学习记录5.8—5.14
立即登录