#举个简单易懂的例子说明：连续词袋模型（CBOW）和Skip-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

trueuniverssky2015

# 举个简单易懂的例子说明：连续词袋模型（CBOW）和Skip-gram

好的，让我们通过一个简单的例子来说明连续词袋模型（CBOW）和Skip-gram模型的区别。

假设我们有一个句子：“我喜欢喝茶和咖啡”。

### 连续词袋模型（CBOW）
在CBOW模型中，我们会选择一个窗口大小，比如说2。这意味着我们会使用每个词的前后两个词作为上下文来预测当前词。例如，要预测词“喜欢”，我们会使用“我”和“喝”作为输入。CBOW模型会尝试最大化给定上下文“我”和“喝”时，目标词为“喜欢”的概率。

### Skip-gram模型
而在Skip-gram模型中，我们会从句子中选择一个词（比如“喝”），然后尝试预测这个词周围的所有词。例如，对于词“喝”，我们可能会尝试预测它前后各两个词，即“我”、“喜欢”、“茶”和“和”。Skip-gram模型会为每个词汇生成多个上下文词的预测，这样即使是稀有词汇，也能有足够的训练数据来学习一个好的词嵌入。

总结一下：
- **CBOW**：使用上下文词来预测目标词（“我”和“喝”预测“喜欢”）。
- **Skip-gram**：使用目标词来预测上下文词（“喝”预测“我”、“喜欢”、“茶”和“和”）。

这两种模型都是为了让相似的词在向量空间中的表示接近，从而能够捕捉到词与词之间的语义关系。

人工智能时代

CSDN App 扫码分享

分享

评论

1

打赏

复制链接
举报

下一条：

外企算法工程师，目前开发算法在水果等公司业务上均在使用，有项目可联系~