热门

最新

红包

立Flag

投票

同城

我的

发布
qq_41549462
大数据赵轩
5 年前
trueqq_41549462

groupBy()算子函数签名:
def groupBy(f : T =>K]) : RDD[K, Iterable[T]]
2、算子·功能:
1、将原来RDD中的元素按照groupBy中的函数f的执行结果进行分组
2、结果相同的元素进入同一个迭代器
3、groupBy算子存在shuffle
4、shuffle会落盘,元素会在不同分区中乱窜

CSDN App 扫码分享
分享
评论
1
打赏
  • 复制链接
  • 举报
下一条:
市场变化太快,和朋友聊天话题,还在为硬盘价格暴涨咋舌不已时,硬盘价格又开始可暴跌。亲身经历了,才终于明白以前书上学的,商人们“囤积居奇,投机倒把”是什么意思。[抠鼻]
立即登录