热门

最新

红包

立Flag

投票

同城

我的

发布
februarydiary
FebruaryDiary
4 年前
truefebruarydiary

前些天得到一位在阿里工作的前辈的指点,接下来打算攻克这本有名的宝书。早听说很厚,没想到这么厚哈哈哈。不知道什么时候才能看完…有的时候假期也真的真的很想偷懒啊…
图2是去年差不多时候在腾格里沙漠拍的。好想出去走走。

CSDN App 扫码分享
分享
46
35
打赏
  • 复制链接
  • 举报
下一条:
hive left semi join(左半连接)是 IN/EXISTS 子查询的一种更高效的实现。本质上就是通过join的B表来筛选A,而不引入B表中的数据,同时可以提高效率。示例SELECT A.KEY,A.VALUEFROM AWHERE A.KEY IN (SELECT B.KEY FROM B )可以改写为SLECT A.KEY,A.VALUEFROM ALEFT SEMI JOIN BON A.KEY=B.KEY1. 只能在 ON 子句中设置过滤条件2. 因为 left semi join 是 in(keySet) 的关系,遇到右表重复记录,左表会跳过,而 join 则会一直遍历。这就导致右表有重复值得情况下 left semi join 只产生一条,join 会产生多条,也会导致 left semi join 的性能更高。
立即登录