最近一直在为书的时序库章节研究Apache Druid,这是我见过的分布式数据库中,可能是唯一的微服务。什么?微服务不是应用架构的一种么?是的,但Druid就是把这种架构思想引入到了分布式数据库领域。并且Druid按照大数据lambda架构,完整实现了流批一体的支撑。现在网络上大多数Druid的文章都是基于0.17版本之前的老架构讲,区分文章新老架构的标识就是看realtime服务是否存在,这个realtime服务,在新架构中已经不存在了,而是完全整合进了Middle服务。另外Druid对于kafka在流处理上的强依赖关系,也就是说流数据尽量从走kafka,再进入Druid。对于Hadoop是弱依赖关系,只是深度存储(备份)的一种选择,你也可以存到例如aws s3当中。