分布式计算平台和分布式消息队列的区别和优缺点( 二 )


■网友
按照你的描述来看 不是流式计算 几千个文件貌似是属于离线的(而且既然数量多 那么单个文件size应该很小) 提升计算速度的话 Hadoop + Spark就好了 这个方案是不需要搭建什么别的东西的 而且比较容易拓展 如果后期有流式计算的需求 并且给你一些机器的情况下 再重新考虑这个事情


推荐阅读