NIUCLOUD是一款SaaS管理后台框架多应用插件+云编译。上千名开发者、服务商正在积极拥抱开发者生态。欢迎开发者们免费入驻。一起助力发展! 广告
* 将相对分散、数据量小的表放在`join`的左边,可以有效地减小内存溢出错误发生的概率; * 可以进一步,使用`groupy by`让小表(1000条以内的记录)先进内存,让其在map端完成reduce; 在新版本中已经对`小表 join 大表`和 `大表 join 小表`进行了优化,小表左右位置已经没有区别了。