NIUCLOUD是一款SaaS管理后台框架多应用插件+云编译。上千名开发者、服务商正在积极拥抱开发者生态。欢迎开发者们免费入驻。一起助力发展! 广告
在处理大规模数据集时,在开发和修改查询的阶段,如果能在数据集的一小部分数据上试运行查询,会带来很多方便。 <br/> ```sql # 分桶抽样基本语法 select * from table_name tablesample(bucket x out of y on param) s; -- x:要从第x个分桶开始查询,x <= y; -- y:抽样比例,比如分桶总数为4,y=2,则抽取y=4/2=2个分桶; 如果分桶总数为4,y=8,则抽取y=4/8=1/2个分桶; 注意:y必须是分桶总数的倍数或因子。 -- param:可以是分桶表的一列或多列,或者是一个有返回值的函数,比如随机函数rand() -- s:表的别名 #### #### select * from bucket_4 tablesample(bucket 2 out of 8) s; #### 根据id列查询 ##### select * from bucket_4 tablesample(bucket 2 out of 48 on id) s; #### 根据整行随机抽样 #### select * from bucket_4 tablesample(bucket 2 out of 48 on rand()) s; ```