菜鸟笔记
提升您的技术认知

sql-ag真人游戏

一 测试数据构建

二 基本使用(单独使用)

三 聚合函数中的distinct

下面全部是在mysql 的环境下进行测试的!!!!!

一 测试数据构建

数据表 跟 数据

set foreign_key_checks=0;
-- ----------------------------
-- table structure for test_distinct
-- ----------------------------
drop table if exists `test_distinct`;
create table `test_distinct` (
  `id` int(11) not null auto_increment,
  `province` varchar(255) default null,
  `city` varchar(255) default null,
  `username` varchar(255) default null,
  primary key (`id`)
) engine=innodb auto_increment=8 default charset=gbk;
-- ----------------------------
-- records of test_distinct
-- ----------------------------
insert into `test_distinct` values ('1', 'bj', 'bj', 'houchenggong');
insert into `test_distinct` values ('2', 'ln', 'dl', 'zhenhuasun');
insert into `test_distinct` values ('3', 'ln', 'dl', 'yueweihua');
insert into `test_distinct` values ('4', 'bj', 'bj', 'sunzhenhua');
insert into `test_distinct` values ('5', 'ln', 'tl', 'fengwenquan');
insert into `test_distinct` values ('6', 'ln', 'dl', 'renquan');
insert into `test_distinct` values ('7', 'ln', 'dl', 'wuxin');

样例数据

二 基本使用(单独使用)

介绍

distinct一般是用来去除查询结果中的重复记录的,而且这个语句在select、insert、delete和update中只可以在select中使用,

具体的语法如下:

select distinct expression[,expression...] from tables [where conditions];

这里的expressions可以是多个字段。

示例:

只能在select 语句中使用,不能在 insert, delete, update 中使用

2.1 只对一列操作

对一列操作,表示选取该列不重复的数据项,这是用的比较多的一种用法

测试数据

select distinct city from test_distinct;

2.2 对多列操作

对多列操作,表示选取 多列都不重复的数据,相当于 多列拼接的记录 的整个一条记录 , 不重复的记录。

 测试数据:

select distinct province, city from test_distinct;

结果:

注意:

1. distinct 必须放在第一个参数。

错误示例:

2.distinct 表示对后面的所有参数的拼接取 不重复的记录,相当于 把 select 表达式的项 拼接起来选唯一值。

测试数据:

select distinct   province,city from test_distinct;

期望值:  只对 第一个参数  province 取唯一值。

province   city

bj    bj

ln  dl

record  ln(province), tl(city) 被过滤掉,实际上

实际值:

distinct 表示对后面的所有参数的拼接取 不重复的记录,相当于 把 select 表达式的项 拼接起来选唯一值。

解决方法:使得distinct 只对其中某一项生效

方法一: 利用 group_concat 函数

select  group_concat(distinct province) as province, city from test_distinct group by province;

方法二: 不利用distinct , 而是利用group by (我认为第一种方法 其实就是 第二种方法, 第一种方法也就是第二种方法)

select province, city from test_distinct group by province;

最后,比较下这两种方法的执行效率,分别explain 一下。

方法一

explain select group_concat(distinct province) as province, city from test_distinct group by province;

方法二

explain select province, city from test_distinct group by province;

2.3 针对null的处理

distinct对null是不进行过滤的,即返回的结果中是包含null值的。

测试数据:

select distinct username from test_distinct;

2.4 与all不能同时使用
默认情况下,查询时返回所有的结果,此时使用的就是all语句,这是与distinct相对应的,如下:

测试数据:

select all province, city from test_distinct;

2.5 与distinctrow同义

select distinctrow expression[,expression...] from tables [where conditions];

三 聚合函数中的distinct

在聚合函数中distinct 一般跟 count 结合使用。

效果与 select  sum (tmp.tmp_ct)  from ( select count(name)  as tmp_ct group by name ) as tmp  类似

但不相同 !!, count 会过滤null , 而 第二种方法不会!!!!

示例:

测试数据:

select count(distinct username) from test_distinct;

注意 count( ) 会过滤掉为null 的项

再用 group by 试一下

select sum(tmp.u_ct) from (select count(username) as u_ct from test_distinct group by username) as tmp;

我们在子查询中调查一下:

select username, count(username) as u_ct from test_distinct group by username

网站地图