Mysql中如何查找并删除重复数据
考试系统中做了一个用户导入试题功能,导致用户导入了很多重复的试题,我需要查询及删除一下重复的记录,于是有了这篇文章。
(一)单个字段
1、查找表中多余的重复记录,根据(question_title)字段来判断
代码如下 | |
select * from questions where question_title in (select question_title from people group by question_title having count(question_title) > 1) |
2、删除表中多余的重复记录,根据(question_title)字段来判断,只留有一个记录
代码如下 | |
delete from questions |
(二)多个字段
删除表中多余的重复记录(多个字段),只留有rowid最小的记录
代码如下 | |
DELETE FROM questions WHERE (questions_title,questions_scope) IN (SELECT questions_title,questions_scope FROM questions GROUP BY questions_title,questions_scope HAVING COUNT(*) > 1) AND question_id NOT IN (SELECT MIN(question_id) FROM questions GROUP BY questions_scope,questions_title HAVING COUNT(*)>1) |
用上述语句无法删除,创建了临时表才删的,求各位达人解释一下。
代码如下 | |
CREATE TABLE tmp AS SELECT question_id FROM questions WHERE (questions_title,questions_scope) IN (SELECT questions_title,questions_scope FROM questions GROUP BY questions_title,questions_scope HAVING COUNT(*) > 1) AND question_id NOT IN (SELECT MIN(question_id) FROM questions GROUP BY questions_scope,questions_title HAVING COUNT(*)>1); DELETE FROM questions WHERE question_id IN (SELECT question_id FROM tmp); DROP TABLE tmp; |
(三)
代码如下 | |
declare @max integer,@id integer declare cur_rows cursor local for select 主字段,count(*) from 表名 group by 主字段 having count(*) >; 1 open cur_rows fetch cur_rows into @id,@max while @@fetch_status=0 begin select @max = @max -1 set rowcount @max delete from 表名 where 主字段 = @id fetch cur_rows into @id,@max end close cur_rows set rowcount 0 |
上面讲到了很多,下面我们一起来看实例删除重复记录实例
例1,表中有主键(可唯一标识的字段),且该字段为数字类型
代码如下 | |
/* 插入测试数据 */ SELECT * FROM `t1`; |
查找id最小的重复数据(只查找id字段)
代码如下 | |
/* 查找id最小的重复数据(只查找id字段) */ |
查找所有重复数据
代码如下 | |
/* 查找所有重复数据 */ |
查找除id最小的数据外的重复数据
代码如下 | |
/* 查找除id最小的数据外的重复数据 */ |
例2,表中没有主键(可唯一标识的字段),或者主键并非数字类型(也可以删除重复数据,但效率上肯定比较慢)
例2测试数据
代码如下 | |
/* 表结构 */ /* 测试数据,与上例一样的测试数据,只是主键变为字符串形式 */ SELECT * FROM `noid`; |
为表添加自增长的id字段
代码如下 | |
/* 为表添加自增长的id字段 */ SELECT * FROM `noid`; |
MySQL中必须是有索引的字段才可以使用AUTO_INCREMENT
删除重复数据与上例一样,记得删除完数据把id字段也删除了
删除重复数据,只保留一条数据
代码如下 | |
/* 删除重复数据,只保留一条数据 */ /* 删除id字段 */ SELECT * FROM `noid`; |