少年阿賓

那些青春的歲月

BlogJava :: 首頁 :: 聯(lián)系 :: 聚合

:: 管理

500 Posts :: 0 Stories :: 135 Comments :: 0 Trackbacks

sql去除重復(fù)語句

sql 單表/多表查詢?nèi)コ貜?fù)記錄

單表distinct

多表group by

group by 必須放在 order by 和 limit之前，不然會(huì)報(bào)錯(cuò)

************************************************************************************

1、查找表中多余的重復(fù)記錄，重復(fù)記錄是根據(jù)單個(gè)字段（peopleId）來判斷

select * from people
where peopleId in (select peopleId from people group by peopleId having count(peopleId) > 1)

2、刪除表中多余的重復(fù)記錄，重復(fù)記錄是根據(jù)單個(gè)字段（peopleId）來判斷，只留有rowid最小的記錄
delete from people
where peopleId in (select peopleId from people group by peopleId having count(peopleId) > 1)
and rowid not in (select min(rowid) from people group by peopleId having count(peopleId )>1)

3、查找表中多余的重復(fù)記錄（多個(gè)字段）
select * from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

4、刪除表中多余的重復(fù)記錄（多個(gè)字段），只留有rowid最小的記錄
delete from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

5、查找表中多余的重復(fù)記錄（多個(gè)字段），不包含rowid最小的記錄
select * from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

(二)
比方說
在A表中存在一個(gè)字段“name”，
而且不同記錄之間的“name”值有可能會(huì)相同，
現(xiàn)在就是需要查詢出在該表中的各記錄之間，“name”值存在重復(fù)的項(xiàng)；
Select Name,Count(*) From A Group By Name Having Count(*) > 1

如果還查性別也相同大則如下:
Select Name,sex,Count(*) From A Group By Name,sex Having Count(*) > 1

(三)
方法一

declare @max integer,@id integer

declare cur_rows cursor local for select 主字段,count(*) from 表名 group by 主字段 having count(*) >； 1

open cur_rows

fetch cur_rows into @id,@max

while @@fetch_status=0

begin

select @max = @max -1

set rowcount @max

delete from 表名 where 主字段 = @id

fetch cur_rows into @id,@max
end

close cur_rows

set rowcount 0

方法二

＂重復(fù)記錄＂有兩個(gè)意義上的重復(fù)記錄，一是完全重復(fù)的記錄，也即所有字段均重復(fù)的記錄，二是部分關(guān)鍵字段重復(fù)的記錄，比如Name字段重復(fù)，而其他字段不一定重復(fù)或都重復(fù)可以忽略。

1、對(duì)于第一種重復(fù)，比較容易解決，使用

select distinct * from tableName

就可以得到無重復(fù)記錄的結(jié)果集。

如果該表需要?jiǎng)h除重復(fù)的記錄（重復(fù)記錄保留1條），可以按以下方法刪除

select distinct * into #Tmp from tableName

drop table tableName

select * into tableName from #Tmp
drop table #Tmp

發(fā)生這種重復(fù)的原因是表設(shè)計(jì)不周產(chǎn)生的，增加唯一索引列即可解決。

2、這類重復(fù)問題通常要求保留重復(fù)記錄中的第一條記錄，操作方法如下

假設(shè)有重復(fù)的字段為Name,Address，要求得到這兩個(gè)字段唯一的結(jié)果集

select identity(int,1,1) as autoID, * into #Tmp from tableName

select min(autoID) as autoID into #Tmp2 from #Tmp group by Name,autoID

select * from #Tmp where autoID in(select autoID from #tmp2)

最后一個(gè)select即得到了Name，Address不重復(fù)的結(jié)果集（但多了一個(gè)autoID字段，實(shí)際寫時(shí)可以寫在select子句中省去此列）

(四)
查詢重復(fù)

select * from tablename where id in (select id from tablename

group by id

having count(id) > 1

)

3、查找表中多余的重復(fù)記錄（多個(gè)字段）
select * from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

運(yùn)行會(huì)產(chǎn)生問題，where(a.peopleId,a.seq)這樣的寫發(fā)是通不過的！！！

posted on 2012-11-21 23:20 abin 閱讀(549) 評(píng)論(0) 編輯收藏所屬分類: Database

新用戶注冊(cè) 刷新評(píng)論列表


只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: mysql oracle 事務(wù)并發(fā)、事務(wù)隔離級(jí)別 isolation level sql 解釋執(zhí)行計(jì)劃 SQL 注入查看表接口數(shù)據(jù)庫連接池參數(shù) sql去除重復(fù)語句一道關(guān)于員工與部門查詢的SQL筆試題 sql 常見面試題一 Sql常見面試題

少年阿賓

常用鏈接

留言簿(22)

我參與的團(tuán)隊(duì)

隨筆分類

隨筆檔案

新聞分類

相冊(cè)

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜