English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

طريقة تحقيق ت汇总 مزدوج بعد التجميع في SQL (معالجة استعلامات البحث عن السجلات المكررة وإزالتها)

--معالجة سجلات التكرار في الجدول (البحث والإزالة)
/******************************************************************************************************************************************************
1،سجلات المكرر مع نفس القيمة لـ Num و Name،إذا لم يكن هناك علاقة بين الأعمدة،احتفظ بسجل واحد فقط
2،إذا كان لـ Name نفس القيمة،فاحتفظ بأحد السجلات الكبيرة أو الصغيرة
المعدل:中國風(Roy)

التاريخ:2008.06.06
******************************************************************************************************************************************************/

--1،للبحث عن سجلات معالجة المكررة (إذا لم يكن هناك علاقة بين الأعمدة،استخدم 2000 لإنشاء عمود مكون من الأرقام المتدرجة وأيضًا جدول مؤقت،استخدم دالة row_number في SQL2005)

-- --> (Roy)إنشاء بيانات اختبار
 

if not object_id('Tempdb..#T') is null
 drop table #T
Go
Create table #T([ID] int,[Name] nvarchar(1),[Memo] nvarchar(2))
Insert #T
select 1,N'A',N'A1' union all
select 2,N'A',N'A2' union all
select 3,N'A',N'A3' union all
اختيار 4، N'B'، N'B1' يُدمج مع
اختيار 5، N'B'، N'B2'
Go


--I،المسجل الأصغر في اسم المختلف (يُفضل استخدام 1،2،3)،طريقة 3 في SQL05 تكون أكثر كفاءة من 1،2
الطريقة 1:
Select * from #T a where not exists(select 1 from #T where Name=a.Name and ID<a.ID)

الطريقة 2:
select a.* from #T a join (select min(ID)ID,Name from #T group by Name) b on a.Name=b.Name and a.ID=b.ID

方法3:
select * from #T a where ID=(select min(ID) from #T where Name=a.Name)

方法4:
select a.* from #T a join #T b on a.Name=b.Name and a.ID>=b.ID group by a.ID,a.Name,a.Memo having count(1)=1

الطريقة 5:
select * from #T a group by ID,Name,Memo having ID=(select min(ID)from #T where Name=a.Name)

الطريقة 6:
select * from #T a where (select count(1) from #T where Name=a.Name and ID<a.ID)=0

الطريقة 7:
select * from #T a where ID=(select top 1 ID from #T where Name=a.name order by ID)

方法8:
select * from #T a where ID!>all(select ID from #T where Name=a.Name)

方法9(注:ID为唯一时可用):
select * from #T a where ID in(select min(ID) from #T group by Name)

--SQL2005:

方法10:
select ID,Name,Memo from (select *,min(ID)over(partition by Name) as MinID from #T a)T where ID=MinID

方法11:

select ID,Name,Memo from (select *,row_number()over(partition by Name order by ID) as MinID from #T a)T where MinID=1

توليد النتيجة:
/*
ID          Name Memo
----------- ---- ----
1                                           A          A1
4                                           B          B1

(2 خطوط تؤثر)
*/


--II،السجل ذات الاسم نفسه والمعرف الأكبر،عكس min:
الطريقة 1:
Select * from #T a where not exists(select 1 from #T where Name=a.Name and ID>a.ID)

الطريقة 2:
select a.* from #T a join (select max(ID)ID,Name from #T group by Name) b on a.Name=b.Name and a.ID=b.ID order by ID

方法3:
select * from #T a where ID=(select max(ID) from #T where Name=a.Name) order by ID

方法4:
select a.* from #T a join #T b on a.Name=b.Name and a.ID<=b.ID group by a.ID,a.Name,a.Memo having count(1)=1

الطريقة 5:
select * from #T a group by ID,Name,Memo having ID=(select max(ID)from #T where Name=a.Name)

الطريقة 6:
select * from #T a where (select count(1) from #T where Name=a.Name and ID>a.ID)=0

الطريقة 7:
select * from #T a where ID=(select top 1 ID from #T where Name=a.name order by ID desc)

方法8:
select * from #T a where ID!<all(select ID from #T where Name=a.Name)

方法9(注:ID为唯一时可用):
select * from #T a where ID in(select max(ID) from #T group by Name)

--SQL2005:

方法10:
select ID,Name,Memo from (select *,max(ID)over(partition by Name) as MinID from #T a)T where ID=MinID

方法11:
select ID,Name,Memo from (select *,row_number()over(partition by Name order by ID desc) as MinID from #T a)T where MinID=1

生成结果2:
/*
ID          Name Memo
----------- ---- ----
3           A    A3
5           B    B2

(2 خطوط تؤثر)
*/

--2、删除重复记录有大小关系时,保留大或小其中一个记录


-- --> (Roy)إنشاء بيانات اختبار

if not object_id('Tempdb..#T') is null
    drop table #T
Go
Create table #T([ID] int,[Name] nvarchar(1),[Memo] nvarchar(2))
Insert #T
select 1,N'A',N'A1' union all
select 2,N'A',N'A2' union all
select 3,N'A',N'A3' union all
اختيار 4، N'B'، N'B1' يُدمج مع
اختيار 5، N'B'، N'B2'
Go

--I، الحفاظ على أقل سجل عند الاسم نفسه ID (يُنصح باستخدام 1، 2، 3)، الحفاظ على أقل سجل
الطريقة 1:
حذف a من #T حيث يوجد (اختيار 1 من #T حيث الاسم = a.الاسم و ID < a.ID)

الطريقة 2:
حذف a من #T يُدمج مع (اختيار أقل ID كـ ID، الاسم من #T المجموعة حسب الاسم) b على a.الاسم = b.الاسم و a.ID = b.ID حيث b.Id هو فارغ

方法3:
حذف a من #T حيث ID ليس في (اختيار أقل ID من #T حيث الاسم = a.الاسم)

الطريقة 4(الاحتياط: يمكن استخدامها عندما يكون ID فريدًا):
حذف a من #T حيث ID ليس في (اختيار أقل ID من #T المجموعة حسب الاسم)

الطريقة 5:
حذف a من #T حيث (عدد (اختيار 1) من #T حيث الاسم = a.الاسم و ID < a.ID) > 0

الطريقة 6:
حذف a من #T حيث ID ≠ (اختيار أعلى 1 ID من #T حيث الاسم = a.name ترتيبًا حسب ID)

الطريقة 7:
حذف a من #T حيث ID > أي (اختيار ID من #T حيث الاسم = a.الاسم)

select * from #T

توليد النتيجة:
/*
ID          Name Memo
----------- ---- ----
1                                           A          A1
4                                           B          B1

(2 خطوط تؤثر)
*/


--II، الحفاظ على أكبر سجل عند الاسم نفسه ID:

الطريقة 1:
حذف a من #T حيث يوجد (اختيار 1 من #T حيث الاسم = a.الاسم و ID > a.ID)

الطريقة 2:
حذف a من #T يُدمج مع (اختيار أكبر ID كـ ID، الاسم من #T المجموعة حسب الاسم) b على a.الاسم = b.الاسم و a.ID = b.ID حيث b.Id هو فارغ

方法3:
delete a from #T a where ID not in (select max(ID) from #T where Name=a.Name)

الطريقة 4(الاحتياط: يمكن استخدامها عندما يكون ID فريدًا):
delete a from #T a where ID not in(select max(ID)from #T group by Name)

الطريقة 5:
delete a from #T a where (select count(1) from #T where Name=a.Name and ID>a.ID)>0

الطريقة 6:
delete a from #T a where ID>(select top 1 ID from #T where Name=a.name order by ID desc)

الطريقة 7:
delete a from #T a where ID<any(select ID from #T where Name=a.Name)


select * from #T
/*
ID          Name Memo
----------- ---- ----
3           A    A3
5           B    B2

(2 خطوط تؤثر)
*/

--3、معالجة القيم المكررة عند عدم وجود علاقة بين الأحجام


-- --> (Roy)إنشاء بيانات اختبار
 
if not object_id('Tempdb..#T') is null
    drop table #T
Go
Create table #T([Num] int,[Name] nvarchar(1))
Insert #T
select 1,N'A' union all
select 1,N'A' union all
select 1,N'A' union all
select 2,N'B' union all
select 2,N'B'
Go

الطريقة 1:
if object_id('Tempdb..#') is not null
    drop table #
Select distinct * into # from #T--إزالة السجلات المكررة لإنشاء جدول مؤقت #

truncate table #T--إزالة محتويات الجدول

insert #T select * from #--إدخال الجدول المؤقت # إلى الجدول #T

--查看结果
select * from #T

/*
Num         Name
----------- ----
1                                 A
2                                 B

(2 خطوط تؤثر)
*/

--إعادة تنفيذ بيانات الاختبار باستخدام الطريقة 2
الطريقة 2:

alter table #T add ID int identity--إضافة عمود الترميز
go
delete a from  #T a where  exists(select 1 from #T where Num=a.Num and Name=a.Name and ID>a.ID)--只保留一条记录
go
alter table #T drop column ID--删除标识列

--查看结果
select * from #T

/*
Num         Name
----------- ----
1                                 A
2                                 B

(2 خطوط تؤثر)

*/

--重新执行测试数据后用方法3
方法3:
declare Roy_Cursor cursor local for
select count(1)-1,Num,Name from #T group by Num,Name having count(1)>1
declare @con int,@Num int,@Name nvarchar(1)
open Roy_Cursor
fetch next from Roy_Cursor into @con,@Num,@Name
while @@Fetch_status=0
begin
    set rowcount @con;
    delete #T where Num=@Num and Name=@Name
    set rowcount 0;
    fetch next from Roy_Cursor into @con,@Num,@Name
end
close Roy_Cursor
deallocate Roy_Cursor

--查看结果
select * from #T
/*
Num         Name
----------- ----
1                                 A
2                                 B

(2 خطوط تؤثر)

من المحتمل أن تُحبها