Xem thảo luận
Cải thiện bài viết
Lưu bài viết
Xem thảo luận
Cải thiện bài viết
Lưu bài viết
ĐọcDataframe.duplicated[] method of Pandas.
Bàn luận DataFrame.duplicated[subset = None, keep = ‘first’]
Parameters:
subset: This Takes a column or list of column label. It’s default value is None. After passing columns, it will consider them only for duplicates.
keep: This Controls how to consider duplicate value. It has only three distinct value and default is ‘first’.
- Trong bài viết này, chúng tôi sẽ thảo luận về cách tìm các hàng trùng lặp trong một khung dữ liệu dựa trên tất cả hoặc một danh sách các cột. Đối với điều này, chúng tôi sẽ sử dụng phương thức dataFrame.duplicated [] của gấu trúc. & Nbsp;‘first’, This considers first value as unique and rest of the same values as duplicate.
- Cú pháp: DataFrame.Duplicated [tập hợp con = none, keep = ’đầu tiên] tham số: & nbsp; tập hợp con: Điều này lấy một cột hoặc danh sách nhãn cột. Giá trị mặc định của nó là không có. Sau khi vượt qua các cột, nó sẽ chỉ xem xét chúng cho các bản sao. Giữ lại: Điều này kiểm soát cách xem xét giá trị trùng lặp. Nó chỉ có ba giá trị riêng biệt và mặc định là ‘đầu tiên. & Nbsp; & nbsp;‘last’, This considers last value as unique and rest of the same values as duplicate.
- Nếu ’đầu tiên, điều này coi giá trị đầu tiên là duy nhất và phần còn lại của các giá trị giống như trùng lặp.‘False’, This considers all of the same values as duplicates.
Nếu ’cuối cùng, điều này coi giá trị cuối cùng là duy nhất và phần còn lại của các giá trị giống như trùng lặp. Boolean Series denoting duplicate rows.
Nếu ’sai, điều này xem xét tất cả các giá trị giống nhau với các bản sao.
Python3
Trả về: Sê -ri Boolean biểu thị các hàng trùng lặp. & Nbsp; & nbsp;
Hãy để tạo ra một khung dữ liệu đơn giản với một từ điển danh sách, giả sử tên cột là: ‘Tên,’ tuổi, và ‘City. & NBSP; & NBSP;
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
pandas as pd
1pandas as pd
2employees
1,
employees
3,
employees
5pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
import
pandas as pd
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
employees
5pandas as pd
0
pandas as pd
1pandas as pd
2employees
1,
'Stuti'
5,
'Stuti'
7pandas as pd
0
pandas as pd
1pandas as pd
2,
1,
pandas as pd
5,
pandas as pd
7,
6
pandas as pd
1,
8
Các
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7____10
,
2
,
9=
28
1
28
228
3=
28
528
6,
28
8____________,
0,
1 Select duplicate rows based on all columns.
Here, We do not pass any argument, therefore, it takes default values for both the arguments i.e. subset = None and keep = ‘first’.
Python3
Trả về: Sê -ri Boolean biểu thị các hàng trùng lặp. & Nbsp; & nbsp;
Hãy để tạo ra một khung dữ liệu đơn giản với một từ điển danh sách, giả sử tên cột là: ‘Tên,’ tuổi, và ‘City. & NBSP; & NBSP;
import
pandas as pd
pandas as pd
1pandas as pd
2employees
1,
employees
3,
employees
5pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
employees
5pandas as pd
0
pandas as pd
1pandas as pd
2employees
1,
'Stuti'
5,
'Stuti'
7pandas as pd
0
pandas as pd
1pandas as pd
2,
1,
pandas as pd
5,
pandas as pd
7,
6
pandas as pd
1,
8
Các
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7____10
,
9=
28
1
pandas as pd
68pandas as pd
69
pandas as pd
70
,
9=
28
1
28
228
3=
28
528
6,
28
8____________,
0,
1 Select duplicate rows based on all columns.
If you want to consider all duplicates except the last one then pass keep = ‘last’ as an argument.
Python3
Trả về: Sê -ri Boolean biểu thị các hàng trùng lặp. & Nbsp; & nbsp;
Hãy để tạo ra một khung dữ liệu đơn giản với một từ điển danh sách, giả sử tên cột là: ‘Tên,’ tuổi, và ‘City. & NBSP; & NBSP;
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
pandas as pd
1pandas as pd
2employees
1,
employees
3,
employees
5pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
import
pandas as pd
pandas as pd
1pandas as pd
2employees
1,
'Stuti'
5,
'Stuti'
7pandas as pd
0
pandas as pd
1pandas as pd
2,
1,
pandas as pd
5,
pandas as pd
7,
6
pandas as pd
1,
8
Các
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7____10
,
9=
28
1
pandas as pd
68pandas as pd
69
pandas as pd
70
,
9=
28
1
28
228
3=
28
528
6,
28
8____________,
0,
1 If you want to select duplicate rows based only on some selected columns then pass the list of column names in subset as an argument.
Python3
Trả về: Sê -ri Boolean biểu thị các hàng trùng lặp. & Nbsp; & nbsp;
Hãy để tạo ra một khung dữ liệu đơn giản với một từ điển danh sách, giả sử tên cột là: ‘Tên,’ tuổi, và ‘City. & NBSP; & NBSP;
import
pandas as pd
pandas as pd
1pandas as pd
2employees
1,
employees
3,
employees
5pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
employees
5pandas as pd
0
pandas as pd
1pandas as pd
2employees
1,
'Stuti'
5,
'Stuti'
7pandas as pd
0
pandas as pd
1pandas as pd
2,
1,
pandas as pd
5,
pandas as pd
7,
6
pandas as pd
1,
8
,
9=
28
1
28
228
3=
28
528
6,
28
8____________,
0,
1
pandas as pd
65=
=
46,
0employees
58
pandas as pd
68=
50
pandas as pd
70
Đầu ra: & nbsp; & nbsp;
Ví dụ 4: Chọn các hàng trùng lặp dựa trên nhiều tên cột. & NBSP; Select duplicate rows based on more than one column name.
Python3
import
pandas as pd
Các
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
pandas as pd
1pandas as pd
2employees
1,
employees
3,
employees
5pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
pandas as pd
7pandas as pd
0
pandas as pd
1pandas as pd
2pandas as pd
3,
pandas as pd
5,
employees
5pandas as pd
0
pandas as pd
1pandas as pd
2employees
1,
'Stuti'
5,
'Stuti'
7pandas as pd
0
‘
pandas as pd
1,
8
,
9=
28
1
[[
2428
3=
28
528
6____________28
8____________,
0,
1
pandas as pd
65=
[[
3628
6,
28
8[[
40
pandas as pd
68[[
42[[
43 [[
44
pandas as pd
70
Đầu ra: & nbsp; & nbsp;