Làm cách nào để tìm các dòng trùng lặp trong python?
Trong bài viết này, chúng tôi đã lấy một bộ dữ liệu về dân số của các tiểu bang khác nhau ở Hoa Kỳ, có sẵn trong một. định dạng tệp csv. Chúng tôi sẽ đọc. csv để hiển thị nội dung gốc của tệp này, như sau Show
nhập gấu trúc as pd Trong ảnh chụp màn hình sau, bạn có thể thấy nội dung trùng lặp của tệp này Xác định các bản sao trong Pandas PythonCần xác định xem dữ liệu bạn đang sử dụng có trùng lặp hàng hay không. Để kiểm tra sự trùng lặp dữ liệu, bạn có thể sử dụng bất kỳ phương pháp nào được trình bày trong các phần sau Phương pháp 1Đọc tệp csv và chuyển nó vào khung dữ liệu. Sau đó, xác định các hàng trùng lặp bằng cách sử dụng hàm Dupliced(). Cuối cùng, sử dụng câu lệnh in để hiển thị các hàng trùng lặp nhập gấu trúc as pd Có thể bạn quan tâmPhương pháp 2Sử dụng phương pháp này, cột is_duplicated sẽ được thêm vào cuối bảng và được đánh dấu là 'True' trong trường hợp các hàng trùng lặp nhập gấu trúc as pd Loại bỏ các bản sao trong Pandas PythonCó thể xóa các hàng trùng lặp khỏi khung dữ liệu của bạn bằng cú pháp sau. Loại bỏ các bản sao Chỉ giữ lại lần xuất hiện đầu tiênKhi bạn sử dụng “keep=first”, chỉ sự xuất hiện của hàng đầu tiên sẽ được giữ lại và tất cả các mục trùng lặp khác sẽ bị xóa Thí dụTrong ví dụ này, chỉ hàng đầu tiên được giữ lại và các hàng trùng lặp còn lại sẽ bị xóa nhập gấu trúc as pd Trong ảnh chụp màn hình sau, sự xuất hiện của hàng đầu tiên được giữ lại được đánh dấu bằng màu đỏ và các phần trùng lặp còn lại sẽ bị xóa Loại bỏ các bản sao Chỉ giữ lại lần xuất hiện cuối cùngKhi bạn sử dụng “keep=last”, tất cả các hàng trùng lặp trừ hàng xuất hiện cuối cùng sẽ bị xóa Thí dụTrong ví dụ sau, tất cả các hàng trùng lặp đều bị xóa ngoại trừ chỉ lần xuất hiện cuối cùng nhập gấu trúc as pd Trong hình ảnh sau đây, các bản sao được loại bỏ và chỉ sự xuất hiện của hàng cuối cùng được giữ lại Xóa tất cả các hàng trùng lặpĐể xóa tất cả các hàng trùng lặp khỏi bảng, hãy đặt “keep=False” như sau nhập gấu trúc as pd Như bạn có thể thấy trong hình ảnh sau, tất cả các bản sao được xóa khỏi khung dữ liệu Xóa các bản sao có liên quan khỏi một cột được chỉ địnhTheo mặc định, hàm kiểm tra tất cả các hàng trùng lặp từ tất cả các cột trong khung dữ liệu đã cho. Tuy nhiên, bạn cũng có thể chỉ định tên cột bằng cách sử dụng tham số tập hợp con Thí dụTrong ví dụ sau, tất cả các mục trùng lặp có liên quan sẽ bị xóa khỏi cột 'Các trạng thái' nhập gấu trúc as pd Sự kết luậnBài viết này đã chỉ cho bạn cách xóa các hàng trùng lặp khỏi khung dữ liệu bằng cách sử dụng hàm drop_duplicates() trong Pandas Python. Bạn cũng có thể xóa dữ liệu trùng lặp hoặc dư thừa bằng chức năng này. Bài viết cũng chỉ cho bạn cách xác định bất kỳ bản sao nào trong khung dữ liệu của bạn |
Bài Viết Liên Quan
Escape character not working in python
You are not printing the string, you are printing the string literal; it is the strings representation:>>> HellonWorld HellonWorld >>> print HellonWorld Hello World >>> print ...
How do i remove a tab from a string in python?
I am trying to remove all spaces/tabs/newlines in python 2.7 on Linux.I wrote this, that should do the job: myString=I want to Remove all white t spaces, new lines n and tabs t myString = ...
Thay đổi thi thpt quốc gia 2023
Bộ trưởng Bộ Giáo dục và Đào tạo Nguyễn Kim Sơn phát biểu chỉ đạo tại hội nghị. (Ảnh: Bộ GD-ĐT)Kỳ thi tốt nghiệp trung học phổ thông năm 2023 và năm ...
How do i select a single record in mysql?
Columns in SQL dont have a defined order. Database systems generally keep track of an order for display purposes, but it doesnt make sense to ask a database to select a column by number. You need ...
Hướng dẫn dùng arraylist python python
Nội dung chính Python Collections (Arrays) Kiểu dữ liệu List trong Python Truy cập các phần tử của List trong PythonChỉ mục âm Phạm vi chỉ mụcPhạm vi của các chỉ ...
Hướng dẫn javascript cidr-calculator
1.0.11 • Public • Published 5 months ago Readme Explore BETA1 Dependency6 Dependents11 Versions subnet-cidr-adviser=================JavaScript class for calculating all possible subnets, ...
How to remove vowels from a string python
I know there are many correct solutions on this subject but I thought to add few fun ways of solving this problem. If you come from a C++/C# or Java, you will tend to use something like compare then ...
Hướng dẫn hàm include trong php
Trang chủHướng dẫn họcHọc PHPPHP include và requireĐịnh nghĩa và cách dùng include và requireinclude hoặc require tiện lợi cho việc sử dụng những phần dùng chung, ...
Hướng dẫn html unescape python
I have looked all around and only found solutions for python 2.6 and earlier, NOTHING on how to do this in python 3.X. (I only have access to Win7 box.)I HAVE to be able to do this in 3.1 and ...
Hướng dẫn dùng files upload trong PHP
Tổng quan về kỹ thuật Upload file PHPTạo form HTML fileCode Php xử lý uploadCode Php xử lý upload nhiều fileTổng quan về kỹ thuật Upload file trong PHPĐể HTML FORM có ...
Hướng dẫn dùng define global trong PHP
Nội dung chínhVideo Biến siêu toàn cục trong PHPHướng dẫn chi tiếtTừ khóa globalVí dụ 1: Sử dụng globalVí dụ 2: Sử dụng $GLOBALS thay cho globalVí dụ 3: Demo ...
Python decode utf-8 ignore errors
Here is the code:>>> z = uu2022.decode(utf-8, ignore) Traceback (most recent call last): File , line 1, in File /usr/lib/python2.6/encodings/utf_8.py, line 16, in decode return ...
Đánh giá glc 300 coupe 2023
Trang chủ Ô tô Thứ Sáu, ngày 03/06/2022 08:00 AM (GMT+7) Là một bản cập nhật lớn về công nghệ và tính năng nhưng những thay đổi bên ngoài của Mercedes-Benz ...
How do i enable php extensions on mac?
Im trying to install Magento (2.3.0) on macOS Mojave. Magento shows PHP Extension intl. is missing.I tried the below to resolve:Made a copy of php.ini using cp /etc/php.ini.default php.iniRemoved ...
Hướng dẫn php multiplication table
Hướng dẫn php link to htmlHàm chuyển hướng url trong php giúp chương trình chúng ta chủ động chuyển đến một địa chỉ url được chỉ định một cách dễ ...
Hướng dẫn dùng np.flip python
numpy.flip(m, axis=None)[source]#Reverse the order of elements in an array along the given axis.The shape of the array is preserved, but the elements are reordered.New in version ...
Hướng dẫn dùng removeattribute javascript trong PHP
Hướng dẫn cách sử dụng removeAttribute trong JavaScript. Bạn sẽ biết cách sử dụng phương thức removeAttribute để xoá thuộc tính chỉ định của một Element sau ...
Hướng dẫn python compare two functions
Conservative Python 3 Porting GuidePython 3 is strict when comparing objects of disparate types. It also drops cmp-based comparison and sorting in favor of rich comparisons and key-based sorting, ...
Add comma in foreach loop php
Im using a foreach loop to echo out some values from my database, I need to strip the last comma from the last loop if that makes sense.My loop is just simple, as belowforeach($results as $result){ ...
Hướng dẫn php iterable interface
IteratorIterator về bản chất là một interface chuẩn được xây dựng sẵn trong PHP để bạn giễ dàng thao tác với các bộ giá trị. Cấu trúc của interface iterator ...