Hướng dẫn dùng max panda python
Trụ sở chính: Show Văn phòng: Số 27-3RD, Sunrise D, The Manor Central Park, đường Nguyễn Xiển, phường Đại Kim, quận Hoàng Mai, TP. Hà Nội. Liên hệ truyền thông: 0929.536.185 Email: [email protected] Chịu trách nhiệm nội dung: Ông Trần Anh Tú TEK4.VN giữ bản quyền nội dung trên website này. Cấm sao chép dưới mọi hình thức nếu không có sự chấp thuận bằng văn bản. Trụ sở chính: Nội dung chính
Văn phòng: Số 27-3RD, Sunrise D, The Manor Central Park, đường Nguyễn Xiển, phường Đại Kim, quận Hoàng Mai, TP. Hà Nội. Liên hệ truyền thông: 0929.536.185 Email: [email protected] Chịu trách nhiệm nội dung: Ông Trần Anh Tú TEK4.VN giữ bản quyền nội dung trên website này. Cấm sao chép dưới mọi hình thức nếu không có sự chấp thuận bằng văn bản. Thứ sáu, 10/02/2017 | 00:00 GMT+7 Gói Được xây dựng trên gói Gói Trong hướng dẫn này, trước tiên ta sẽ cài đặt Cài đặt pandas Giống như với các gói Python khác, ta có thể cài đặt Đầu tiên, hãy chuyển sang môi trường lập trình local của ta hoặc môi trường lập trình dựa
trên server mà ta lựa chọn và cài đặt
Bạn sẽ nhận được kết quả tương tự như sau:
Nếu bạn muốn cài đặt
Đến đây, bạn đã cài đặt xong để bắt đầu làm việc với gói Loạt Ở Hãy bắt đầu trình thông dịch Python trong dòng lệnh của bạn như sau:
Từ bên trong trình thông dịch, nhập cả gói
Trước khi ta làm việc với Series, ta hãy xem nó trông như thế nào:
Bạn có thể nhận thấy rằng dữ liệu có cấu trúc giống như một danh sách Python. Không cần khai báo index Ta sẽ nhập dữ liệu số nguyên và sau đó cung cấp tham số tên cho Sê-ri, nhưng ta sẽ
tránh sử dụng tham số
Bây giờ, ta hãy gọi Series để ta có thể xem những gì
Ta sẽ thấy kết quả sau, với index ở cột bên trái, giá trị dữ liệu của ta ở cột bên phải. Bên dưới các cột là thông tin về Tên của Dòng và kiểu dữ liệu tạo nên các giá trị.
Mặc dù ta không cung cấp index cho mảng, nhưng đã có một index được thêm ngầm về các giá trị nguyên từ Khai báo indexNhư cú pháp ở trên cho ta thấy, ta cũng có thể tạo Series với một index rõ ràng. Ta sẽ sử dụng dữ liệu về độ sâu trung bình tính bằng mét của các đại dương trên Trái đất:
Với Series được xây dựng, hãy gọi nó để xem kết quả :
Ta có thể thấy rằng index mà ta cung cấp nằm ở bên trái với các giá trị ở bên phải. Lập index và Slicing Series Với Dòng
Ta cũng có thể phân chia theo số index để truy xuất các giá trị:
Ngoài ra, ta có thể gọi giá trị của index để trả về giá trị mà nó tương ứng với:
Ta cũng có thể cắt các giá trị của index để trả về các giá trị tương ứng:
Lưu ý trong ví dụ cuối cùng này khi cắt với tên index , hai tham số là bao gồm chứ không phải loại trừ. Hãy thoát khỏi trình thông dịch
Python với Chuỗi khởi tạo bằng từ điển Với Hãy tạo một file có tên là Ocean.py
Bây giờ ta có thể chạy file trên dòng lệnh:
Ta sẽ nhận được kết quả sau:
Chuỗi được hiển thị một cách có tổ chức, với index (được tạo thành từ các khóa của ta ) ở bên trái và tập hợp các giá trị ở bên phải. Điều này sẽ hoạt động giống như các từ điển Python khác ở chỗ bạn có thể truy cập các giá trị bằng cách gọi khóa, ta có thể làm như vậy: Ocean_depth.py
Tuy nhiên, các Series này hiện là các đối tượng Python nên bạn sẽ không thể sử dụng các hàm từ điển. Từ điển Python cung cấp một biểu mẫu khác để
cài đặt Chuỗi trong DataFramesDataFrames là cấu trúc dữ liệu được gắn nhãn 2 chiều có các cột có thể được tạo thành từ các kiểu dữ liệu khác nhau. DataFrames tương tự như bảng tính hoặc bảng SQL. Nói chung, khi bạn làm việc với Để hiểu cách hoạt động của DataFrame Ocean.py
Với hai Chuỗi đó được cài đặt , hãy thêm DataFrame vào cuối file , bên dưới Điều này được xây dựng theo cách mà ta có thể bao gồm các nhãn cột, mà ta khai báo là khóa cho các biến của Chuỗi. Để xem DataFrame trông như thế nào, hãy thực hiện lệnh gọi để in nó. Ocean.py
Kết quả hiển thị hai tiêu đề cột của ta cùng với dữ liệu số dưới mỗi tiêu đề và nhãn từ các phím từ điển nằm ở bên trái. Sắp xếp dữ liệu trong DataFrames Ta có thể sắp xếp dữ liệu trong DataFrame bằng cách sử dụng hàm Ví dụ: hãy sử dụng tham số Boolean
Ocean_depth.py
Bây giờ, kết quả hiển thị các số tăng dần từ giá trị thấp đến giá trị cao trong cột số nguyên ngoài cùng bên trái. Phân tích thống kê với DataFrames Tiếp theo, hãy xem một số thống kê tóm tắt mà ta có thể thu thập từ Không
chuyển các tham số cụ thể, hàm
Hãy để Python in ra dữ liệu thống kê này cho ta bằng cách gọi Ocean.py
Khi ta chạy chương trình này, ta sẽ nhận được kết quả sau:
Như vậy, bạn có thể so sánh kết quả kết quả tại đây với DataFrame ban đầu và hiểu rõ hơn về độ sâu trung bình và độ sâu tối đa của các đại dương trên Trái đất khi được coi là một group . Xử lý các giá trị bị thiếu
Thường thì khi làm việc với dữ liệu, bạn sẽ bị thiếu các giá trị. Gói Ta sẽ xem xét việc loại bỏ các giá trị bị thiếu với hàm Hãy tạo
một file mới có tên user_data.py
Lệnh in của ta cho ta thấy kết quả sau khi ta chạy chương trình:
Có khá nhiều giá trị bị thiếu ở đây. Trước tiên, hãy loại bỏ các giá trị bị thiếu với user_data.py
Vì chỉ có một hàng không có giá trị nào bị thiếu trong tập dữ liệu nhỏ của ta , đó là hàng duy nhất vẫn còn nguyên vẹn khi ta chạy chương trình:
Để thay thế cho việc loại bỏ các giá trị, thay vào đó, ta có thể điền các giá trị bị thiếu bằng một giá trị do ta chọn, chẳng hạn như Xóa hoặc comment hai dòng cuối cùng mà ta đã thêm vào file của bạn và thêm các dòng sau: user_data.py
Khi ta chạy chương trình, ta sẽ nhận được kết quả sau:
Bây giờ tất cả các cột và hàng của ta đều nguyên vẹn và thay vì có Đến đây, bạn có thể sắp xếp dữ liệu, phân tích thống kê và xử lý các giá trị bị thiếu trong DataFrames. Kết luận Hướng dẫn này bao gồm thông tin giới thiệu về phân tích dữ liệu với Tags: Các tin liên quan Cách cài đặt gói pandas và làm việc với cấu trúc dữ liệu trong Python 3 |