Cách dễ nhất để cài đặt pandas là cài đặt nó như một phần của bản phân phối Anaconda, một bản phân phối đa nền tảng để phân tích dữ liệu và tính toán khoa học. Đây là phương pháp cài đặt được đề xuất cho hầu hết người dùng
Hướng dẫn cài đặt từ nguồn, PyPI, ActivePython, các bản phân phối Linux khác nhau hoặc phiên bản phát triển cũng được cung cấp
Hỗ trợ phiên bản Python
Chính thức Python 3. 8, 3. 9, 3. 10 và 3. 11
Cài đặt gấu trúc
Cài đặt với Anaconda
Cài đặt gấu trúc và phần còn lại của ngăn xếp NumPy và SciPy có thể hơi khó khăn đối với người dùng thiếu kinh nghiệm
Cách đơn giản nhất để cài đặt không chỉ pandas, mà cả Python và các gói phổ biến nhất tạo nên ngăn xếp SciPy [IPython, NumPy, Matplotlib,…] là với Anaconda, một bản phân phối Python đa nền tảng [Linux, macOS, Windows] cho dữ liệu
Sau khi chạy trình cài đặt, người dùng sẽ có quyền truy cập vào pandas và phần còn lại của ngăn xếp SciPy mà không cần cài đặt bất kỳ thứ gì khác và không cần đợi bất kỳ phần mềm nào được biên dịch
Hướng dẫn cài đặt cho Anaconda có thể được tìm thấy ở đây
Có thể tìm thấy danh sách đầy đủ các gói có sẵn như một phần của bản phân phối Anaconda tại đây
Một ưu điểm khác khi cài đặt Anaconda là bạn không cần quyền quản trị để cài đặt nó. Anaconda có thể cài đặt trong thư mục chính của người dùng, điều này khiến việc xóa Anaconda trở nên đơn giản nếu bạn quyết định [chỉ cần xóa thư mục đó]
Cài đặt với Miniconda
Phần trước đã phác thảo cách cài đặt gấu trúc như một phần của bản phân phối Anaconda. Tuy nhiên, cách tiếp cận này có nghĩa là bạn sẽ cài đặt hơn một trăm gói và liên quan đến việc tải xuống trình cài đặt có kích thước vài trăm MB
Nếu bạn muốn có nhiều quyền kiểm soát hơn đối với gói nào hoặc có băng thông internet hạn chế, thì cài đặt gấu trúc với Miniconda có thể là một giải pháp tốt hơn
Conda là trình quản lý gói mà bản phân phối Anaconda được xây dựng dựa trên. Nó là một trình quản lý gói đa nền tảng và ngôn ngữ bất khả tri [nó có thể đóng vai trò tương tự như sự kết hợp giữa pip và virtualenv]
Miniconda cho phép bạn tạo một bản cài đặt Python khép kín tối thiểu, sau đó sử dụng lệnh Conda để cài đặt các gói bổ sung
Trước tiên, bạn cần cài đặt Conda, sau đó tải xuống và chạy Miniconda sẽ làm việc này cho bạn. Bộ cài đặt có thể được tìm thấy ở đây
Bước tiếp theo là tạo một môi trường conda mới. Môi trường conda giống như một virtualenv cho phép bạn chỉ định một phiên bản cụ thể của Python và bộ thư viện. Chạy các lệnh sau từ cửa sổ đầu cuối
conda create -n name_of_my_env python
Điều này sẽ tạo ra một môi trường tối thiểu chỉ có Python được cài đặt trong đó. Để đặt bản thân của bạn vào trong môi trường này, hãy chạy
source activate name_of_my_env
Trên Windows, lệnh là
activate name_of_my_env
Bước cuối cùng cần thiết là cài đặt gấu trúc. Điều này có thể được thực hiện với lệnh sau
conda install pandas
Để cài đặt một phiên bản gấu trúc cụ thể
conda install pandas=0.20.3
Để cài đặt các gói khác, ví dụ IPython
conda install ipython
Để cài đặt bản phân phối Anaconda đầy đủ
conda install anaconda
Nếu bạn cần các gói có sẵn cho pip nhưng không phải conda, thì hãy cài đặt pip, sau đó sử dụng pip để cài đặt các gói đó
conda install pip pip install django
Cài đặt từ PyPI
gấu trúc có thể được cài đặt qua pip từ PyPI
Ghi chú
Bạn phải có
source activate name_of_my_env1 để cài đặt từ PyPI
pip install pandas
Cài đặt với ActivePython
Hướng dẫn cài đặt cho ActivePython có thể được tìm thấy ở đây. Phiên bản 2. 7, 3. 5 và 3. 6 bao gồm gấu trúc
Cài đặt bằng trình quản lý gói của bản phân phối Linux của bạn
Các lệnh trong bảng này sẽ cài đặt pandas cho Python 3 từ bản phân phối của bạn
Phân bổ
Trạng thái
Liên kết tải xuống / kho lưu trữ
Phương pháp cài đặt
Debian
ổn định
kho Debian chính thức
source activate name_of_my_env2
Debian & Ubuntu
không ổn định [gói mới nhất]
source activate name_of_my_env2
Ubuntu
ổn định
kho lưu trữ chính thức của Ubuntu
source activate name_of_my_env2
mởSuse
ổn định
Kho lưu trữ OpenSuse
source activate name_of_my_env5
Fedora
ổn định
kho Fedora chính thức
source activate name_of_my_env6
Centos/RHEL
ổn định
kho EPEL
source activate name_of_my_env7
Tuy nhiên, các gói trong trình quản lý gói linux thường chậm hơn một vài phiên bản, vì vậy, để có được phiên bản pandas mới nhất, bạn nên cài đặt bằng phương pháp
source activate name_of_my_env8 hoặc
source activate name_of_my_env9 được mô tả ở trên
Xử lý ImportErrors
Nếu bạn gặp lỗi ImportError, điều đó thường có nghĩa là Python không thể tìm thấy gấu trúc trong danh sách các thư viện có sẵn. Python bên trong có một danh sách các thư mục mà nó tìm kiếm thông qua, để tìm các gói. Bạn có thể lấy các thư mục này với
import sys sys.path
Một cách mà bạn có thể gặp phải lỗi này là nếu bạn có nhiều bản cài đặt Python trên hệ thống của mình và bạn không cài đặt pandas trong bản cài đặt Python mà bạn hiện đang sử dụng. Trong Linux/Mac, bạn có thể chạy
activate name_of_my_env0 trên thiết bị đầu cuối của mình và nó sẽ cho bạn biết bạn đang sử dụng bản cài đặt Python nào. Nếu nó giống như “/usr/bin/python”, thì bạn đang sử dụng Python từ hệ thống, điều này không được khuyến nghị
Rất khuyến khích sử dụng
source activate name_of_my_env9, để cài đặt nhanh và cập nhật gói và phần phụ thuộc. Bạn có thể tìm thấy hướng dẫn cài đặt đơn giản cho pandas trong tài liệu này.
activate name_of_my_env2
Cài đặt từ nguồn
Xem hướng dẫn đầy đủ về cách xây dựng từ cây nguồn git. Hơn nữa, hãy xem bạn có muốn tạo môi trường phát triển gấu trúc không
Chạy bộ thử nghiệm
pandas được trang bị một bộ đầy đủ các bài kiểm tra đơn vị, chiếm khoảng 97% cơ sở mã tại thời điểm viết bài này. Để chạy nó trên máy của bạn nhằm xác minh rằng mọi thứ đang hoạt động [và bạn đã cài đặt tất cả các phụ thuộc, mềm và cứng], hãy đảm bảo rằng bạn có pytest >= 6. 0 và giả thiết >= 6. 13. 0, sau đó chạy
source activate name_of_my_env0
Đây chỉ là một ví dụ về thông tin được hiển thị. Bạn có thể thấy một kết quả hơi khác như những gì được hiển thị ở trên
phụ thuộc
Bưu kiện
Phiên bản được hỗ trợ tối thiểu
NumPy
1. 20. 3
python-dateutil
2. 8. 1
pytz
2020. 1
Phụ thuộc được đề xuất
numexpr. để tăng tốc các hoạt động số nhất định.
activate name_of_my_env
3 sử dụng nhiều lõi cũng như phân đoạn và bộ nhớ đệm thông minh để đạt được tốc độ lớn. Nếu đã cài đặt, phải là Phiên bản 2. 7. 3 hoặc cao hơnthắt cổ chai. để tăng tốc một số loại đánh giá
activate name_of_my_env
4.activate name_of_my_env
5 sử dụng các thói quen cython chuyên dụng để đạt được tốc độ lớn. Nếu được cài đặt, phải là Phiên bản 1. 3. 2 hoặc cao hơn
Ghi chú
Bạn được khuyến khích cài đặt các thư viện này vì chúng giúp cải thiện tốc độ, đặc biệt khi làm việc với các tập dữ liệu lớn
phụ thuộc tùy chọn
gấu trúc có nhiều phụ thuộc tùy chọn chỉ được sử dụng cho các phương thức cụ thể. Ví dụ: yêu cầu gói
activate name_of_my_env7, trong khi yêu cầu gói
activate name_of_my_env9. Nếu phần phụ thuộc tùy chọn không được cài đặt, pandas sẽ tăng
conda install pandas0 khi phương thức yêu cầu phần phụ thuộc đó được gọi
Múi giờ
phụ thuộc
Phiên bản tối thiểu
ghi chú
dữ liệu
2022. 1[pypi]/ 2022a[dành cho tzdata hệ thống]
Cho phép sử dụng
conda install pandas1 múi giờ với pandas. Ghi chú. Bạn chỉ cần cài đặt gói pypi nếu hệ thống của bạn chưa cung cấp cơ sở dữ liệu IANA tz. Tuy nhiên, phiên bản tzdata tối thiểu vẫn được áp dụng, ngay cả khi nó không được thực thi thông qua lỗi
Nếu bạn muốn cập nhật phiên bản tzdata hệ thống của mình, bạn nên sử dụng gói
conda install pandas2 từ conda-forge
Hình dung
phụ thuộc
Phiên bản tối thiểu
ghi chú
matplotlib
3. 3. 2
thư viện sơ đồ
Jinja2
3. 0. 0
Định dạng có điều kiện với DataFrame. phong cách
lập bảng
0. 8. 9
In ở định dạng thân thiện với Markdown [xem bảng]
tính toán
phụ thuộc
Phiên bản tối thiểu
ghi chú
khoa học viễn tưởng
1. 7. 1
Các hàm thống kê khác
tê liệt
0. 53. 1
Công cụ thực thi thay thế cho các hoạt động lăn [xem]
dàn âm thanh
0. 19. 0
API giống gấu trúc cho dữ liệu N-chiều
tập tin excel
phụ thuộc
Phiên bản tối thiểu
ghi chú
xlrd
2. 0. 1
Đọc Excel
xlwt
1. 3. 0
Viết Excel
xlsxwriter
1. 4. 3
Viết Excel
openpyxl
3. 0. 7
Đọc/ghi cho các tệp xlsx
pyxlsb
1. 0. 8
Đọc cho các tập tin xlsb
HTML
phụ thuộc
Phiên bản tối thiểu
ghi chú
ĐẹpSoup4
4. 9. 3
Trình phân tích cú pháp HTML cho read_html
html5lib
1. 1
Trình phân tích cú pháp HTML cho read_html
lxml
4. 6. 3
Trình phân tích cú pháp HTML cho read_html
Cần có một trong các tổ hợp thư viện sau đây để sử dụng chức năng cấp cao nhất
BeautifulSoup4 và html5lib
BeautifulSoup4 và lxml
BeautifulSoup4 và html5lib và lxml
Chỉ lxml, mặc dù hãy xem lý do tại sao bạn có thể không nên thực hiện phương pháp này
Cảnh báo
nếu bạn cài đặt BeautifulSoup4, bạn phải cài đặt lxml hoặc html5lib hoặc cả hai. sẽ không hoạt động khi chỉ cài đặt BeautifulSoup4
Bạn rất được khuyến khích đọc. Nó giải thích các vấn đề xung quanh việc cài đặt và sử dụng ba thư viện trên
XML
phụ thuộc
Phiên bản tối thiểu
ghi chú
lxml
4. 5. 0
Trình phân tích cú pháp XML cho read_xml và trình tạo cây cho to_xml
cơ sở dữ liệu SQL
phụ thuộc
Phiên bản tối thiểu
ghi chú
thuật giả kim SQL
1. 4. 16
Hỗ trợ SQL cho các cơ sở dữ liệu khác ngoài sqlite
psycopg2
2. 8. 6
Công cụ PostgreSQL cho sqlalchemy
pymysql
1. 0. 2
Công cụ MySQL cho sqlalchemy
Các nguồn dữ liệu khác
phụ thuộc
Phiên bản tối thiểu
ghi chú
PyTables
3. 6. 1
Đọc / ghi dựa trên HDF5
khối
1. 21. 0
Nén cho HDF5
zlib
Nén cho HDF5
sàn gỗ nhanh
0. 4. 0
Sàn gỗ đọc / viết
cây kim tước
1. 0. 1
Đọc / viết sàn gỗ, ORC và lông vũ
pyreadstat
1. 1. 2
tập tin SPSS [. sav] đọc
Cảnh báo
Nếu bạn muốn sử dụng, bạn nên cài đặt pyarrow bằng cách sử dụng conda. Sau đây là tóm tắt về môi trường có thể làm việc
Anaconda sử dụng phiên bản Python nào?
Anaconda là một bản phân phối khoa học dữ liệu dựa trên nền tảng với bộ sưu tập hơn 1.000 gói nguồn mở với sự hỗ trợ cộng đồng miễn phí. Anaconda được phân phối trong hai trình cài đặt khác nhau. Môi trường mặc định của Anaconda2 là Python 2. 7. Môi trường mặc định của Anaconda3 là Python 3. 7Tôi có thể sử dụng Python 3 không. 10 với Anaconda?
hoặc sử dụng Anaconda để cài đặt Python 3. 10 hoặc truy cập Chào mừng bạn đến với Python. org và tải xuống 3. 10 từ đó. Nếu bạn đã cài đặt Anaconda, bạn sẽ có trình quản lý gói condaLà Python 3. 9 được hỗ trợ?
Trăn 3. 9 là phiên bản Python hiện được hỗ trợ .Tôi có thể cài đặt Python 3 không. 8 với Anaconda?
Có Python 3. 6, Trăn 3. 7 và Python 3. 8 gói siêu dữ liệu có sẵn với bản phát hành này , vì vậy bạn có thể làm việc với Anaconda trong các phiên bản Python khác tùy thích.