Python để phân tích dữ liệu hoặc reilly

Python cho Phân tích dữ liệu liên quan đến các vấn đề cơ bản của thao tác, xử lý, làm sạch và xử lý dữ liệu trong Python. Đây cũng là phần giới thiệu hiện đại, thiết thực về điện toán khoa học bằng Python, được điều chỉnh cho các ứng dụng sử dụng nhiều dữ liệu. Đây là cuốn sách về các phần của ngôn ngữ Python và các thư viện mà bạn sẽ cần để giải quyết hiệu quả một loạt các vấn đề về phân tích dữ liệu. Cuốn sách này không phải là một bài trình bày về các phương pháp phân tích sử dụng Python làm ngôn ngữ triển khai

Được viết bởi Wes McKinney, tác giả chính của thư viện gấu trúc, cuốn sách thực hành này chứa đầy các nghiên cứu tình huống thực tế. Đó là lý tưởng cho các nhà phân tích mới sử dụng Python và cho các lập trình viên Python mới sử dụng máy tính khoa học

  • Sử dụng lớp vỏ tương tác IPython làm môi trường phát triển chính của bạn
  • Tìm hiểu các tính năng NumPy [Numerical Python] cơ bản và nâng cao
  • Bắt đầu với các công cụ phân tích dữ liệu trong thư viện gấu trúc
  • Sử dụng các công cụ hiệu suất cao để tải, dọn dẹp, biến đổi, hợp nhất và định hình lại dữ liệu
  • Tạo các biểu đồ phân tán và trực quan hóa tĩnh hoặc tương tác với matplotlib
  • Áp dụng tiện ích pandas groupby để cắt, xúc xắc và tóm tắt bộ dữ liệu
  • Đo lường dữ liệu theo thời điểm, cho dù đó là trường hợp cụ thể, khoảng thời gian cố định hay khoảng thời gian
  • Tìm hiểu cách giải quyết các vấn đề trong phân tích trang web, khoa học xã hội, tài chính và kinh tế thông qua các ví dụ chi tiết

Nhận hướng dẫn đầy đủ để thao tác, xử lý, dọn dẹp và xử lý bộ dữ liệu bằng Python. Đã cập nhật cho Python 3. 6, ấn bản thứ hai của hướng dẫn thực hành này bao gồm các nghiên cứu tình huống thực tế chỉ cho bạn cách giải quyết một loạt các vấn đề phân tích dữ liệu một cách hiệu quả. Bạn sẽ tìm hiểu các phiên bản mới nhất của pandas, NumPy, IPython và Jupyter trong quá trình này

Được viết bởi Wes McKinney, người tạo ra dự án gấu trúc Python, cuốn sách này là phần giới thiệu hiện đại, thiết thực về các công cụ khoa học dữ liệu trong Python. Đó là lý tưởng cho các nhà phân tích mới sử dụng Python và cho các lập trình viên Python mới làm quen với khoa học dữ liệu và tính toán khoa học. Các tệp dữ liệu và tài liệu liên quan có sẵn trên GitHub

tính năng sách

  • Sử dụng vỏ IPython và sổ ghi chép Jupyter để tính toán khám phá
  • Tìm hiểu các tính năng cơ bản và nâng cao trong NumPy [Numerical Python]
  • Bắt đầu với các công cụ phân tích dữ liệu trong thư viện gấu trúc
  • Sử dụng các công cụ linh hoạt để tải, dọn dẹp, chuyển đổi, hợp nhất và định hình lại dữ liệu
  • Tạo trực quan hóa thông tin với matplotlib
  • Áp dụng tiện ích pandas groupby để cắt, xúc xắc và tóm tắt bộ dữ liệu
  • Phân tích và thao tác dữ liệu chuỗi thời gian thông thường và không thường xuyên
  • Tìm hiểu cách giải quyết các vấn đề phân tích dữ liệu trong thế giới thực với các ví dụ cụ thể, chi tiết

Giới thiệu về tác giả

Wes McKinney là một nhà phát triển phần mềm và doanh nhân có trụ sở tại New York. Sau khi hoàn thành bằng đại học toán học tại MIT năm 2007, anh tiếp tục làm công việc tài chính định lượng tại AQR Capital Management ở Greenwich, CT. Chán nản với các công cụ phân tích dữ liệu cồng kềnh, anh ấy đã học Python và bắt đầu xây dựng thứ mà sau này trở thành dự án gấu trúc. Anh ấy hiện là thành viên tích cực của cộng đồng dữ liệu Python và là người ủng hộ việc sử dụng Python trong các ứng dụng phân tích dữ liệu, tài chính và tính toán thống kê

Wes sau đó là người đồng sáng lập và Giám đốc điều hành của DataPad, công ty có tài sản công nghệ và đội ngũ đã được Cloudera mua lại vào năm 2014. Kể từ đó, anh ấy đã tham gia vào công nghệ dữ liệu lớn, tham gia Ủy ban quản lý dự án cho các dự án Apache Arrow và Apache Parquet trong Quỹ phần mềm Apache. Năm 2016, anh gia nhập Two Sigma Investments tại Thành phố New York, nơi anh tiếp tục làm việc để giúp phân tích dữ liệu nhanh hơn và dễ dàng hơn thông qua phần mềm mã nguồn mở

Python cho Phân tích dữ liệu liên quan đến các vấn đề cơ bản của thao tác, xử lý, làm sạch và xử lý dữ liệu trong Python. Đây cũng là phần giới thiệu hiện đại, thiết thực về điện toán khoa học bằng Python, được điều chỉnh cho các ứng dụng sử dụng nhiều dữ liệu. Đây là cuốn sách về các phần của ngôn ngữ Python và các thư viện mà bạn sẽ cần để giải quyết hiệu quả một loạt các vấn đề về phân tích dữ liệu. Cuốn sách này không phải là một bài trình bày về các phương pháp phân tích sử dụng Python làm ngôn ngữ triển khai

Được viết bởi Wes McKinney, tác giả chính của thư viện gấu trúc, cuốn sách thực hành này chứa đầy các nghiên cứu tình huống thực tế. Đó là lý tưởng cho các nhà phân tích mới sử dụng Python và cho các lập trình viên Python mới sử dụng máy tính khoa học

  • Sử dụng lớp vỏ tương tác IPython làm môi trường phát triển chính của bạn
  • Tìm hiểu các tính năng NumPy [Numerical Python] cơ bản và nâng cao
  • Bắt đầu với các công cụ phân tích dữ liệu trong thư viện gấu trúc
  • Sử dụng các công cụ hiệu suất cao để tải, dọn dẹp, biến đổi, hợp nhất và định hình lại dữ liệu
  • Tạo các biểu đồ phân tán và trực quan hóa tĩnh hoặc tương tác với matplotlib
  • Áp dụng tiện ích pandas groupby để cắt, xúc xắc và tóm tắt bộ dữ liệu
  • Đo lường dữ liệu theo thời điểm, cho dù đó là trường hợp cụ thể, khoảng thời gian cố định hay khoảng thời gian
  • Tìm hiểu cách giải quyết các vấn đề trong phân tích trang web, khoa học xã hội, tài chính và kinh tế thông qua các ví dụ chi tiết

Python nào là tốt nhất để phân tích dữ liệu?

Pandas [Phân tích dữ liệu Python] là điều bắt buộc trong vòng đời của khoa học dữ liệu. Đây là thư viện Python phổ biến và được sử dụng rộng rãi nhất cho khoa học dữ liệu, cùng với NumPy trong matplotlib.

Python có phù hợp để phân tích dữ liệu không?

Python và R đều là ngôn ngữ nguồn mở, miễn phí có thể chạy trên Windows, macOS và Linux. Cả hai đều có thể xử lý mọi tác vụ phân tích dữ liệu và cả hai đều được coi là ngôn ngữ tương đối dễ học, đặc biệt là cho người mới bắt đầu.

Bao nhiêu Python là đủ cho nhà phân tích dữ liệu?

Nó cũng phụ thuộc vào thời gian bạn có thể dành để học Python cho khoa học dữ liệu. Nhưng có thể nói hầu hết người học đều mất ít nhất 3 tháng để hoàn thành lộ trình học Python for data science

Làm thế nào để học Python để phân tích dữ liệu?

Cách học Python cho Khoa học dữ liệu .
Bước 1. Tìm hiểu các nguyên tắc cơ bản của Python. Tất cả mọi người bắt đầu từ một vài nơi. .
Bước 2. Thực hành với học tập thực hành. .
Bước 3. Tìm hiểu thư viện khoa học dữ liệu Python. .
Bước 4. Xây dựng danh mục khoa học dữ liệu khi bạn học Python. .
Bước 5. Áp dụng các kỹ thuật khoa học dữ liệu tiên tiến

Chủ Đề