Hướng dẫn python create pdf report - python tạo báo cáo pdf

Tạo báo cáo PDF với hình ảnh đẹp trong 10 phút hoặc ít hơn

Ảnh của Jesse G-C trên unplash

Báo cáo ở khắp mọi nơi, vì vậy bất kỳ chuyên gia công nghệ nào cũng phải biết cách tạo ra chúng. Nó là một nhiệm vụ tẻ nhạt và tốn thời gian, khiến nó trở thành một ứng cử viên hoàn hảo cho tự động hóa với Python.

Bạn có thể hưởng lợi từ một thế hệ báo cáo tự động cho dù bạn là nhà khoa học dữ liệu hay nhà phát triển phần mềm. Ví dụ, các nhà khoa học dữ liệu có thể sử dụng các báo cáo để hiển thị hiệu suất hoặc giải thích các mô hình học máy.

Bài viết này sẽ dạy cho bạn cách thực hiện các báo cáo dựa trên đánh giá dữ liệu và lưu chúng dưới dạng PDFS. Để chính xác hơn, bạn sẽ học cách kết hợp nhiều trực quan hóa dữ liệu (dữ liệu bán hàng giả) vào một tệp PDF duy nhất.

Và điều tốt nhất là - nó dễ dàng hơn bạn nghĩ!

Bài viết được cấu trúc như sau:

  • Tạo dữ liệu
  • Trực quan hóa dữ liệu
  • Tạo cấu trúc trang PDF
  • Tạo báo cáo PDF
  • Sự kết luận

Bạn có thể tải xuống sổ ghi chép với mã nguồn ở đây.

Tạo dữ liệu

Trực quan hóa dữ liệu

Tạo cấu trúc trang PDF

Tạo báo cáo PDF

Sự kết luận

Bạn có thể tải xuống sổ ghi chép với mã nguồn ở đây.

Bạn có thể có báo cáo mà không cần dữ liệu. Đó là lý do tại sao bạn sẽ phải tạo ra một số trước - nhiều hơn về điều đó một chút.

Hãy để bắt đầu với hàng nhập khẩu. Bạn sẽ cần một loạt các thứ - nhưng thư viện FPDF có khả năng là chưa biết duy nhất. Nói một cách đơn giản, nó được sử dụng để tạo PDF và bạn sẽ làm việc với nó một chút sau đó. Tham khảo đoạn trích sau đây để nhập khẩu:

Trực quan hóa dữ liệu

Tạo cấu trúc trang PDF

Tạo báo cáo PDF

Sự kết luận

Bạn có thể tải xuống sổ ghi chép với mã nguồn ở đây.

Bạn có thể có báo cáo mà không cần dữ liệu. Đó là lý do tại sao bạn sẽ phải tạo ra một số trước - nhiều hơn về điều đó một chút.

Hãy để bắt đầu với hàng nhập khẩu. Bạn sẽ cần một loạt các thứ - nhưng thư viện FPDF có khả năng là chưa biết duy nhất. Nói một cách đơn giản, nó được sử dụng để tạo PDF và bạn sẽ làm việc với nó một chút sau đó. Tham khảo đoạn trích sau đây để nhập khẩu:

Tạo cấu trúc trang PDF

Tạo báo cáo PDF

  • Sự kết luận
  • Bạn có thể tải xuống sổ ghi chép với mã nguồn ở đây.
  • Bạn có thể có báo cáo mà không cần dữ liệu. Đó là lý do tại sao bạn sẽ phải tạo ra một số trước - nhiều hơn về điều đó một chút.

Hãy để bắt đầu với hàng nhập khẩu. Bạn sẽ cần một loạt các thứ - nhưng thư viện FPDF có khả năng là chưa biết duy nhất. Nói một cách đơn giản, nó được sử dụng để tạo PDF và bạn sẽ làm việc với nó một chút sau đó. Tham khảo đoạn trích sau đây để nhập khẩu:

Hãy để tạo ra một số dữ liệu giả tiếp theo. Ý tưởng là tuyên bố một hàm trả về khung dữ liệu của dữ liệu bán hàng giả trong một tháng nhất định. Nó thực hiện điều đó bằng cách xây dựng một phạm vi ngày trong cả tháng và sau đó gán số tiền bán hàng dưới dạng một số nguyên ngẫu nhiên trong một phạm vi nhất định.

Bạn có thể sử dụng thư viện calendar để có được ngày cuối cùng cho bất kỳ kết hợp năm/tháng nào. Tại đây, toàn bộ đoạn mã mã:

Một cuộc gọi đến generate_sales_data(month=3) đã tạo ra 31 điểm dữ liệu cho tháng 3 năm 2020. Tại đây, cách vài hàng đầu tiên trông như thế nào:

Hình 1 - Mẫu dữ liệu được tạo (hình ảnh của tác giả)

Và đó là nó - bây giờ bạn có một chức năng tạo ra dữ liệu bán hàng giả. Hãy cùng xem cách hình dung nó tiếp theo.

Nhiệm vụ tiếp theo của bạn là tạo một chức năng trực quan hóa bộ dữ liệu được tạo trước đó dưới dạng biểu đồ dòng. Nó là loại hình ảnh phù hợp nhất, khi bạn xử lý dữ liệu chuỗi thời gian.

Ở đây, chức năng trực quan hóa dữ liệu và một cuộc gọi ví dụ:

Tạo báo cáo PDF

Sự kết luận

Bạn có thể tải xuống sổ ghi chép với mã nguồn ở đây.

  • Bạn có thể có báo cáo mà không cần dữ liệu. Đó là lý do tại sao bạn sẽ phải tạo ra một số trước - nhiều hơn về điều đó một chút.
  • calendar1 - Được sử dụng để xác định chân trang tài liệu. Nó sẽ chỉ hiển thị số trang
  • calendar2 - Được sử dụng để xác định trang trông như thế nào. Điều này sẽ phụ thuộc vào số lượng trực quan hóa được hiển thị trên mỗi trang, vì vậy các vị trí là lề được đặt tương ứng (hãy thoải mái chơi xung quanh với các giá trị)
  • calendar3 - Được sử dụng để thêm một trang trống và điền vào nó với nội dung

Tại đây, toàn bộ đoạn mã mã cho lớp:

Bây giờ, thời gian để khởi tạo nó và nối các trang từ ma trận nội dung 2 chiều:

Ô trên sẽ mất một thời gian để thực thi và sẽ trả về một chuỗi trống khi hoàn thành. Điều đó được mong đợi, vì báo cáo của bạn được lưu vào thư mục nơi lưu trữ máy tính xách tay.

Đây là cách làm thế nào để trang đầu tiên của báo cáo trông giống như:

Hình ảnh 5 - Trang đầu tiên của báo cáo PDF (hình ảnh của tác giả)

Tất nhiên, của bạn sẽ trông khác nhau do logo khác nhau và do dữ liệu bán hàng là hoàn toàn ngẫu nhiên.

Và đó là cách mà bạn tạo các báo cáo PDF được hỗ trợ dữ liệu với Python. Hãy để bọc mọi thứ tiếp theo.

Sự kết luận

Bạn đã học được nhiều điều ngày hôm nay - cách tạo dữ liệu giả cho bất kỳ dịp nào, cách trực quan hóa nó và cách nhúng trực quan hóa vào một báo cáo PDF duy nhất. Việc nhúng trực quan hóa của bạn sẽ yêu cầu thay đổi mã tối thiểu - chủ yếu là để định vị và lề.

Hãy cho tôi biết nếu bạn muốn xem hướng dẫn tạo báo cáo tự động dựa trên các diễn giải mô hình học máy (SHAP hoặc vôi) hoặc một cái gì đó khác liên quan đến khoa học dữ liệu.

Cảm ơn vì đã đọc.

Yêu thích bài báo? Trở thành một thành viên trung bình để tiếp tục học tập mà không giới hạn. Tôi sẽ nhận được một phần phí thành viên của bạn nếu bạn sử dụng liên kết sau, không có thêm chi phí cho bạn.

Tham gia danh sách email riêng của tôi để biết thêm thông tin chi tiết hữu ích.

Tìm hiểu thêm

  • Top 5 cuốn sách để học khoa học dữ liệu vào năm 2021
  • SHAP: Cách diễn giải các mô hình học máy với Python
  • 3 Số liệu học tập máy phân loại hàng đầu - Độ chính xác của mương một lần và cho tất cả
  • ROC và AUC - Cách đánh giá các mô hình học máy
  • Đường cong chính xác thu hồi: Cách dễ dàng đánh giá các mô hình học máy