Học cách trích xuất PDF sang Excel dễ dàng với Docparser. Trích xuất các bảng từ tệp PDF và tải xuống dữ liệu của bạn hoặc gửi dữ liệu đó tới ứng dụng đám mây. Bắt đầu ngay hôm nay để tăng năng suất và cắt giảm chi phí nhập dữ liệu
Chuyển đổi định dạng PDF sang EXCEL theo chương trình với một công cụ hiện đại. NET API. Chỉ sử dụng một vài dòng mã để chuyển đổi PDF sang EXCEL. các aspose. Thư viện PDF sẽ cho phép bất kỳ nhà phát triển nào dễ dàng giải quyết các nhiệm vụ chuyển đổi PDF sang EXCEL bằng cách sử dụng. NET. Để biết mô tả chi tiết hơn về đoạn mã và các định dạng chuyển đổi có thể có khác, hãy xem các trang Tài liệu. Ngoài ra, bạn có thể kiểm tra chất lượng chuyển đổi tệp thành tệp trực tiếp trong trình duyệt của mình trực tuyến trong giây lát. Với Aspose. PDF cho. NET, bạn có thể chuyển đổi PDF sang EXCEL theo chương trình. Phần mềm PDF từ Aspose lý tưởng cho các cá nhân, doanh nghiệp nhỏ hoặc lớn. Vì nó có thể xử lý một lượng lớn thông tin, hãy thực hiện chuyển đổi nhanh chóng, hiệu quả và bảo vệ dữ liệu của bạn. Một tính năng đặc biệt từ Aspose. PDF là một API để chuyển đổi PDF sang EXCEL. Đặc điểm của phương pháp này là bạn chỉ cần mở trình quản lý gói NuGet, tìm kiếm 'Aspose. PDF cho. NET' và cài đặt nó mà không cần bất kỳ cài đặt phức tạp đặc biệt nào. Kiểm tra chi tiết Cài đặt Thư viện trên các trang Tài liệu. Để xác minh lợi ích của thư viện, hãy thử sử dụng đoạn mã chuyển đổi PDF sang EXCEL. Bạn cũng có thể sử dụng lệnh sau từ Bảng điều khiển quản lý gói
Lệnh bảng điều khiển quản lý gói
PM> Install-Package Aspose.PDF
API PDF sang Excel hiện đang được phát triển. Vui lòng liên hệ để truy cập sớm hoặc để tìm hiểu thêm. Công cụ hiểu tài liệu của PSPDFKit sẽ phân tích các tài liệu PDF đầu vào và xuất dữ liệu có cấu trúc dưới dạng tệp Excel. API sẽ có thể sử dụng được bằng PHP, Java, Python, Node, v.v.
Tạo bảng tính Excel từ tệp PDF. Khi chuyển đổi định dạng tệp PDF sang XLS hoặc XLSX, không cần định dạng lại hoặc nhập dữ liệu thủ công
Tham số tiêu đề
Chuỗi mã hóa chấp nhận
gzip, giảm phát, br [TÙY CHỌN]
Nội dung-TypeStringnhiều phần/biểu mẫu dữ liệu;
Cung cấp khóa RapidAPI của bạn
X-RapidAPI-HostStringThông số bắt buộc
Nội dung yêu cầu
TệpBINARY, bắt buộc
File PDF để chuyển sang excel
Phản ứng
TệpBINARYTên tệpChuỗi
Tên tệp của tệp Excel đã chuyển đổi
Công cụ API PDF sang Excel phân tích các tài liệu PDF đầu vào và tạo lại bố cục ban đầu của các bảng và đối tượng văn bản. Bạn có thể trích xuất dữ liệu từ các định dạng PDF sang Excel, CSV, JSON và XML so với các công cụ chuyển đổi PDF sang Excel khác
Hỗ trợ văn bản được quét và bị hỏng
Sử dụng OCR [Nhận dạng ký tự quang học] tích hợp của chúng tôi hỗ trợ các tệp PDF có nội dung hỗn hợp và nhiều ngôn ngữ. PDF. đồng có thể dễ dàng chuyển đổi các văn bản được quét và bị hỏng bên trong tệp PDF của bạn
ĐĂNG KÍ MIỄN PHÍ
API PDF sang Excel hỗ trợ nhiều ngôn ngữ
PDF. nền tảng đồng có thể trích xuất dữ liệu PDF sang Excel, CSV, JSON và XML từ các ngôn ngữ lập trình như PHP, Javascript,. NET và ASP. NET, C#, Java, Visual Basic và nhiều thứ khác. Tìm các mẫu mã nguồn trong tài liệu API của chúng tôi
Tích hợp nền tảng tự động hóa kinh doanh
Nếu bạn không phải là nhà phát triển, bạn cũng có thể dễ dàng tự động hóa các hoạt động PDF của mình thông qua các nền tảng tự động hóa kinh doanh phổ biến. Zapier, Make, Airtable, Salesforce, Google Apps Script và hơn 300 ứng dụng khác
Giải pháp doanh nghiệp
Đối với khách hàng doanh nghiệp, có một Máy chủ API chuyên dụng chạy như một máy chủ riêng chuyên dụng với bộ lưu trữ đám mây riêng chuyên dụng trong khu vực lưu trữ mà bạn chọn
API PDF sang Excel – Mẫu & Trình diễn
Đây là quy trình trích xuất dữ liệu từ PDF sang Excel. Đối với bản demo này, tôi sẽ sử dụng Tệp PDF mẫu
Chúng tôi sẽ sử dụng các đoạn mã bên dưới được viết bằng các ngôn ngữ lập trình khác nhau để chuyển đổi tệp PDF mẫu ở trên thành Excel
Sau khi bạn trích xuất dữ liệu từ PDF sang Excel, kết quả cuối cùng sẽ như thế này
Trước khi chúng tôi tiếp tục với mã, trước tiên chúng ta hãy kiểm tra các thông số /v1/pdf/convert/to/xls
và cách sử dụng nó
điểm cuối
URL. https. //api. pdf. co/v1/pdf/convert/to/xlsMethod. POSTParameterDescriptionurlrequired. Liên kết đến tệp nguồn. langtuỳ chọn. Tiếng Anh theo mặc định. Đặt ngôn ngữ OCR [hình ảnh thành văn bản] được sử dụng cho PDF được quét khi tài liệu được quét được phát hiện hoặc đầu vào là hình ảnh PNG, JPG. Các giá trị được hỗ trợ khác. eng, spa, deu, fra, jpn, chi_sim, chi_tra, kor. Bạn cũng có thể chỉ định hai ngôn ngữ sẽ được sử dụng trên cùng một trang, ví dụ: eng+deu, jpn+kor hoặc các kết hợp khác. tùy chọn nội tuyến. Phải là một trong.true
để trả về dữ liệu dưới dạng nội tuyến hoặc false
để trả về liên kết tới tệp đầu ra [mặc định]. không bắt buộc. Bỏ ngắt dòng thành một dòng trong các ô của bảng khi bật tính năng Nhóm dòng. Phải là một trong số true
hoặc false
. trang tùy chọn. Danh sách các chỉ mục [hoặc phạm vi] trang được phân tách bằng dấu phẩy để xử lý. QUAN TRỌNG. trang đầu tiên bắt đầu bằng 0 [không]. Để đặt một phạm vi, hãy sử dụng dấu gạch ngang –, chẳng hạn. 0, 2-5, 7-.
không bắt buộc. Xác định tọa độ để khai thác, e. g. 51. 8, 114. 8, 235. 5, 204. 0. Phải là một string
. tùy chọn mã hóa. Bật mã hóa cho tệp đầu ra. true
or false
asyncoptional. Chạy xử lý không đồng bộ. Trả về jobId để sử dụng với /v1/pdf/convert/to/xls
0. true
hoặc false
têntùy chọn. Tên tệp xuất ra. hồ sơ tùy chọn. Phải là một chuỗi. Đặt cấu hình tùy chỉnh. Xem các ví dụ về hồ sơ tại đâylineGroupingtùy chọn. Nhóm dòng với các ô của bảng. Đặt thành 1 để bật nhóm. Phải là một string
Bây giờ chúng tôi đã sẵn sàng để viết một số mã
Đoạn mã cURL để trích xuất dữ liệu từ PDF sang Excel
curl --location --request POST '//api.pdf.co/v1/pdf/convert/to/xls' \ --header 'x-api-key: YOUR_API_KEY' \ --header 'Content-Type: application/json' \ --data-raw '{ "url": "//bytescout-com.s3-us-west-2.amazonaws.com/files/demo-files/cloud-api/pdf-to-excel/sample.pdf" }'
Mã mẫu này và các mẫu mã nguồn cURL khác có tại đây
Bây giờ hãy xem chương trình này hoạt động và trích xuất dữ liệu PDF sang Excel
Các mẫu mã nguồn cho PDF sang Excel trong JavaScript được đặt tại đây
Các mẫu mã nguồn cho PDF sang Excel trong PHP được đặt tại đây
Mã mẫu cho PDF sang Excel bằng Python có tại đây
Các mẫu mã nguồn cho PDF sang Excel trong Java được đặt tại đây
Các mẫu mã nguồn cho PDF sang Excel trong C# được đặt tại đây
Đăng ký
GHI CHÚ. Sử dụng PDF. co Trình phân loại tài liệu để biết nguồn gốc của tài liệu. Bạn có thể dễ dàng tạo và duy trì các quy tắc phân loại bằng Công cụ kiểm tra trình phân loại dựa trên máy tính để bàn [xem chi tiết tại đây]
Bạn đã học cách trích xuất dữ liệu cụ thể từ PDF sang Excel và đã làm theo các bước để chạy chương trình bằng các đoạn mã cURL