Hướng dẫn read-excel-file - đọc-excel-tệp

Excel là định dạng file rất phổ biến được tạo ra bởi Microsoft. Thông thường, các ứng dụng Java sử dụng thư viện Apache POI để đọc và ghi tập tin Excel. Trong bài này, tôi sẽ hướng dẫn cách để đọc và ghi các tập tin Excel sử dụng API của thư viện Apache POI.

Giới thiệu về Apache POI?

Apache POI là một thư viện mã nguồn mở Java, được cung cấp bởi Apache. Thư viện này cung cấp các API [phương thức] làm việc với các tài liệu của Microsoft như Word, Excel, Power point, Visio,…

Các class của Apache POI thường có tiếp đầu ngữ HSSF, XSSF, HPSF, … Nhìn vào tiếp đầu ngữ của một class bạn có thể biết được class đó hỗ trợ loại định dạng nào.

  • HSSF [Horrible SpreadSheet Format]: Đọc và ghi file định dạng Microsoft Excel [XLS – định dạng hỗ trợ của Excel 2003].
  • XSSF [XML SpreadSheet Format]: Đọc và ghi định dạng file Open Office XML [XLSX – định dạng hỗ trợ của Excel 2007 trở lên].
  • SXSSF [Streaming version of XSSFWorkbook] : SXSSF là một phần mở rộng API của XSSF, được sử dụng khi xuất các file excel lớn và có bộ nhớ heap sapce hạn chế.

Tổng quan Apache POI Excel

Microsoft Excel hiện tại có 2 phần mở rộng:

  • .xls: tương ứng với phiên bản Microsoft Excel 2003 trở về trước. Định dạng này được Apache POI hỗ trợ bởi các lớp java với tiếp đầu ngữ là HSSF.
  • .xlsx: tương ứng với phiên bản Microsoft Excel 2007 trở về sau. Định dạng này được Apache POI hỗ trợ bởi các lớp java với tiếp đầu ngữ là XSSF, SXSSF.

Một số khái niệm cơ bản của Apache API:

Apache POI cung cấp cho bạn các interface Workbook, Sheet, Row, Cell,… và các class thể hiện [implementation] tương ứng:

  • Workbook: đại diện cho một file Excel. Nó được triển khai dưới hai class là: HSSFWorkbook và XSSFWorkbook tương ứng cho định dạng .xls và .xlsx .
  • Sheet: đại diện cho một bảng tính Excel [một file Excel có thể có nhiều Sheet]. Nó có 2 class là HSSFSheet và XSSFSheet.
  • Row: đại diện cho một hàng trong một bảng tính [Sheet]. Nó có 2 class là HSSFRow và XSSFRow.
  • Cell: đại diện cho một ô trong một hàng [Row]. Tương tự nó cũng có 2 class là HSSFCell and XSSFCell.

Khai báo thư viện Apache POI

Tạo Maven project và khai báo thư viện trong file pom.xml của project như sau:




    org.apache.poi
    poi
    3.17

 



    org.apache.poi
    poi-ooxml
    3.17

Lưu ý: Các phiên bản cũ của Apache POI chỉ hỗ trợ các định dạng file binary như doc, xls, ppt, … .Từ phiên bản 3.5 trở đi, POI hỗ trợ các định dạng file OOXML của MS-Office như docx, xlsx, pptx, …

Ví dụ đọc và ghi file Excel

Microsoft Office các phiên bản trước đây [97-2003] các file excel có định dạng .xls và các phiên bản mới hơn [2007 trở về sau] thường sử dụng định dạng .xlsx. Để thao tác với các file .xls cần sử dụng các class có tiếp đầu ngữ HSSF. Còn đối với các file định dạng .xlsx cần sử dụng các class có tiếp đầu ngữ XSSF.

Ví dụ ghi file excel [.xls, .xlsx]

Book.java

package com.gpcoder.apachepoi;
 
public class Book {
    private Integer id;
    private String title;
    private Integer quantity;
    private Double price;
    private Double totalMoney;
}

WriteExcelExample.java

package com.gpcoder.apachepoi;
 
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.util.ArrayList;
import java.util.List;
 
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.BorderStyle;
import org.apache.poi.ss.usermodel.BuiltinFormats;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.CellStyle;
import org.apache.poi.ss.usermodel.CellType;
import org.apache.poi.ss.usermodel.DataFormat;
import org.apache.poi.ss.usermodel.FillPatternType;
import org.apache.poi.ss.usermodel.Font;
import org.apache.poi.ss.usermodel.IndexedColors;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.ss.util.CellReference;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
 
public class WriteExcelExample {
    public static final int COLUMN_INDEX_ID         = 0;
    public static final int COLUMN_INDEX_TITLE      = 1;
    public static final int COLUMN_INDEX_PRICE      = 2;
    public static final int COLUMN_INDEX_QUANTITY   = 3;
    public static final int COLUMN_INDEX_TOTAL      = 4;
    private static CellStyle cellStyleFormatNumber = null;
     
    public static void main[String[] args] throws IOException {
        final List books = getBooks[];
        final String excelFilePath = "C:/demo/books.xlsx";
        writeExcel[books, excelFilePath];
    }
 
    public static void writeExcel[List books, String excelFilePath] throws IOException {
        // Create Workbook
        Workbook workbook = getWorkbook[excelFilePath];
 
        // Create sheet
        Sheet sheet = workbook.createSheet["Books"]; // Create sheet with sheet name
 
        int rowIndex = 0;
         
        // Write header
        writeHeader[sheet, rowIndex];
 
        // Write data
        rowIndex++;
        for [Book book : books] {
            // Create row
            Row row = sheet.createRow[rowIndex];
            // Write data on row
            writeBook[book, row];
            rowIndex++;
        }
         
        // Write footer
        writeFooter[sheet, rowIndex];
 
        // Auto resize column witdth
        int numberOfColumn = sheet.getRow[0].getPhysicalNumberOfCells[];
        autosizeColumn[sheet, numberOfColumn];
 
        // Create file excel
        createOutputFile[workbook, excelFilePath];
        System.out.println["Done!!!"];
    }
 
    // Create dummy data
    private static List getBooks[] {
        List listBook = new ArrayList[];
        Book book;
        for [int i = 1; i 

Bài Viết Liên Quan

Chủ Đề