Trong bài viết này, chúng ta sẽ xem cách đọc nhiều tệp dữ liệu vào gấu trúc, các tệp dữ liệu có nhiều loại, đây là một vài cách để đọc nhiều tệp bằng cách sử dụng gói Pandas trong Python.
Các tệp trình diễn có thể được tải xuống từ đây
Phương pháp 1: Đọc các tệp CSV
Nếu các tệp dữ liệu của chúng tôi ở định dạng CSV thì phải sử dụng phương thức read_csv []. read_csv lấy một đường dẫn tệp làm đối số. Nó đọc nội dung của CSV. Để đọc nhiều tệp CSV, chúng tôi chỉ có thể sử dụng một vòng lặp đơn giản và lặp trên tất cả các tệp. & NBSP;
Ví dụ: Đọc nhiều tệp CSV bằng gấu trúc
Trong ví dụ này, chúng tôi lập danh sách các tệp dữ liệu hoặc đường dẫn tệp của chúng tôi và sau đó lặp qua các đường dẫn tệp bằng cách sử dụng vòng lặp, một vòng lặp được sử dụng để lặp lại thông qua các vòng lặp như danh sách, bộ dữ liệu, chuỗi, v.v. và sau đó tạo khung dữ liệu Sử dụng pd.dataFrame [], kết hợp từng dataFrame thành một khung dữ liệu chính bằng pd.concat [], sau đó chuyển đổi dữ liệu chính cuối cùng thành tệp CSV bằng phương thức một cuộc tranh cãi.
Python3
import
pandas as pd
file_list
=
[
'a.csv'
,
'b.csv'
,
'c.csv'
pandas as pd
0
pandas as pd
1=
pandas as pd
3pandas as pd
4pandas as pd
5
pandas as pd
6 pandas as pd
7pandas as pd
8 pandas as pd
9file_list
0file_list
1,
file_list
3file_list
4
file_list
5file_list
6=
file_list
8
file_list
5=
0303 =
2
file_list
5pandas as pd
1=
=
6=
file_list
1=
9
[
0[
1
Output:
Phương pháp 2: Sử dụng gói Glob
Mô -đun GLOB trong Python được sử dụng để truy xuất các tệp hoặc tên đường dẫn khớp với một mẫu được chỉ định. & NBSP;
Chương trình này tương tự như chương trình trên nhưng sự khác biệt duy nhất là thay vì theo dõi tên tệp bằng danh sách chúng tôi sử dụng gói Glob để truy xuất các tệp phù hợp với một mẫu được chỉ định.
Ví dụ: Đọc nhiều tệp CSV bằng Pandas và Glob.
Python3
import
pandas as pd
pandas as pd
1=
pandas as pd
3pandas as pd
4pandas as pd
5
pandas as pd
6 pandas as pd
7pandas as pd
8 pandas as pd
9file_list
0file_list
1,
file_list
3file_list
4
file_list
5file_list
6=
file_list
8
pandas as pd
1=
pandas as pd
3pandas as pd
4pandas as pd
5
pandas as pd
6 pandas as pd
7pandas as pd
8 pandas as pd
9file_list
0file_list
1,
file_list
3file_list
4
file_list
5file_list
6=
file_list
8
file_list
5=
0303 =
2
file_list
5pandas as pd
1=
=
6=
file_list
1=
9
[
0[
1
Output:
Phương pháp 2: Sử dụng gói Glob
Mô -đun GLOB trong Python được sử dụng để truy xuất các tệp hoặc tên đường dẫn khớp với một mẫu được chỉ định. & NBSP;
Chương trình này tương tự như chương trình trên nhưng sự khác biệt duy nhất là thay vì theo dõi tên tệp bằng danh sách chúng tôi sử dụng gói Glob để truy xuất các tệp phù hợp với một mẫu được chỉ định.
Ví dụ: Đọc nhiều tệp CSV bằng Pandas và Glob.
Python3
import
pandas as pd
pandas as pd
1=
pandas as pd
3pandas as pd
4pandas as pd
5
pandas as pd
6 pandas as pd
7pandas as pd
8 pandas as pd
9file_list
0file_list
1,
file_list
3file_list
4
file_list
5file_list
6=
file_list
8
file_list
5=
0303 =
2
pandas as pd
6 pandas as pd
7pandas as pd
8 pandas as pd
9file_list
0file_list
1,
file_list
3file_list
4
file_list
5file_list
6=
file_list
8
file_list
5=
0303 =
2
file_list
5pandas as pd
1=
=
6=
file_list
1=
9
[
0[
1
pandas as pd
30pandas as pd
31=
9
Output: