Làm cách nào để chuyển đổi khung dữ liệu thành tệp csv trong python?

Bằng cách sử dụng phương pháp


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
1, bạn có thể ghi/lưu/xuất Khung dữ liệu gấu trúc sang Tệp CSV. Theo mặc định, phương thức to_csv[] xuất DataFrame sang tệp CSV có dấu phân cách bằng dấu phẩy và chỉ mục hàng làm cột đầu tiên. Trong bài viết này, tôi sẽ đề cập đến cách xuất sang tệp CSV bằng dấu phân cách tùy chỉnh, có hoặc không có tiêu đề cột, bỏ qua chỉ mục, mã hóa, dấu ngoặc kép, v.v.

  • Viết Pandas DataFrame vào tệp CSV
  • Ghi DataFrame vào CSV mà không cần Tiêu đề
  • Viết bằng Dấu phân cách tùy chỉnh
  • Viết vào CSV mà không có chỉ mục
  • Xuất các cột đã chọn sang tệp CSV
  • Thay đổi tên cột tiêu đề trong khi viết
  • Xử lý các giá trị bị thiếu [None/NaN]
  • Ghi DataFrame vào CSV bằng Mã hóa
  • Nối DataFrame vào tệp CSV hiện có
  • Các thông số thường dùng khác

Để giải thích, trước tiên hãy tạo một DataFrame với một vài hàng và cột


import pandas as pd
import numpy as np
technologies = {
    'Courses':["Spark","PySpark","Hadoop","Python"],
    'Fee' :[22000,25000,np.nan,24000],
    'Duration':['30day',None,'55days',np.nan],
    'Discount':[1000,2300,1000,np.nan]
          }
df = pd.DataFrame[technologies]

1. Viết Pandas DataFrame vào tệp CSV

Pandas DataFrame cung cấp phương thức


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
2 để ghi/xuất DataFrame sang tệp dấu phân cách được phân tách bằng dấu phẩy CSV cùng với tiêu đề và chỉ mục


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]

Thao tác này tạo tệp


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
3 tại vị trí đã chỉ định với nội dung bên dưới trong một tệp

Viết pandas DataFrame vào tệp CSV

Như bạn thấy theo mặc định, tệp CSV đã được tạo bằng tệp phân cách bằng dấu phẩy, với tiêu đề cột và chỉ mục hàng. Bạn có thể thay đổi hành vi này bằng cách cung cấp thông số cho phương thức.


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
2 nhận nhiều tham số tùy chọn như trong cú pháp bên dưới


# to_csv[] Syntax
DataFrame.to_csv[path_or_buf=None, sep=',', na_rep='', float_format=None, 
columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, 
compression='infer', quoting=None, quotechar='"', line_terminator=None, 
chunksize=None, date_format=None, doublequote=True, escapechar=None, 
decimal='.', errors='strict', storage_options=None]

2. Ghi DataFrame vào CSV mà không cần Tiêu đề

Bạn có thể sử dụng tham số


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
5 để viết DataFrame mà không cần tiêu đề [tên cột]. Theo mặc định, phương thức to_csv[] xuất DataFrame sang tệp CSV có tiêu đề do đó bạn cần sử dụng thông số này để bỏ qua tiêu đề

________số 8

3. Viết bằng Dấu phân cách tùy chỉnh

Theo mặc định, tệp CSV được tạo bằng dấu phân cách bằng dấu phẩy, bạn có thể thay đổi hành vi này bằng cách sử dụng tham số


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
6 [dấu phân cách] và chọn các dấu phân cách khác như tab [\t], ống dẫn [. ] e. t. c


import pandas as pd
import numpy as np
technologies = {
    'Courses':["Spark","PySpark","Hadoop","Python"],
    'Fee' :[22000,25000,np.nan,24000],
    'Duration':['30day',None,'55days',np.nan],
    'Discount':[1000,2300,1000,np.nan]
          }
df = pd.DataFrame[technologies]
0

4. Ghi vào CSV bỏ qua Chỉ mục

Như tôi đã nói trước đó, theo mặc định, DataFrame sẽ được xuất sang CSV với chỉ mục hàng, bạn có thể bỏ qua điều này bằng cách sử dụng tham số


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
7


import pandas as pd
import numpy as np
technologies = {
    'Courses':["Spark","PySpark","Hadoop","Python"],
    'Fee' :[22000,25000,np.nan,24000],
    'Duration':['30day',None,'55days',np.nan],
    'Discount':[1000,2300,1000,np.nan]
          }
df = pd.DataFrame[technologies]
2

5. Xuất các cột đã chọn sang tệp CSV

Đôi khi, bạn sẽ được yêu cầu xuất các cột đã chọn từ DataFrame sang Tệp CSV, Để chọn các cột cụ thể, hãy sử dụng thông số


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
8. Trong ví dụ này, tôi đã tạo một danh sách

# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
9 với các cột bắt buộc và sử dụng nó trên phương thức

# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
2. Bạn cũng có thể chọn các cột từ DataFrame của gấu trúc trước khi ghi vào tệp


import pandas as pd
import numpy as np
technologies = {
    'Courses':["Spark","PySpark","Hadoop","Python"],
    'Fee' :[22000,25000,np.nan,24000],
    'Duration':['30day',None,'55days',np.nan],
    'Discount':[1000,2300,1000,np.nan]
          }
df = pd.DataFrame[technologies]
6

6. Thay đổi tên cột tiêu đề trong khi viết

Sử dụng tiêu đề


# to_csv[] Syntax
DataFrame.to_csv[path_or_buf=None, sep=',', na_rep='', float_format=None, 
columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, 
compression='infer', quoting=None, quotechar='"', line_terminator=None, 
chunksize=None, date_format=None, doublequote=True, escapechar=None, 
decimal='.', errors='strict', storage_options=None]
1 để thay đổi tên cột trên tiêu đề trong khi ghi DataFrame của gấu trúc vào tệp CSV. Bạn cũng có thể đổi tên các cột DataFrame của gấu trúc trước khi ghi vào tệp


import pandas as pd
import numpy as np
technologies = {
    'Courses':["Spark","PySpark","Hadoop","Python"],
    'Fee' :[22000,25000,np.nan,24000],
    'Duration':['30day',None,'55days',np.nan],
    'Discount':[1000,2300,1000,np.nan]
          }
df = pd.DataFrame[technologies]
8

7. Xử lý các giá trị bị thiếu [None/NaN]

Nếu bạn để ý tất cả các ví dụ trên, giá trị


# to_csv[] Syntax
DataFrame.to_csv[path_or_buf=None, sep=',', na_rep='', float_format=None, 
columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, 
compression='infer', quoting=None, quotechar='"', line_terminator=None, 
chunksize=None, date_format=None, doublequote=True, escapechar=None, 
decimal='.', errors='strict', storage_options=None]
2/

# to_csv[] Syntax
DataFrame.to_csv[path_or_buf=None, sep=',', na_rep='', float_format=None, 
columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, 
compression='infer', quoting=None, quotechar='"', line_terminator=None, 
chunksize=None, date_format=None, doublequote=True, escapechar=None, 
decimal='.', errors='strict', storage_options=None]
3 được viết dưới dạng một chuỗi rỗng. Bạn có thể kiểm soát hành vi này và gán các giá trị tùy chỉnh bằng tham số

# to_csv[] Syntax
DataFrame.to_csv[path_or_buf=None, sep=',', na_rep='', float_format=None, 
columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, 
compression='infer', quoting=None, quotechar='"', line_terminator=None, 
chunksize=None, date_format=None, doublequote=True, escapechar=None, 
decimal='.', errors='strict', storage_options=None]
4


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
2

8. Ghi DataFrame vào CSV bằng Mã hóa

Đôi khi bạn gặp sự cố với mã hóa, tôi khuyên bạn nên chỉ định mã hóa trong khi ghi DataFrame vào tệp CSV. Để sử dụng một mã hóa cụ thể, hãy sử dụng đối số 


# to_csv[] Syntax
DataFrame.to_csv[path_or_buf=None, sep=',', na_rep='', float_format=None, 
columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, 
compression='infer', quoting=None, quotechar='"', line_terminator=None, 
chunksize=None, date_format=None, doublequote=True, escapechar=None, 
decimal='.', errors='strict', storage_options=None]
5 . Ví dụ:

# to_csv[] Syntax
DataFrame.to_csv[path_or_buf=None, sep=',', na_rep='', float_format=None, 
columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, 
compression='infer', quoting=None, quotechar='"', line_terminator=None, 
chunksize=None, date_format=None, doublequote=True, escapechar=None, 
decimal='.', errors='strict', storage_options=None]
6 xuất Khung dữ liệu gấu trúc ở dạng mã hóa

# to_csv[] Syntax
DataFrame.to_csv[path_or_buf=None, sep=',', na_rep='', float_format=None, 
columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, 
compression='infer', quoting=None, quotechar='"', line_terminator=None, 
chunksize=None, date_format=None, doublequote=True, escapechar=None, 
decimal='.', errors='strict', storage_options=None]
7 sang tệp CSV


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
6

9. Nối DataFrame vào tệp CSV hiện có

Khi bạn ghi DataFrame của gấu trúc vào tệp CSV hiện có, nó sẽ ghi đè lên tệp bằng nội dung mới. Để nối thêm Khung dữ liệu vào tệp CSV hiện có, bạn cần chỉ định chế độ ghi nối thêm bằng cách sử dụng


# to_csv[] Syntax
DataFrame.to_csv[path_or_buf=None, sep=',', na_rep='', float_format=None, 
columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, 
compression='infer', quoting=None, quotechar='"', line_terminator=None, 
chunksize=None, date_format=None, doublequote=True, escapechar=None, 
decimal='.', errors='strict', storage_options=None]
8


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
0

10. Các thông số thường dùng khác

float_format. Định dạng chuỗi cho số dấu phẩy động

đường dẫn_or_buf. Đường dẫn đến tệp, nếu không được chỉ định, nó sẽ trả về dưới dạng Chuỗi

nén. Dùng để nén. hỗ trợ nén 'infer', 'gzip', 'bz2', 'zip', 'xz'

bảng trích dẫn. Chuỗi độ dài 1. Ký tự được sử dụng để trích dẫn các trường. Dấu ngoặc kép mặc định “

line_terminator. Ký tự để sử dụng cho dòng kết thúc. Bạn có thể sử dụng


# to_csv[] Syntax
DataFrame.to_csv[path_or_buf=None, sep=',', na_rep='', float_format=None, 
columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, 
compression='infer', quoting=None, quotechar='"', line_terminator=None, 
chunksize=None, date_format=None, doublequote=True, escapechar=None, 
decimal='.', errors='strict', storage_options=None]
9

Định dạng ngày tháng. Định dạng chuỗi cho đối tượng ngày giờ

lỗi. Chỉ định cách xử lý lỗi mã hóa và giải mã.  

Sự kết luận

Theo mặc định,


# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
1 ghi DataFrame với tiêu đề, chỉ mục và dấu phân cách dấu phẩy. bạn có thể thay đổi hành vi này bằng cách sử dụng các tham số tùy chọn. Ví dụ:

# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
5 để bỏ qua tiêu đề,

# Write DataFrame to CSV File with Default params.
df.to_csv["c:/tmp/courses.csv"]
7 để bỏ qua chỉ mục hàng,

# Write DataFrame to CSV without Header
df.to_csv["c:/tmp/courses.csv", header=False]

# Writes Below Content to CSV File
#0,Spark,22000.0,30day,1000.0
#1,PySpark,25000.0,,2300.0
#2,Hadoop,,55days,1000.0
#3,Python,24000.0,,
3 để thay đổi dấu phân cách e. t. c

Chủ Đề