Cách tốt nhất và dễ nhất để đọc tệp văn bản được phân định bằng tab trong Python là gì? Tôi muốn chuyển đổi cột đầu tiên của tệp văn bản thành một danh sách thoát dòng đầu tiên [tiêu đề].
import csv
with open ['data.txt', 'r'] as f:
first_row = [column[0] for column in csv.reader[f,delimiter='\t']]
print [first_row]
Mã trên cung cấp tất cả các yếu tố của First_column. Làm thế nào tôi có thể thoát khỏi dòng đầu tiên [tiêu đề]?
Đã hỏi ngày 12 tháng 6 năm 2013 lúc 1:51Jun 12, 2013 at 1:51
Lisalisalisa
611 huy hiệu vàng2 huy hiệu bạc8 huy hiệu đồng1 gold badge2 silver badges8 bronze badges
2
Có lẽ tôi đang thiếu một cái gì đó trong câu hỏi, nhưng tại sao không chỉ cắt bỏ yếu tố đầu tiên của danh sách?
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
Đã trả lời ngày 12 tháng 6 năm 2013 lúc 2:04Jun 12, 2013 at 2:04
Dave Costadave CostaDave Costa
46.6K8 Huy hiệu vàng56 Huy hiệu bạc71 Huy hiệu đồng8 gold badges56 silver badges71 bronze badges
0
Khi bạn tải tệp, bạn có thể truy cập dữ liệu theo tên cột. Trong ví dụ này, FirstColName
là tên cột đầu tiên của tệp được tải.
import pandas as pd
import numpy as np
file = pd.read_csv[r"C:\Users\hydro\a.txt", sep='\t']
firstCol = np.asarray[file.FirstColName]
print [firstCol]
Đã trả lời ngày 12 tháng 12 năm 2017 lúc 14:51Dec 12, 2017 at 14:51
SubhashisubhashiSubhashi
3.9851 Huy hiệu vàng22 Huy hiệu bạc22 Huy hiệu đồng1 gold badge22 silver badges22 bronze badges
Delimiter in Python là gì?
Cài đặt
Để cài đặt mô -đun này, loại lệnh dưới đây trong thiết bị đầu cuối.
PIP Cài đặt Det_Delimiter
Bước đầu tiên là kiểm tra tất cả các ký tự màu trắng hiện diện trong văn bản đầu vào, nếu được tìm thấy, thì các ký tự đó được tính cho hầu hết các tần số và tối đa của một được trả về, bỏ qua tất cả từ danh sách danh sách đen nếu được cung cấp. Nếu không có dấu phân cách nào từ danh sách trắng, thì các ký tự tránh các ký tự danh sách đen được tính cho tần số tối đa, nếu được tìm thấy, ký tự đó được trả về dưới dạng dấu phân cách. & NBSP; được trả lại. & nbsp;
Cú pháp: Detect [Text: Str, Text: Str, Default = none, whitelist = [',', ';', ':', '|', '\ t'], blacklist = none] Văn bản: chuỗi đầu vào Để kiểm tra Delimiter.Default: & nbsp; Giá trị mặc định để đầu ra trong trường hợp không tìm thấy dấu phân cách hợp lệ nào .Whitelist: Bộ ký tự đầu tiên được kiểm tra cho các dấu phân cách, nếu chúng được tìm thấy, chúng được coi là phân định. Hữu ích trong các trường hợp người ta biết trong số các phân định là có thể. Mặc định là [',', ';', ':', '|', '\ t']. được gắn thẻ là người phân định, những thứ này sẽ được tránh trong kiểm tra. & nbsp;detect[text:str, text:str, default=None, whitelist=[‘,’, ‘;’, ‘:’, ‘|’, ‘\t’], blacklist=None]
text : The input string to test for delimiter.
default : The default value to output in case no valid delimiter is found.
whitelist : The first set of characters to be checked for delimiters, if these are found, they are treated as delimiters. Useful in cases one knows out of which delimiters are possible. Defaults to [‘,’, ‘;’, ‘:’, ‘|’, ‘\t’].
blacklist : By default all digits, alphabets and full stop are not considered as blacklist, In case more values one needs to avoid being tagged as delimiters, these will get avoided in check.
Ví dụ 1: Làm việc với Detect [] và mặc định
Trong đó, một vài ví dụ về việc phát hiện các dấu phân cách được thể hiện cùng với việc sử dụng mặc định. & NBSP;
Python3
from
detect_delimiter
import
detect
print
[
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
0import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
1print
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
3import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
4import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
5print
[
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
8import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
1print
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
3import pandas as pd
import numpy as np
file = pd.read_csv[r"C:\Users\hydro\a.txt", sep='\t']
firstCol = np.asarray[file.FirstColName]
print [firstCol]
2import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
5print
[
import pandas as pd
import numpy as np
file = pd.read_csv[r"C:\Users\hydro\a.txt", sep='\t']
firstCol = np.asarray[file.FirstColName]
print [firstCol]
6import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
1print
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
3import pandas as pd
import numpy as np
file = pd.read_csv[r"C:\Users\hydro\a.txt", sep='\t']
firstCol = np.asarray[file.FirstColName]
print [firstCol]
2FirstColName
1FirstColName
2FirstColName
3import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
5Đầu ra: & nbsp;
Làm việc với Detect [] và mặc định
Ví dụ 2: Sử dụng các tham số danh sách đen và danh sách trắng
Cung cấp tham số Danh sách trắng ưu tiên bất kỳ dấu phân cách cụ thể nào ngay cả khi tần số của nó ít hơn DELIM không được phân định. Tham số danh sách đen có thể giúp bỏ qua bất kỳ dấu phân cách nào.
Python3
from
detect_delimiter
import
detect
Đầu ra: & nbsp;
print
[
from
5
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
1print
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
3from
9import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
5print
[
detect_delimiter
3
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
1print
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
3detect_delimiter
7detect_delimiter
8detect_delimiter
9import
0FirstColName
2import
2FirstColName
3import
4import
5import
6
print
[
import
9
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
1print
import csv
with open ['data.txt', 'r'] as f:
first_column = [row[0] for row in csv.reader[f,delimiter='\t']]
print [first_column[1:]]
3detect_delimiter
7detect_delimiter
8detect_delimiter
9detect
6FirstColName
2import
2FirstColName
3import
4print
1import
4print
3import
6
Đầu ra: & nbsp;
Làm việc với Detect [] và mặc định