Đọc cột đầu tiên của CSV Python
Cảm ơn tất cả. Trên thực tế, tôi đã bỏ qua một chi tiết liên quan giải thích lý do tại sao tôi gặp vấn đề khi tìm giải pháp. các hàng của tệp CSV không hoàn chỉnh, một số chỉ có một phần tử, một số khác trống nên khi đọc cột tôi quan tâm, tôi đã gặp lỗi. Tôi đã giải quyết nó bằng cách lặp qua tất cả các hàng, kiểm tra những hàng có giá trị mà tôi đang tìm kiếm trong cột đầu tiên và trích xuất giá trị tương ứng từ cột mà tôi quan tâm, với việc xử lý ngoại lệ; Show
Cảm ơn lần nữa. Cố gắng đưa cột đầu tiên (tên) vào danh sách để hiển thị người dùng và sau đó được cập nhật với các thay đổi đối với tệp CSV. Sử dụng mã này
Tuy nhiên, tôi nhận được đầu ra kém hiệu quả của Nếu chúng tôi nhập tệp CSV mà không chỉ định cột chỉ mục, gấu trúc sẽ chỉ tạo một cột chỉ mục có giá trị số bắt đầu từ 0. #import CSV file without specifying index column df = pd.read_csv('my_data.csv') #view DataFrame print(df) team points assists 0 A 18 5 1 B 22 7 2 C 19 7 3 D 14 9 4 E 14 12 5 F 11 9 6 G 20 9 7 H 28 4 Tuy nhiên, chúng ta có thể sử dụng đối số index_col để chỉ định rằng cột đầu tiên trong tệp CSV sẽ được sử dụng làm cột chỉ mục Xem các loại dữ liệu cột chúng tôi đã nhập. first_name và company là các biến ký tự. Các biến còn lại là biến số ID int64 first_name object company object salary int64 ví dụ 2. Đọc tệp CSV có tiêu đề ở hàng thứ haiGiả sử bạn có tên cột hoặc tên biến ở hàng thứ hai. Để đọc loại tệp CSV này, bạn có thể gửi lệnh sau.mydata = pd.read_csv("workingfile.csv", header = 1) import os os.getcwd()9 yêu cầu python chọn tiêu đề từ hàng thứ hai. Nó đang đặt hàng thứ hai làm tiêu đề. Nó không phải là một ví dụ thực tế. Mình chỉ minh hoạ để các bạn hình dung cách giải. Để thực tế, bạn có thể thêm các giá trị ngẫu nhiên vào hàng đầu tiên trong tệp CSV rồi nhập lại. dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])0 Xác định tên cột của riêng bạn thay vì hàng tiêu đề từ tệp CSV dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])1skiprows = 1 có nghĩa là chúng tôi đang bỏ qua hàng đầu tiên và tùy chọn names= được sử dụng để gán tên biến theo cách thủ công. dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])2 ví dụ 3. Bỏ qua hàng nhưng giữ tiêu đềdt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])3Trong trường hợp này, chúng tôi đang bỏ qua hàng thứ hai và thứ ba trong khi nhập. Đừng quên chỉ mục bắt đầu từ 0 trong python, vì vậy 0 đề cập đến hàng đầu tiên và 1 đề cập đến hàng thứ hai và 2 ngụ ý hàng thứ ba. dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])4 Thay vì [1,2] bạn cũng có thể viết 20. Cả hai đều có nghĩa giống nhau nhưng hàm range() rất hữu ích khi bạn muốn bỏ qua nhiều hàng để tiết kiệm thời gian xác định vị trí hàng theo cách thủ côngBí mật ẩn của tùy chọn bỏ qua Khi bỏ qua = 4, có nghĩa là bỏ qua bốn hàng từ trên xuống. bỏ qua = [1,2,3,4] có nghĩa là bỏ qua các hàng từ thứ hai đến thứ năm. Đó là bởi vì khi danh sách được chỉ định trong tùy chọn bỏ qua =, nó sẽ bỏ qua các hàng ở vị trí chỉ mục. Khi một giá trị số nguyên duy nhất được chỉ định trong tùy chọn, nó sẽ xem xét bỏ qua các hàng đó từ trên cùng Ví dụ 4. Đọc tệp CSV không có hàng tiêu đềNếu bạn chỉ định "header = None", python sẽ gán một dãy số bắt đầu từ 0 đến (số cột - 1) làm tên cột. Trong tệp dữ liệu này, chúng tôi có tên cột ở hàng đầu tiên.dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])5Xem đầu ra được hiển thị bên dưới- Thêm tiền tố vào tên cột dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])6Trong trường hợp này, chúng tôi đang đặt 21 làm tiền tố cho python bao gồm từ khóa này trước mỗi tên cột. dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])7 Ví dụ 5. Chỉ định các giá trị còn thiếuCác tùy chọn 22 được sử dụng để đặt một số giá trị là giá trị trống/thiếu trong khi nhập tệp CSV. dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])8 dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])9 Ví dụ 6. Đặt cột chỉ mục 00 01Như bạn có thể thấy trong kết quả ở trên, cột ID đã được đặt làm cột chỉ mụcVí dụ 7. Đọc tệp CSV từ URL bên ngoàiBạn có thể đọc trực tiếp dữ liệu từ tệp CSV được lưu trữ trên liên kết web. Nó rất tiện lợi khi bạn cần tải các bộ dữ liệu có sẵn công khai từ github, kaggle và các trang web khác. 02Khung dữ liệu này chứa 2311 hàng và 8 cột. Sử dụng 23, bạn có thể tạo bản tóm tắt nàyVí dụ 8. Bỏ qua 5 hàng cuối cùng khi nhập CSV 03Trong đoạn mã trên, chúng tôi đang loại trừ 5 hàng dưới cùng bằng cách sử dụng tham số skip_footer=Ví dụ 9. Chỉ đọc 5 hàng đầu tiên 04Sử dụng tùy chọn nrows=, bạn có thể tải K số hàng trên cùngVí dụ 10. Diễn giải "," thành dấu phân cách hàng nghìn 05Ví dụ 11. Chỉ đọc các cột cụ thể 06 Đoạn mã trên chỉ đọc các cột dựa trên vị trí chỉ mục là vị trí thứ hai, thứ sáu và thứ támVí dụ 12. Đọc một số hàng và cột 07Trong lệnh trên, chúng ta đã kết hợp các tùy chọn usecols= và nrows=. Nó sẽ chỉ chọn 5 hàng đầu tiên và các cột được chọnVí dụ 13. Đọc tệp với dấu phân cách dấu chấm phẩy 08Sử dụng tham số sep= trong hàm read_csv( ), bạn có thể nhập tệp bằng bất kỳ dấu phân cách nào ngoài dấu phẩy mặc định. Trong trường hợp này, chúng tôi đang sử dụng dấu chấm phẩy làm dấu phân cáchVí dụ 14. Thay đổi loại cột trong khi nhập CSVGiả sử bạn muốn thay đổi định dạng cột từ int64 thành float64 trong khi tải tệp CSV vào Python. Chúng ta có thể sử dụng tùy chọn dtype = cho cùng. 09Ví dụ 15. Đo thời gian cần thiết để nhập tệp CSV lớnVới việc sử dụng 24, bạn có thể nắm bắt thời gian dành cho việc dọn dẹp bộ nhớ Mã thông báo, chuyển đổi và Trình phân tích cú pháp. import os os.getcwd()0 Ví dụ 16. Cách đọc tệp CSV mà không cần sử dụng gói PandasĐể nhập tệp CSV bằng cách thuần python, bạn có thể gửi lệnh sau.import os os.getcwd()1Bạn cũng có thể tải xuống và tải tệp CSV từ URL hoặc trang web bên ngoài. import os os.getcwd()2 Ghi chú cuối After completion of this tutorial, I hope you gained confidence in importing CSV file into Python with ways to clean and manage file. You can also check out this tutorial which explains how to import files of different format to Python. Once done, you should learn how to perform common data manipulation or wrangling tasks like filtering, selecting and renaming columns, identify and remove duplicates etc on pandas dataframe.Học Python. 50 hướng dẫn Python hàng đầu Truyền bá. bài viết liên quan Giới thiệu tác giả. Deepanshu thành lập ListenData với mục tiêu đơn giản - Làm cho phân tích trở nên dễ hiểu và dễ theo dõi. Ông có hơn 10 năm kinh nghiệm trong lĩnh vực khoa học dữ liệu. Trong nhiệm kỳ của mình, ông đã làm việc với các khách hàng toàn cầu trong nhiều lĩnh vực khác nhau như Ngân hàng, Bảo hiểm, Cổ phần tư nhân, Viễn thông và Nhân sự. Làm cách nào để đọc cột đầu tiên từ tệp CSV trong gấu trúc python?Điều này có thể được thực hiện với sự trợ giúp của gấu trúc. phương thức read_csv() . Chúng tôi sẽ chuyển tham số đầu tiên dưới dạng tệp CSV và tham số thứ hai là danh sách các cột cụ thể trong từ khóa usecols. Nó sẽ trả về dữ liệu của tệp CSV của các cột cụ thể.
Cách đọc cột trong csv Python?Trong phương pháp này, chúng tôi sẽ nhập thư viện csv và mở tệp ở chế độ đọc, sau đó chúng tôi sẽ sử dụng hàm DictReader() để đọc dữ liệu của tệp CSV . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . Hàm này giống như một trình đọc thông thường, nhưng nó ánh xạ thông tin tới một từ điển có khóa được cung cấp bởi tên cột và tất cả các giá trị dưới dạng khóa. . This function is like a regular reader, but it maps the information to a dictionary whose keys are given by the column names and all the values as keys.
Làm thế nào để đọc cột cụ thể trong gấu trúc?Bạn có thể sử dụng các hàm loc và iloc để truy cập các cột trong Khung dữ liệu Pandas . Hãy xem làm thế nào. Nếu chúng tôi muốn truy cập một cột nhất định trong Khung dữ liệu của mình, chẳng hạn như cột Điểm, chúng tôi chỉ cần sử dụng hàm loc và chỉ định tên của cột để truy xuất nó. |