countrybeer_servingsspirit_servingswine_servingstotal_lits_of_pure_alcoholcontinent0Afghanistan0000. 0Châu Á1Albania89132544. 9Châu Âu2Algeria250140. 7Châu Phi3Andorra24513831212. 4Châu Âu4Angola21757455. 9Châu Phi
Trong [5]
drinks.dtypes
Ra[5]
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
Tóm tắt kiểu dữ liệu
- 3 số nguyên [int64]
- 1 thả nổi [float64]
- 2 đối tượng [đối tượng]
Phương pháp 1. Thay đổi kiểu dữ liệu sau khi đọc csv
Trong [8]
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]
Trong [10]
drinks.dtypes
Ra[10]
country object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
Phương pháp 2. Thay đổi kiểu dữ liệu trước khi đọc csv
Trong [11]
drinks = pd.read_csv[url, dtype={'beer_servings':float}]
Trong [12]
drinks.dtypes
Ra[12]
country object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
Trong [13]
url = '//bit.ly/drinksbycountry' drinks = pd.read_csv[url]1
Trong [14]
url = '//bit.ly/drinksbycountry' drinks = pd.read_csv[url]2
Ra[14]
order_idquantityitem_namechoice_descriptionitem_price011Chip chiên và Salsa cà chua tươiNaN$2. 39111Izze[Clementine]$3. 39211Nantucket Nectar[Apple]$3. 39311Khoai tây chiên và Salsa ớt xanh cà chuaNaN$2. 39422 Chicken Bowl[Tomatillo-Red Chili Salsa [Nóng], [Đậu đen. $16. 98
Bạn có thể vô tình lưu trữ hỗn hợp các chuỗi và không phải chuỗi trong một mảng dtype
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object07. Tốt hơn là có một dtype chuyên dụng
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object07 dtype phá vỡ các hoạt động dành riêng cho dtype như
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object23. Không có cách rõ ràng để chỉ chọn văn bản trong khi loại trừ các cột không phải văn bản nhưng vẫn là đối tượng dtype
Khi đọc mã, nội dung của mảng dtype
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object07 không rõ ràng bằng
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object25
Hiện tại, hiệu suất của mảng chuỗi dtype
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object07 và
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object27 gần như giống nhau. Chúng tôi hy vọng những cải tiến trong tương lai sẽ tăng đáng kể hiệu suất và giảm chi phí bộ nhớ của
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object28
Cảnh báo
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object28 hiện được coi là thử nghiệm. Việc triển khai và các phần của API có thể thay đổi mà không có cảnh báo
Để có khả năng tương thích ngược,
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object07 dtype vẫn là loại mặc định, chúng tôi suy ra danh sách các chuỗi để
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]0
Để yêu cầu một cách rõ ràng loại dtype
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]11, hãy chỉ định
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]12
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]3
Hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]13 sau khi tạo
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]15
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]7
Thay đổi trong phiên bản 1. 1. 0
Bạn cũng có thể sử dụng
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object08/
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]17 làm kiểu dtype trên dữ liệu không phải chuỗi và nó sẽ được chuyển thành kiểu dtype
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]11
drinks.dtypes1
hoặc chuyển đổi từ dữ liệu gấu trúc hiện có
drinks.dtypes2
Khác biệt về hành vi#
Đây là những nơi mà hành vi của các đối tượng
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object08 khác với
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object07 dtype
Đối với
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
08, các phương thức truy cập chuỗi trả về đầu ra dạng số sẽ luôn trả về một dtype số nguyên có thể null, thay vì dtype int hoặc float, tùy thuộc vào . Các phương thức trả về đầu ra boolean sẽ trả về một dtype boolean nullable.country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
0Cả hai đầu ra là
drinks.dtypes
72 dtype. So sánh điều đó với object-dtypecountry object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
2Khi có giá trị NA, dtype đầu ra là float64. Tương tự cho các phương thức trả về giá trị boolean
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]
1
Một số phương thức chuỗi, như
drinks.dtypes
73 không khả dụng trêncountry object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
28 vìcountry object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
28 chỉ chứa chuỗi, không chứa byteTrong các hoạt động so sánh,
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
27 và# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]
14 được hỗ trợ bởi mộtcountry object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
28 sẽ trả về một đối tượng códrinks.dtypes
79, thay vì một đối tượng dtypecountry object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
70. Các giá trị bị thiếu trong mộtcountry object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
28 sẽ lan truyền trong các hoạt động so sánh, thay vì luôn so sánh không bằng nhau nhưcountry object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object
72
Mọi thứ khác tiếp theo trong phần còn lại của tài liệu này đều áp dụng như nhau cho
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]11 và
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object07 dtype
Các phương thức chuỗi#
Series và Index được trang bị bộ phương thức xử lý chuỗi giúp dễ dàng thao tác trên từng phần tử của mảng. Có lẽ quan trọng nhất, các phương pháp này tự động loại trừ các giá trị bị thiếu/NA. Chúng được truy cập thông qua thuộc tính
country object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object75 và thường có tên khớp với các phương thức chuỗi tích hợp [vô hướng] tương đương
drinks.dtypes7
country object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object7
Các phương thức chuỗi trên Chỉ mục đặc biệt hữu ích để dọn dẹp hoặc chuyển đổi các cột DataFrame. Chẳng hạn, bạn có thể có các cột có khoảng trắng ở đầu hoặc cuối
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]30
Vì
country object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object76 là một đối tượng Index, nên chúng ta có thể sử dụng bộ truy cập
country object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object77
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]31
Các phương thức chuỗi này sau đó có thể được sử dụng để dọn dẹp các cột khi cần thiết. Ở đây, chúng tôi đang xóa các khoảng trắng ở đầu và ở cuối, viết thường tất cả các tên và thay thế mọi khoảng trắng còn lại bằng dấu gạch dưới
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]32
Ghi chú
Nếu bạn có một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 trong đó nhiều phần tử được lặp lại [i. e. số lượng phần tử duy nhất trong
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 nhỏ hơn rất nhiều so với độ dài của
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14], có thể nhanh hơn nếu chuyển đổi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 ban đầu thành một loại
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]302 và sau đó sử dụng
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]303 hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]304 trên đó. Sự khác biệt về hiệu suất xuất phát từ thực tế là, đối với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 thuộc loại
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]302, các thao tác chuỗi được thực hiện trên
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]307 chứ không phải trên từng phần tử của
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14
Xin lưu ý rằng một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 thuộc loại
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]302 với chuỗi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]307 có một số hạn chế so với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 thuộc loại chuỗi [e. g. bạn không thể thêm các chuỗi vào nhau.
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]313 sẽ không hoạt động nếu
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]314 là một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 thuộc loại
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]302]. Ngoài ra, các phương thức
country object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object77 hoạt động trên các phần tử của loại
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]318 không khả dụng trên một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 như vậy
Cảnh báo
trước v. 0. 25. 0, trình truy cập
country object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object77 chỉ thực hiện kiểm tra loại thô sơ nhất. Bắt đầu với v. 0. 25. 0, loại Sê-ri được suy ra và loại được phép [i. e. string] được thi hành chặt chẽ hơn
Nói chung, trình truy cập
country object beer_servings float64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object77 chỉ hoạt động trên các chuỗi. Với rất ít trường hợp ngoại lệ, các mục đích sử dụng khác không được hỗ trợ và có thể bị tắt sau này
Tách và thay chuỗi#
Các phương thức như
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]322 trả về một loạt danh sách
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]33
Các phần tử trong danh sách phân tách có thể được truy cập bằng cách sử dụng ký hiệu
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]323 hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]324
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]34
Thật dễ dàng để mở rộng phần này để trả về DataFrame bằng cách sử dụng
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]325
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]35
Khi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 ban đầu có
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object08, tất cả các cột đầu ra cũng sẽ là
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object08
Cũng có thể giới hạn số lần chia
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]36
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]329 tương tự như
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]322 ngoại trừ nó hoạt động theo hướng ngược lại, tôi. e. , từ cuối chuỗi đến đầu chuỗi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]37
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]331 tùy ý sử dụng các biểu thức chính quy
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]38
Cảnh báo
Một số thận trọng phải được thực hiện khi xử lý các biểu thức chính quy. Hành vi hiện tại là xử lý các mẫu ký tự đơn dưới dạng chuỗi ký tự, ngay cả khi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]332 được đặt thành
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]333. Hành vi này không được chấp nhận và sẽ bị xóa trong phiên bản tương lai để từ khóa
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]332 luôn được tôn trọng
Thay đổi trong phiên bản 1. 2. 0
Nếu bạn muốn thay thế một chuỗi theo nghĩa đen [tương đương với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]335], bạn có thể đặt tham số
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]332 tùy chọn thành
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]337, thay vì thoát từng ký tự. Trong trường hợp này, cả
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]338 và
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]339 đều phải là chuỗi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]39
Phương thức
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]331 cũng có thể thay thế một callable. Nó được gọi trên mọi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]338 bằng cách sử dụng
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]342. Có thể gọi được sẽ mong đợi một đối số vị trí [đối tượng biểu thức chính quy] và trả về một chuỗi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]70
Phương thức
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]331 cũng chấp nhận đối tượng biểu thức chính quy được biên dịch từ
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]344 làm mẫu. Tất cả các cờ phải được bao gồm trong đối tượng biểu thức chính quy được biên dịch
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]71
Bao gồm một đối số
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]345 khi gọi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]331 với một đối tượng biểu thức chính quy được biên dịch sẽ tạo ra một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]347
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]72
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]348 và
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]349 có tác dụng tương tự như
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]350 và
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]351 được thêm vào trong Python 3. 9 < https. // tài liệu. con trăn. org/3/library/stdtypes. html#str. loại bỏ tiền tố>`__
Mới trong phiên bản 1. 4. 0
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]73
nối #
Có một số cách để nối một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353, với chính nó hoặc với những người khác, tất cả đều dựa trên
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]354, tương ứng.
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]355
Nối một Sê-ri đơn lẻ thành một chuỗi#
Nội dung của một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 [hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353] có thể được nối
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]74
Nếu không được chỉ định, từ khóa
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]358 cho dấu phân cách sẽ mặc định là chuỗi trống,
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]359
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]75
Theo mặc định, các giá trị bị thiếu sẽ bị bỏ qua. Sử dụng
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]360, chúng có thể được biểu diễn
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]76
Kết hợp một Sê-ri và một thứ gì đó giống như danh sách thành Sê-ri #
Đối số đầu tiên của
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]354 có thể là một đối tượng giống như danh sách, miễn là nó khớp với độ dài của lệnh gọi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 [hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353]
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]77
Các giá trị bị thiếu ở một trong hai bên cũng sẽ dẫn đến các giá trị bị thiếu trong kết quả, trừ khi chỉ định
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]360
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]78
Nối một Sê-ri và thứ gì đó giống như mảng thành Sê-ri#
Tham số
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]365 cũng có thể là hai chiều. Trong trường hợp này, số hoặc hàng phải khớp với độ dài của lệnh gọi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 [hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353]
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]79
Nối một Sê-ri và một đối tượng được lập chỉ mục thành Sê-ri, với căn chỉnh #
Để nối với một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]15, có thể căn chỉnh các chỉ mục trước khi nối bằng cách đặt từ khóa
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]370
drinks.dtypes10
Cảnh báo
Nếu từ khóa
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]370 không được chuyển, phương thức
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]354 hiện sẽ quay trở lại hành vi trước phiên bản 0. 23. 0 [tôi. e. không căn chỉnh], nhưng một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]373 sẽ được nâng lên nếu bất kỳ chỉ số liên quan nào khác nhau, vì mặc định này sẽ thay đổi thành
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]374 trong một phiên bản trong tương lai
Các tùy chọn thông thường có sẵn cho
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]370 [một trong số
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]376]. Đặc biệt, thẳng hàng còn có nghĩa là các độ dài khác nhau không cần phải trùng nhau nữa
drinks.dtypes11
Căn chỉnh tương tự có thể được sử dụng khi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]365 là một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]15
drinks.dtypes12
Nối một Sê-ri và nhiều đối tượng thành Sê-ri#
Một số mục giống như mảng [cụ thể là. Các biến thể
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14,
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353 và 1 chiều của
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]381] có thể được kết hợp trong một vùng chứa giống như danh sách [bao gồm các trình vòng lặp, chế độ xem
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]382, v.v. ]
drinks.dtypes13
Tất cả các phần tử không có chỉ mục [e. g.
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]381] trong danh sách được thông qua-giống như phải phù hợp về độ dài với cuộc gọi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 [hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353], nhưng
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14 và
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353 có thể có độ dài tùy ý [miễn là căn chỉnh không bị vô hiệu hóa với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]388]
drinks.dtypes14
Nếu sử dụng
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]389 trên một danh sách giống như
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]365 có chứa các chỉ mục khác nhau, thì sự kết hợp của các chỉ mục này sẽ được sử dụng làm cơ sở cho phép nối cuối cùng
drinks.dtypes15
Lập chỉ mục với country object
beer_servings float64
spirit_servings int64
wine_servings int64
total_litres_of_pure_alcohol float64
continent object
dtype: object
77#
Bạn có thể sử dụng ký hiệu
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]324 để lập chỉ mục trực tiếp theo vị trí vị trí. Nếu bạn lập chỉ mục qua phần cuối của chuỗi, kết quả sẽ là
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]393
drinks.dtypes16
Trích xuất chuỗi con#
Trích xuất trận đấu đầu tiên trong mỗi chủ đề [trích xuất]#
Cảnh báo
Trước phiên bản 0. 23, đối số
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]325 của phương thức
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]395 được mặc định là
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]337. Khi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]397,
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]325 trả về một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]14,
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353 hoặc
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]15, tùy thuộc vào chủ đề và mẫu biểu thức chính quy. Khi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]702, nó luôn trả về một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]15, nhất quán hơn và ít gây nhầm lẫn hơn từ quan điểm của người dùng.
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]702 đã là mặc định kể từ phiên bản 0. 23. 0
Phương thức
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]395 chấp nhận một biểu thức chính quy với ít nhất một nhóm chụp
Trích xuất một biểu thức chính quy có nhiều hơn một nhóm trả về một DataFrame với một cột cho mỗi nhóm
drinks.dtypes17
Các phần tử không khớp trả về một hàng chứa đầy
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]393. Do đó, một Sê-ri các chuỗi lộn xộn có thể được “chuyển đổi” thành Sê-ri được lập chỉ mục tương tự hoặc Khung dữ liệu gồm các chuỗi đã được làm sạch hoặc hữu ích hơn mà không cần yêu cầu
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]707 truy cập các bộ dữ liệu hoặc đối tượng
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]708. Dtype của kết quả luôn là đối tượng, ngay cả khi không tìm thấy kết quả phù hợp và kết quả chỉ chứa
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]393
Các nhóm được đặt tên như
drinks.dtypes18
và các nhóm tùy chọn như
drinks.dtypes19
cũng có thể được sử dụng. Lưu ý rằng mọi tên nhóm chụp trong biểu thức chính quy sẽ được sử dụng cho tên cột;
Trích xuất một biểu thức chính quy với một nhóm trả về một cột
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]15 nếu
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]702
drinks.dtypes20
Nó trả về một chuỗi ________ 2397
drinks.dtypes21
Gọi trên một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353 với một biểu thức chính quy có chính xác một nhóm chụp sẽ trả về một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]15 với một cột nếu
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]702
drinks.dtypes22
Nó trả về một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353 nếu
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]397
drinks.dtypes23
Gọi trên một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353 với một biểu thức chính quy có nhiều hơn một nhóm chụp sẽ trả về một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]15 nếu
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]702
drinks.dtypes24
Nó tăng
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]347 nếu
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]397
drinks.dtypes25
Bảng bên dưới tóm tắt hành vi của
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]723 [nhập chủ đề vào cột đầu tiên, số nhóm trong biểu thức chính quy ở hàng đầu tiên]
1 nhóm
>1 nhóm
Mục lục
Mục lục
Giá trịError
Loạt
Loạt
Khung dữ liệu
Trích xuất tất cả các kết quả phù hợp trong mỗi chủ đề [extractall]#
Không giống như
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]395 [chỉ trả về kết quả khớp đầu tiên],
drinks.dtypes26
phương pháp
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]725 trả về mọi trận đấu. Kết quả của
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]725 luôn là một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]15 với một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]728 trên các hàng của nó. Cấp độ cuối cùng của
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]728 được đặt tên là
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]730 và cho biết thứ tự trong chủ đề
drinks.dtypes27
Khi mỗi chuỗi chủ đề trong Sê-ri có chính xác một kết quả khớp,
drinks.dtypes28
sau đó
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]731 cho kết quả tương tự như
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]732
drinks.dtypes29
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353 cũng hỗ trợ
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]734. Nó trả về một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]15 có cùng kết quả với một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]736 với chỉ mục mặc định [bắt đầu từ 0]
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object00
Kiểm tra các chuỗi khớp hoặc chứa một mẫu #
Bạn có thể kiểm tra xem các phần tử có chứa mẫu không
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object01
Hoặc liệu các phần tử có khớp với một mẫu hay không
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object02
Mới trong phiên bản 1. 1. 0
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object03
Ghi chú
Sự khác biệt giữa
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]730,
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]738 và
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]739 là tính nghiêm ngặt.
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]738 kiểm tra xem toàn bộ chuỗi có khớp với biểu thức chính quy hay không;
Các chức năng tương ứng trong gói
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]743 cho ba chế độ khớp này được. hoàn toàn phù hợp, lại. phù hợp, và lại. tìm kiếm, tương ứng
Các phương thức như
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]730,
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]738,
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]739,
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]747 và
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]748 nhận thêm một đối số
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]749 để các giá trị bị thiếu có thể được coi là Đúng hoặc Sai
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object04
Tạo các biến chỉ báo#
Bạn có thể trích xuất các biến giả từ các cột chuỗi. Ví dụ: nếu chúng được phân tách bằng
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]750
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object05
Chuỗi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]353 cũng hỗ trợ
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]752 trả về một
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]728
country object beer_servings int64 spirit_servings int64 wine_servings int64 total_litres_of_pure_alcohol float64 continent object dtype: object06
Xem thêm
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]754
Tóm tắt Phương pháp#
Phương pháp
Sự miêu tả
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]354
nối chuỗi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]756
Tách chuỗi trên dấu phân cách
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]757
Tách chuỗi trên dấu phân cách hoạt động từ cuối chuỗi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]707
Lập chỉ mục vào từng phần tử [truy xuất phần tử thứ i]
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]759
Tham gia các chuỗi trong từng phần tử của Sê-ri với dấu phân cách đã qua
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]754
Tách chuỗi trên dấu phân cách trả về DataFrame của các biến giả
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]761
Trả về mảng boolean nếu mỗi chuỗi chứa mẫu/regex
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]762
Thay thế các lần xuất hiện của mẫu/regex/chuỗi bằng một số chuỗi khác hoặc giá trị trả về của một giá trị có thể gọi được khi xuất hiện
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]763
Xóa tiền tố khỏi chuỗi, tôi. e. chỉ xóa nếu chuỗi bắt đầu bằng tiền tố
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]764
Xóa hậu tố khỏi chuỗi, tôi. e. chỉ xóa nếu chuỗi kết thúc bằng hậu tố
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]765
Nhân đôi giá trị [
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]766 tương đương với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]767]
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]768
Thêm khoảng trắng vào bên trái, bên phải hoặc cả hai bên của chuỗi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]769
Tương đương với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]770
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]771
Tương đương với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]772
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]773
Tương đương với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]774
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]775
Tương đương với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]776
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]777
Tách các chuỗi dài thành các dòng có chiều dài nhỏ hơn chiều rộng nhất định
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]778
Cắt từng chuỗi trong Series
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]779
Thay thế lát cắt trong mỗi chuỗi bằng giá trị đã truyền
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]780
Đếm số lần xuất hiện của mẫu
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]781
Tương đương với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]782 cho mỗi phần tử
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]783
Tương đương với
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]784 cho mỗi phần tử
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]785
Tính toán danh sách tất cả các lần xuất hiện của mẫu/regex cho mỗi chuỗi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]786
Gọi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]708 trên mỗi phần tử, trả về các nhóm phù hợp dưới dạng danh sách
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]788
Gọi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]789 trên mỗi phần tử, trả về DataFrame với một hàng cho mỗi phần tử và một cột cho mỗi nhóm chụp biểu thức chính quy
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]790
Gọi
# to change use .astype[] drinks['beer_servings'] = drinks.beer_servings.astype[float]791 trên mỗi phần tử, trả về DataFrame với một hàng cho mỗi trận đấu và một cột cho mỗi nhóm chụp biểu thức chính quy