Python xóa tất cả các ký tự không phải ascii

Thanh ngôn ngữ này là bạn của bạn. Chọn ngôn ngữ yêu thích của bạn

Chọn ngôn ngữ yêu thích của bạn

  • C
  • C++
  • C#
  • Đi
  • Java
  • JS
  • đối tượng-C
  • PHP
  • con trăn
  • hồng ngọc
  • rỉ sét
  • Hoặc tìm kiếm.

Thành ngữ #147 Xóa tất cả các ký tự không phải ASCII

Tạo chuỗi t từ chuỗi s, chỉ giữ lại các ký tự ASCII

  • ASCII trong Wikipedia

  • con trăn
  • con trăn
  • Ađa
  • C++
  • C#
  • D
  • phi tiêu
  • tiên dược
  • tiên dược
  • Fortran
  • Đi
  • Đi
  • Haskell
  • Haskell
  • JS
  • JS
  • Java
  • nói ngọng
  • PHP
  • pascal
  • pascal
  • perl
  • hồng ngọc
  • hồng ngọc
  • rỉ sét
  • rỉ sét
  • nói nhỏ

  • con trăn

import re

t = re.sub('[^\u0000-\u007f]', '',  s)

  • Thử nghiệm

  • con trăn

t = s.encode("ascii", "ignore").decode()

  • Thử nghiệm

  • Ađa
  • C++
  • C#
  • D
  • phi tiêu
  • tiên dược
  • tiên dược
  • Fortran
  • Đi
  • Đi
  • Haskell
  • Haskell
  • JS
  • JS
  • Java
  • nói ngọng
  • PHP
  • pascal
  • pascal
  • perl
  • hồng ngọc
  • hồng ngọc
  • rỉ sét
  • rỉ sét
  • nói nhỏ

function Only_ASCII (S : String) return String is
   subtype ASCII is Character range
      Character'Val (0) . Character'Val (127);
   T    : String (S'Range);
   Last : Natural := T'First - 1;
begin
   for Char of S loop
      if Char in ASCII then
         Last := Last + 1;
         T (Last) := Char;
      end if;
   end loop;
   return T (T'First . Last);
end Only_ASCII;

 copy_if(begin(src), end(src), back_inserter(dest),
         [](const auto c) { return static_cast(c) <= 0x7F; });

  • Thử nghiệm

string t = Regex.Replace(s, @"[^\u0000-\u007F]+", string.Empty);

  • bác sĩ
  • Nguồn gốc

import std.array;
import std.algorithm.iteration;
import std.ascii;

auto t = s.filter!(a => a.isASCII).array;

________số 8

t = 
  s 
  |> String.to_charlist()
  |> Enum.filter(&(&1 in 0..127))
  |> List.to_string

  • bác sĩ

t = re.sub('[^\u0000-\u007f]', '',  s)
0

t = re.sub('[^\u0000-\u007f]', '',  s)
1

t = re.sub('[^\u0000-\u007f]', '',  s)
2

t = re.sub('[^\u0000-\u007f]', '',  s)
3

  • Thử nghiệm

t = re.sub('[^\u0000-\u007f]', '',  s)
4

t = re.sub('[^\u0000-\u007f]', '',  s)
5

  • Thử nghiệm
  • bác sĩ

t = re.sub('[^\u0000-\u007f]', '',  s)
6

t = re.sub('[^\u0000-\u007f]', '',  s)
7

  • bác sĩ

t = re.sub('[^\u0000-\u007f]', '',  s)
6

t = re.sub('[^\u0000-\u007f]', '',  s)
9

  • bác sĩ

t = s.encode("ascii", "ignore").decode()
0

t = s.encode("ascii", "ignore").decode()
1

t = s.encode("ascii", "ignore").decode()
2

  • Nguồn gốc

t = s.encode("ascii", "ignore").decode()
3

t = s.encode("ascii", "ignore").decode()
4

  • bác sĩ

t = s.encode("ascii", "ignore").decode()
5

t = s.encode("ascii", "ignore").decode()
6

t = s.encode("ascii", "ignore").decode()
7

t = s.encode("ascii", "ignore").decode()
8

t = s.encode("ascii", "ignore").decode()
9

  • Thử nghiệm

function Only_ASCII (S : String) return String is
   subtype ASCII is Character range
      Character'Val (0) . Character'Val (127);
   T    : String (S'Range);
   Last : Natural := T'First - 1;
begin
   for Char of S loop
      if Char in ASCII then
         Last := Last + 1;
         T (Last) := Char;
      end if;
   end loop;
   return T (T'First . Last);
end Only_ASCII;
0

  • Thử nghiệm

function Only_ASCII (S : String) return String is
   subtype ASCII is Character range
      Character'Val (0) . Character'Val (127);
   T    : String (S'Range);
   Last : Natural := T'First - 1;
begin
   for Char of S loop
      if Char in ASCII then
         Last := Last + 1;
         T (Last) := Char;
      end if;
   end loop;
   return T (T'First . Last);
end Only_ASCII;
1

  • Thử nghiệm
  • bác sĩ

function Only_ASCII (S : String) return String is
   subtype ASCII is Character range
      Character'Val (0) . Character'Val (127);
   T    : String (S'Range);
   Last : Natural := T'First - 1;
begin
   for Char of S loop
      if Char in ASCII then
         Last := Last + 1;
         T (Last) := Char;
      end if;
   end loop;
   return T (T'First . Last);
end Only_ASCII;
2

  • Thử nghiệm
  • bác sĩ

function Only_ASCII (S : String) return String is
   subtype ASCII is Character range
      Character'Val (0) . Character'Val (127);
   T    : String (S'Range);
   Last : Natural := T'First - 1;
begin
   for Char of S loop
      if Char in ASCII then
         Last := Last + 1;
         T (Last) := Char;
      end if;
   end loop;
   return T (T'First . Last);
end Only_ASCII;
3


Bạn có biết cách tốt nhất để làm điều này bằng ngôn ngữ của mình không?

< >⌨

Thành ngữ được tạo bởi lập trình-thành ngữ. tổ chức

Lịch sử
  • Xem bản sửa đổi
thành ngữ liên quan
  • Xóa tất cả các ký tự không phải chữ số
  • Xóa tất cả các ký tự khoảng trắng

cheatsheets

Vấn đề
  • Báo lỗi

Ký tự không phải ascii Python là gì?

Để sử dụng các ký tự không phải ASCII, Python yêu cầu mã hóa và giải mã rõ ràng các chuỗi thành Unicode . Trong IBM® SPSS® Modeler, các tập lệnh Python được cho là được mã hóa bằng UTF-8, đây là mã hóa Unicode tiêu chuẩn hỗ trợ các ký tự không phải ASCII.

Hàm Isascii trong Python là gì?

Phương thức chuỗi isascii() của Python . Kiểm tra tài liệu tham khảo ASCII của chúng tôi. returns True if all the characters are ascii characters (a-z). Check our ASCII Reference.