Hướng dẫn python regex replace spaces - python regex thay thế dấu cách

Tôi đang cố gắng chuyển đổi một chuỗi các từ và số thành một danh sách, mọi mục đều được phân tách bằng một khoảng trống, vì vậy sử dụng .replace ["", ","]. , đôi khi có nhiều từ trong tên đối tượng và tôi muốn những từ này được kết nối với _

Example:

office supplies 674.56 570.980487 755.84 682.360029

Đầu ra dự kiến:

office_supplies 674.56 570.980487 755.84 682.360029

Tôi đã tìm thấy điều này: Chỉ thay thế khoảng trống giữa các chữ cái

Và cố gắng thực hiện nó như thế này:

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]

Nhưng nó dường như không thay thế các không gian, tôi không sắc nét với Regex, nhưng theo vấn đề được liên kết, nó sẽ hoạt động.

Làm thế nào để tôi thoát khỏi dấu câu trong Python?

Chúng ta có thể sử dụng phương thức thay thế [] để xóa dấu câu từ chuỗi python bằng cách thay thế từng dấu chấm câu bằng chuỗi trống. Chúng tôi sẽ lặp lại toàn bộ dấu câu đánh dấu từng người một thay thế nó bằng một chuỗi trống trong chuỗi văn bản của chúng tôi.Show

  • Làm thế nào để tôi thoát khỏi dấu câu trong gấu trúc?
  • Phương pháp 2: Xóa dấu câu từ một chuỗi với vòng lặp Python
  • Phương pháp 3: Xóa dấu câu từ một chuỗi với Regex & NBSP;
  • tweet = 'I am tired! I like fruit...and milk'
    clean = re.sub['\W+\s*', ' ', tweet]
    print[tweet + '\n' + clean]
    
    3
    sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
    regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
    print[re.sub[p, r"\1\2", line]]
    
    0
    sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
    regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
    print[re.sub[p, r"\1\2", line]]
    
    1
    tweet = 'I am tired! I like fruit...and milk'
    clean = re.sub['\W+\s*', ' ', tweet]
    print[tweet + '\n' + clean]
    
    6
  • Phần của việc thay thế bằng dấu câu cũng có thể được thực hiện bằng Regex. Trong đó, chúng tôi thay thế tất cả các dấu câu bằng một chuỗi trống bằng cách sử dụng một regex nhất định.
  • Gfg is best for  Geeks 
    2
    sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
    regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
    print[re.sub[p, r"\1\2", line]]
    
    1
    Gfg is best for  Geeks 
    4
    Gfg is best for  Geeks 
    5
    Gfg is best for  Geeks 
    6
  • Đầu ra: & nbsp;
  • Độ phức tạp về thời gian: O [n]

Không gian phụ trợ: O [n]special sequences rather than a manual list of punctuation and spaces to catch.

import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]

Results:

I am tired! I like fruit...and milk
I am tired I like fruit and milk

Làm thế nào để tôi thoát khỏi dấu câu trong Python?

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]

Chúng ta có thể sử dụng phương thức thay thế [] để xóa dấu câu từ chuỗi python bằng cách thay thế từng dấu chấm câu bằng chuỗi trống. Chúng tôi sẽ lặp lại toàn bộ dấu câu đánh dấu từng người một thay thế nó bằng một chuỗi trống trong chuỗi văn bản của chúng tôi.

Làm thế nào để tôi thoát khỏi dấu câu trong gấu trúc?

Để loại bỏ dấu chấm câu bằng Python Pandas, chúng ta có thể sử dụng phương thức STR.Replace của DataFrame. Chúng tôi gọi thay thế bằng một chuỗi regex phù hợp với tất cả các ký tự dấu chấm câu và thay thế chúng bằng các chuỗi trống. Thay thế trả về một cột DataFrame mới và chúng tôi gán nó cho DF ['Text'].

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['[^a-zA-Z0-9]+\s*', ' ', tweet]
print[tweet + '\n' + clean]

Làm thế nào để bạn xóa dấu câu từ Python bằng NLTK?

Sử dụng NLTK ..

câu = "suy nghĩ và tự hỏi, tự hỏi và suy nghĩ.".

tokenizer = nltk. Regexptokenizer [r "\ w+"].

Nhiều lần khi làm việc với các chuỗi Python, chúng tôi có một vấn đề trong đó chúng tôi cần loại bỏ một số ký tự nhất định khỏi chuỗi. Điều này có thể có các ứng dụng trong tiền xử lý dữ liệu trong lĩnh vực khoa học dữ liệu và cả trong lập trình hàng ngày. Hãy để thảo luận về những cách nhất định mà chúng ta có thể thực hiện nhiệm vụ này bằng Python.

Phương pháp 1: Xóa dấu câu từ chuỗi có dịch

Hai đối số đầu tiên cho phương thức String.Translate là các chuỗi trống và đầu vào thứ ba là danh sách python của dấu câu cần được xóa. Điều này hướng dẫn phương pháp Python để loại bỏ dấu câu từ một chuỗi. Đây là một trong những cách tốt nhất để dải dấu câu từ một chuỗi.best ways to strip punctuation from a string.

Python3

office_supplies 674.56 570.980487 755.84 682.360029
8
office_supplies 674.56 570.980487 755.84 682.360029
9

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
0
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
2

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
0
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
5

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
6
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
7
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
8
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
9
import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
0
import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
1

import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
2
import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
3

Output:

Gfg is best for  Geeks 

Phương pháp 2: Xóa dấu câu từ một chuỗi với vòng lặp Python

Đây là cách vũ phu trong đó nhiệm vụ này có thể được thực hiện. Trong đó, chúng tôi kiểm tra các dấu chấm câu bằng cách sử dụng một chuỗi thô có chứa dấu chấm câu và sau đó chúng tôi xây dựng một chuỗi loại bỏ các dấu câu đó.

Python3

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
0
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
6

import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
7
import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
0
I am tired! I like fruit...and milk
I am tired I like fruit and milk
1

I am tired! I like fruit...and milk
I am tired I like fruit and milk
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1

I am tired! I like fruit...and milk
I am tired I like fruit and milk
4
I am tired! I like fruit...and milk
I am tired I like fruit and milk
5
I am tired! I like fruit...and milk
I am tired I like fruit and milk
6
I am tired! I like fruit...and milk
I am tired I like fruit and milk
7

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
6
I am tired! I like fruit...and milk
I am tired I like fruit and milk
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
5
I am tired! I like fruit...and milk
I am tired I like fruit and milk
6
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
2

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
3
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
0
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
6

import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
7
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
0
I am tired! I like fruit...and milk
I am tired I like fruit and milk
1

Output: 

The original string is : Gfg, is best : for ! Geeks ;
The string after punctuation filter : Gfg is best  for  Geeks 

Phương pháp 3: Xóa dấu câu từ một chuỗi với Regex & NBSP;

Phần của việc thay thế bằng dấu câu cũng có thể được thực hiện bằng Regex. Trong đó, chúng tôi thay thế tất cả các dấu câu bằng một chuỗi trống bằng cách sử dụng một regex nhất định.

Python3

office_supplies 674.56 570.980487 755.84 682.360029
8
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['[^a-zA-Z0-9]+\s*', ' ', tweet]
print[tweet + '\n' + clean]
3

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
0
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
6

import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
7
import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
0
I am tired! I like fruit...and milk
I am tired I like fruit and milk
1

I am tired! I like fruit...and milk
I am tired I like fruit and milk
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1

I am tired! I like fruit...and milk
I am tired I like fruit and milk
4
I am tired! I like fruit...and milk
I am tired I like fruit and milk
5
I am tired! I like fruit...and milk
I am tired I like fruit and milk
6
I am tired! I like fruit...and milk
I am tired I like fruit and milk
7

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
6
I am tired! I like fruit...and milk
I am tired I like fruit and milk
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
5
I am tired! I like fruit...and milk
I am tired I like fruit and milk
6
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
2

The original string is : Gfg, is best : for ! Geeks ;
The string after punctuation filter : Gfg is best  for  Geeks 

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
3
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
0
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
6

Python3

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
0
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
6

import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
7
import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
0
I am tired! I like fruit...and milk
I am tired I like fruit and milk
1

I am tired! I like fruit...and milk
I am tired I like fruit and milk
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1

The original string is : Gfg, is best : for ! Geeks ;
The string after punctuation filter : Gfg is best  for  Geeks 
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
The original string is : Gfg, is best : for ! Geeks ;
The string after punctuation filter : Gfg is best  for  Geeks 
4

I am tired! I like fruit...and milk
I am tired I like fruit and milk
4
I am tired! I like fruit...and milk
I am tired I like fruit and milk
5
I am tired! I like fruit...and milk
I am tired I like fruit and milk
6
I am tired! I like fruit...and milk
I am tired I like fruit and milk
7

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
6
I am tired! I like fruit...and milk
I am tired I like fruit and milk
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
5
I am tired! I like fruit...and milk
I am tired I like fruit and milk
6
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
2

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
3
The original string is : Gfg, is best : for ! Geeks ;
The string after punctuation filter : Gfg is best  for  Geeks 
2
I am tired! I like fruit...and milk
I am tired I like fruit and milk
0
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
office_supplies 674.56 570.980487 755.84 682.360029
09

I am tired! I like fruit...and milk
I am tired I like fruit and milk
4
I am tired! I like fruit...and milk
I am tired I like fruit and milk
5
I am tired! I like fruit...and milk
I am tired I like fruit and milk
6
I am tired! I like fruit...and milk
I am tired I like fruit and milk
7

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
6
I am tired! I like fruit...and milk
I am tired I like fruit and milk
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
5
I am tired! I like fruit...and milk
I am tired I like fruit and milk
6
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
2

office_supplies 674.56 570.980487 755.84 682.360029
0

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
3
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
0
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
6

import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
7
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
0
I am tired! I like fruit...and milk
I am tired I like fruit and milk
1
O[n]

Phương pháp 3: Xóa dấu câu từ một chuỗi với Regex & NBSP;O[n]


Phần của việc thay thế bằng dấu câu cũng có thể được thực hiện bằng Regex. Trong đó, chúng tôi thay thế tất cả các dấu câu bằng một chuỗi trống bằng cách sử dụng một regex nhất định.

office_supplies 674.56 570.980487 755.84 682.360029
8
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['[^a-zA-Z0-9]+\s*', ' ', tweet]
print[tweet + '\n' + clean]
3

Gfg is best for  Geeks 
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
1
Gfg is best for  Geeks 
4
Gfg is best for  Geeks 
5
Gfg is best for  Geeks 
6

import re

tweet = 'I am tired! I like fruit...and milk'
clean = re.sub[r'''      # Start raw string block
               \W+       # Accept one or more non-word characters
               \s*       # plus zero or more whitespace characters,
               ''',      # Close string block
               ' ',      # and replace it with a single space
               tweet,
               flags=re.VERBOSE]
print[tweet + '\n' + clean]
2
sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
7
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
0
The original string is : Gfg, is best : for ! Geeks ;
The string after punctuation filter : Gfg is best  for  Geeks 
1use the DataFrame's str. replace method. We call replace with a regex string that matches all punctuation characters and replace them with empty strings. replace returns a new DataFrame column and we assign that to df['text'] .

Đầu ra: & nbsp;

Phương pháp 4: & nbsp; Sử dụng cho vòng lặp, chuỗi dấu chấm câu và không trong toán tử.

sample_line = "office supplies 674.56 570.980487 755.84 682.360029"
regex = re.compile[':%s/\v[\a]\s[\a]/\1_\2/g', re.I]
print[re.sub[p, r"\1\2", line]]
6
I am tired! I like fruit...and milk
I am tired I like fruit and milk
9
I am tired! I like fruit...and milk
I am tired I like fruit and milk
5
office_supplies 674.56 570.980487 755.84 682.360029
02
I am tired! I like fruit...and milk
I am tired I like fruit and milk
6
tweet = 'I am tired! I like fruit...and milk'
clean = re.sub['\W+\s*', ' ', tweet]
print[tweet + '\n' + clean]
2

Đầu ra

Độ phức tạp về thời gian và không gian cho tất cả các phương pháp là như nhau:

print[new_words].

Độ phức tạp về thời gian: O [n]

Không gian phụ trợ: O [n]punctuation values do not include Unicode symbols or whitespace characters. Remove punctuation.

Bài Viết Liên Quan

Chủ Đề