Hướng dẫn get specific word from string python - lấy từ cụ thể từ chuỗi python

Đôi khi chúng ta đi qua các tình huống mà chúng ta yêu cầu để có được tất cả các từ có trong chuỗi, đây có thể là một nhiệm vụ tẻ nhạt được thực hiện bằng phương pháp gốc. Do đó có tốc ký để thực hiện nhiệm vụ này luôn hữu ích. Ngoài ra, bài viết này cũng bao gồm các trường hợp trong đó các dấu chấm câu phải bị bỏ qua. Phương pháp nếu người ta muốn hoàn thành nhiệm vụ cụ thể này. Nhưng nhược điểm là nó thất bại trong các trường hợp chuỗi chứa dấu chấm câu. & NBSP;
Method #1 : Using split() 
Using the split function, we can split the string into a list of words and this is the most generic and recommended method if one wished to accomplish this particular task. But the drawback is that it fails in cases the string contains punctuation marks.
 

Python3

test_string = "Geeksforgeeks is best Computer Science Portal"

print ("The original string is : " ________ 9 & nbsp;

s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
0

s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
1=
s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
3

print (

s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
6 ________ 9 & nbsp;
s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
8
s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
9

Đầu ra: & nbsp; chuỗi gốc là: geeksforgeek là cổng thông tin khoa học máy tính tốt nhất & nbsp; danh sách các từ là: [' ; 
The original string is : Geeksforgeeks is best Computer Science Portal 
The list of words is : [‘Geeksforgeeks’, ‘is’, ‘best’, ‘Computer’, ‘Science’, ‘Portal’] 
 

& nbsp; & nbsp; Phương pháp #2: Sử dụng regex (findall ()) & nbsp; Trong các trường hợp chứa tất cả các ký tự đặc biệt và dấu chấm câu, như đã thảo luận ở trên, phương pháp tìm kiếm thông thường Biểu thức để thực hiện nhiệm vụ này. Hàm Findall Trả về danh sách sau khi lọc chuỗi và trích xuất các từ bỏ qua các dấu chấm câu. & nbsp;
Method #2 : Using regex( findall() ) 
In the cases which contain all the special characters and punctuation marks, as discussed above, the conventional method of finding words in string using split can fail and hence requires regular expressions to perform this task. findall function returns the list after filtering the string and extracting words ignoring punctuation marks.
 

Python3

import re
m = re.match('Job_Cluster_AK_Alaska_(.*).png')
print(m[1])
0
import re
m = re.match('Job_Cluster_AK_Alaska_(.*).png')
print(m[1])
1

test_string =

import re
m = re.match('Job_Cluster_AK_Alaska_(.*).png')
print(m[1])
4

print ("The original string is : " ________ 9 & nbsp;

s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
0

s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
1=
s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
3

print (

s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
6 ________ 9 & nbsp;
s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
8
s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
9

Đầu ra: & nbsp; chuỗi gốc là: geeksforgeek là cổng thông tin khoa học máy tính tốt nhất & nbsp; danh sách các từ là: [' ; 
The original string is : Geeksforgeeks, is best @# Computer Science Portal.!!! 
The list of words is : [‘Geeksforgeeks’, ‘is’, ‘best’, ‘Computer’, ‘Science’, ‘Portal’] 
 

& nbsp; & nbsp; Phương pháp #2: Sử dụng regex (findall ()) & nbsp; Trong các trường hợp chứa tất cả các ký tự đặc biệt và dấu chấm câu, như đã thảo luận ở trên, phương pháp tìm kiếm thông thường Biểu thức để thực hiện nhiệm vụ này. Hàm Findall Trả về danh sách sau khi lọc chuỗi và trích xuất các từ bỏ qua các dấu chấm câu. & nbsp;
Method #3 : Using regex() + string.punctuation 
This method also used regular expressions, but string function of getting all the punctuations is used to ignore all the punctuation marks and get the filtered result string.
 

Python3

import re
m = re.match('Job_Cluster_AK_Alaska_(.*).png')
print(m[1])
0
import re
m = re.match('Job_Cluster_AK_Alaska_(.*).png')
print(m[1])
1

test_string =

import re
m = re.match('Job_Cluster_AK_Alaska_(.*).png')
print(m[1])
4

test_string =

import re
m = re.match('Job_Cluster_AK_Alaska_(.*).png')
print(m[1])
4

print ("The original string is : " ________ 9 & nbsp;

s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
0

s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
1=
s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
3

print (

s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
6 ________ 9 & nbsp;
s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
8
s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])
9

Đầu ra: & nbsp; chuỗi gốc là: geeksforgeek là cổng thông tin khoa học máy tính tốt nhất & nbsp; danh sách các từ là: [' ; 
The original string is : Geeksforgeeks, is best @# Computer Science Portal.!!! 
The list of words is : [‘Geeksforgeeks’, ‘is’, ‘best’, ‘Computer’, ‘Science’, ‘Portal’] 
 


Tôi có một chuỗi print8

Từ chuỗi trên, tôi chỉ muốn trích xuất từ ​​sau từ này print9 và trước (0.

Vì vậy, về cơ bản tôi muốn trích xuất sau từ thứ tư được phân tách bằng dấu gạch dưới và cho đến từ trước .png

Tôi mới đến Regex.

Cuối cùng tôi chỉ muốn (1.

Hướng dẫn get specific word from string python - lấy từ cụ thể từ chuỗi python

HALFER

19.7K17 Huy hiệu vàng92 Huy hiệu bạc178 Huy hiệu đồng17 gold badges92 silver badges178 bronze badges

Đã hỏi ngày 21 tháng 1 năm 2019 lúc 14:06Jan 21, 2019 at 14:06

Hướng dẫn get specific word from string python - lấy từ cụ thể từ chuỗi python

6

Tôi nghĩ những gì bạn đang yêu cầu là một cái gì đó như thế này:

import os

# I think you will have different jobs/pngs, so pass these variables from somewhere
jobPrefix = 'Job_Cluster_AK_Alaska_'
pngString = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'

# Split filename/extension
pngTitle = os.path.splitext(pngString)[0]

# Get the filename without the jobPrefix
finalTitle = pngTitle[len(jobPrefix):]

Chỉnh sửa

Cố gắng tránh các biểu thức thông thường vì nói chung là chậm hơn nhiều so với việc cắt chuỗi

Đã trả lời ngày 21 tháng 1 năm 2019 lúc 14:32Jan 21, 2019 at 14:32

Hướng dẫn get specific word from string python - lấy từ cụ thể từ chuỗi python

PrainDpraindPraind

1.5011 Huy hiệu vàng12 Huy hiệu bạc25 Huy hiệu đồng1 gold badge12 silver badges25 bronze badges

Bạn có thể làm điều đó ngay cả khi không có Regex như vậy:

s = 'Job_Cluster_AK_Alaska_Yakutat_CDP.png'
print(s[len('Job_Cluster_AK_Alaska_'):-len('.png')])

Về bản chất ở đây, tôi lấy phần phụ bắt đầu ngay sau print9 và kết thúc trước (0.

Vẫn có lẽ là một cách tiếp cận Regex dễ đọc hơn và có thể duy trì hơn:

import re
m = re.match('Job_Cluster_AK_Alaska_(.*).png')
print(m[1])

Đã trả lời ngày 21 tháng 1 năm 2019 lúc 14:11Jan 21, 2019 at 14:11

Ivaylo strandjevivaylo strandjevIvaylo Strandjev

67.6K17 Huy hiệu vàng121 Huy hiệu bạc172 Huy hiệu đồng17 gold badges121 silver badges172 bronze badges

2

Làm cách nào để trích xuất một phần cụ thể của chuỗi trong Python?

Nhận một chuỗi con của một chuỗi đang trích xuất một phần của chuỗi từ một đối tượng chuỗi. Nó cũng được gọi là một hoạt động cắt lát. Bạn có thể nhận được chuỗi con của một chuỗi trong Python bằng tùy chọn STR [0: N].using the str[0:n] option.

Làm cách nào để trích xuất một từ cụ thể từ một chuỗi trong Python?

Để tìm một từ trong chuỗi, chúng tôi đang sử dụng các phương thức indexof () và chứa () của lớp chuỗi.Phương thức indexof () được sử dụng để tìm một chỉ mục của chuỗi con được chỉ định trong chuỗi hiện tại.Nó trả về một số nguyên dương dưới dạng một chỉ mục nếu cơ sở tìm thấy khác trả về -1.using indexOf() and contains() methods of String class. The indexOf() method is used to find an index of the specified substring in the present string. It returns a positive integer as an index if substring found else returns -1.

Làm cách nào để trích xuất một từ duy nhất từ một chuỗi?

Để có được từ đầu tiên của một chuỗi: gọi phương thức chia (), chuyển nó, một chuỗi chứa một khoảng trống dưới dạng tham số.Phương thức phân chia sẽ trả về một mảng chứa các từ trong chuỗi.Truy cập mảng tại chỉ mục 0 để có được từ đầu tiên của chuỗi.Call the split() method passing it a string containing an empty space as a parameter. The split method will return an array containing the words in the string. Access the array at index 0 to get the first word of the string.

Làm cách nào để tìm một từ cụ thể trong một tệp văn bản python?

Phương pháp 1: Tìm chỉ mục của chuỗi trong tệp văn bản bằng cách sử dụng readline () trong phương thức này, chúng tôi đang sử dụng hàm readline () và kiểm tra hàm find (), phương thức này trả về -1 nếu không tìm thấy giá trịvà nếu thấy nó trả về 0.Finding the index of the string in the text file using readline() In this method, we are using the readline() function, and checking with the find() function, this method returns -1 if the value is not found and if found it returns 0.