Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Show

Trong bài viết này, tôi sẽ chỉ cho bạn mọi cách trích xuất số, văn bản và dấu câu từ các chuỗi trong Google Sheets. Để làm điều này, chúng tôi sẽ chủ yếu sử dụng chức năng Regexreplace, mà bạn có thể sử dụng để thay thế / trích xuất nhiều loại ký tự từ dữ liệu của bạn.

Quá trình này đôi khi có thể gây nhầm lẫn khi tìm ra công thức chính xác thực hiện chính xác những gì bạn cần, và đây là lý do tại sao tôi đã cung cấp rất nhiều ví dụ và biến thể công thức khác nhau, ngoài các công thức mà tôi sẽ chứng minh trong các ví dụ chính.

Để trích xuất văn bản từ một chuỗi trong Google Sheets, hãy sử dụng hàm regexreplace, như thế này: = regexreplace (A3, "[^[: alpha:]]", "" ")

Để trích xuất các số từ một chuỗi trong Google Sheets, hãy sử dụng hàm regexreplace, như thế này: = value (regexreplace (A3, "[^[: Digit:]]", ""))

Các công thức để trích xuất trong Google Sheets:

Trích xuất số vào các cột riêng biệt

  • = Split (thấp hơn (A3), "

Trích xuất văn bản vào các cột riêng biệt

  • = Split (A3, "1234567890`-= [] \; ',./[Email & nbsp; được bảo vệ]#$%^&*()")

Trích xuất n ký tự bắt đầu từ ký tự thứ n

  • = Mid (A3,3,1)

Trích xuất các ký tự còn lại bắt đầu từ ký tự thứ n

  • =MID(A3,11,LEN(A3))

Trích xuất số từ một chuỗi

  • = Value (regexreplace (A3, "[^[: chữ số:]]", "")))

Trích xuất văn bản từ một chuỗi

  • = Regexreplace (A3, "[^[: alpha:]]", "")

Loại bỏ dấu câu

  • = Regexreplace (A3, "[[: punct:]]", "")

Trích xuất các ký tự trước một hậu tố

  • =REGEXEXTRACT(A3,"([[:print:]]+)Code")
  • = Trái (A3, Tìm kiếm ("Mã", A3) -1)

Trích xuất từ ​​/ tên đầu tiên

  • =REGEXEXTRACT(A3,"[^[:space:]]+")
  • = Trái (A3, Tìm ("", A3) -1)

Trích xuất ký tự đầu tiên

  • =REGEXEXTRACT(A3,"[^[:space:]]")(A3,"[^[:space:]]")

Trích xuất họ

  • = Right (A3, Len (A3) -find ("*", thay thế (A3, "", "*", len (A3) -Len (thay thế (A3, "", "")))))

Trích xuất từ ​​thứ n

  • = Index (chia (A3, ""), 1)

Trích xuất n ký tự từ bên trái / phải

  • =LEFT(A3,2)

Có nhiều công thức khác mà bạn sẽ học cách sử dụng trong suốt bài viết này, mà bạn có thể tìm thấy được liệt kê đầy đủ trên bảng gian lận trích xuất của mình.MANY MORE formulas that you will learn to use throughout this article, which you can find listed in full on your extraction cheat sheet.

Xem video dưới đây để đi qua một ví dụ về từng loại công thức.

Trong bài viết này, tôi đã sử dụng cùng một dữ liệu nguồn chính xác trong mọi ví dụ, để bạn có thể thấy mỗi công thức trích xuất này phản ứng như thế nào trong nhiều tình huống khác nhau và cũng để bạn có thể dễ dàng so sánh sự khác biệt tinh tế giữa các công thức tương tự mà không cần nguồn /Dữ liệu thô thay đổi mỗi lần. Do dữ liệu nguồn tương tự được sử dụng mỗi lần, dữ liệu này chứa nhiều kết hợp ký tự trong mỗi hàng/mục nhập, để đảm bảo rằng nhiều công thức được sử dụng trong bài viết này có thể được hiểu/áp dụng với cùng một bộ dữ liệu., so that you can see how each of these extraction formulas reacts in a variety of situations, and also so that you can easily compare the subtle differences between similar formulas without the source/raw data changing each time. Because the same source data is used every time, this data contains a wide variety of character combinations in each row/entry, to assure that the many formulas used in this article can be understood/applied with the very same set of data.

Một số chuỗi chỉ chứa văn bản, một số chỉ chứa các số mà nhiều người trong số chúng chứa nhiều dấu câu khác nhau và một số có chứa không gian.

Dưới đây là các chuỗi dữ liệu thô mà chúng tôi sẽ trích xuất từ ​​nhiều cách khác nhau trong bài học này, trong trường hợp bạn muốn sao chép/dán dữ liệu nguồn này vào trang của riêng bạn để bạn có thể làm theo các ví dụ và áp dụng từng công thức trên riêng để xem kết quả:

98g???3:74>
87Z25 1KH 111G 117%Mã
[Email & nbsp; được bảo vệ]# $%^&*fg_67___hi_89code
9-8-7-6-5-4-3-2-1
FirstName.LastName
Tên đầu tiên LastName
1 (555) 555-5555
abab90.90zyzy10.10ababCode
ABCDEFGHIJKLMNOP
123456789

Đối với mọi công thức được thảo luận trong các ví dụ trong bài viết này, công thức ban đầu được nhập vào ô C3 và sau đó được sao chép/điền xuống qua C12, do đó các công thức được áp dụng cho phạm vi C3: C12. Một lần nữa, điều này là để bạn có thể thấy các công thức này phản ứng trong nhiều tình huống khác nhau., so that the formulas are applied to the range C3:C12. Again, this is so that you can see these formulas reacting in a variety of situations.

.

Đây là lý do tại sao trong các ví dụ bạn sẽ thấy một số ô hiển thị lỗi khi một số công thức được áp dụng cho một số chuỗi/ô nhất định.

Bởi vì cùng một dữ liệu nguồn được sử dụng trong mỗi ví dụ sẽ có một số công thức không thể trích xuất dữ liệu được yêu cầu vì nó đơn giản là không có trong một ô nhất định đó.

Đừng lo lắng về những lỗi này trong các ví dụ, chỉ cần sử dụng chúng như một cơ hội khác để tìm hiểu cách các công thức phản ứng và sử dụng tình huống để hiểu rõ hơn loại dữ liệu/chuỗi mà công thức cụ thể có nghĩa là để xử lý.

Nếu bạn mong đợi trải nghiệm một số tình huống lỗi này với dữ liệu của riêng bạn, nơi bạn có thể có một vài hàng/mục không có bất kỳ dữ liệu phù hợp nào để trích xuất, thì bạn có thể chọn cách bạn muốn xử lý các lỗi đó cho các nhu cầu cụ thể của bạn Cho dù bạn quyết định bỏ qua chúng, hoặc xử lý chúng với hàm iferror hoặc để dọn dẹp dữ liệu của bạn để không xảy ra lỗi.

Một lưu ý về các phiên bản công thức trong bài viết này:

Bài viết này rất rộng, vì có nhiều cách khác nhau để trích xuất trong Google Sheets. Nếu bạn đang tìm kiếm một công thức thực hiện một nhiệm vụ cụ thể, bạn có thể muốn tìm kiếm một công thức làm những gì bạn muốn và tránh những người khác, để tránh sự nhầm lẫn.

Nếu bạn đang muốn học từng phương pháp này, hãy dành thời gian của bạn vì có thể mất nhiều phiên để thành thạo bài học này về trích xuất.

Có rất nhiều ví dụ bao gồm, và với nhiều ví dụ tôi đã bao gồm một số biến thể của các công thức thực hiện các nhiệm vụ tương tự với những khác biệt quan trọng.

Tôi cũng đã bao gồm các công thức bổ sung thực hiện cùng một nhiệm vụ, nhưng được viết khác nhau. Điều này rất quan trọng vì hai lý do:

#1 Bạn có thể chạy qua nhiều biến thể của các công thức này trên Internet và bạn sẽ muốn làm quen với chúng để bạn không bị nhầm lẫn. You may run across multiple variations of these formulas on the internet, and you'll want to be familiar with them so you don't get confused.

#2 Một số biến thể này có thể trực quan hơn với bạn và linh hoạt hơn để làm việc với những người khác và vì vậy khi bạn bắt đầu hiểu cách các công thức hoạt động, bạn có thể bắt đầu tự tùy chúng. Some of these variations may be more intuitive to you and more flexible to work with than others… and so as you begin to understand how the formulas operate you can begin to customize them yourself.

Sử dụng các chức năng RegexexTract và Regexreplace

Trong bài viết này, chúng tôi sẽ sử dụng các chức năng RegexexTract và Regexreplace rộng rãi (mặc dù không độc quyền), để trích xuất từ ​​các chuỗi trong Google Sheets.REGEXEXTRACT and REGEXREPLACE functions extensively (although not exclusively), to extract from strings in Google Sheets.

RegExexTract cho phép chúng tôi trích xuất một loại ký tự được chỉ định, trong đó Regexreplace cho phép chúng tôi thay thế một loại ký tự được chỉ định bằng một chuỗi được chỉ định/trống (về cơ bản là một cách trích xuất khác, ngoại trừ ngược). (which is basically another way of extracting, except backwards).

Ví dụ: giả sử chúng ta có chuỗi ABC123. Nếu chúng tôi trích xuất văn bản, chúng tôi sẽ bị bỏ lại với các chữ cái ABC. Nếu chúng ta thay thế các số bằng một chuỗi trống, một lần nữa chúng ta sẽ bị bỏ lại với các chữ cái ABC.

Regexreplace sẽ cho phép chúng tôi thay thế/trích xuất tất cả văn bản, số hoặc ký tự đặc biệt từ một chuỗi, trong đó RegExexTract sẽ cho phép chúng tôi trích xuất các chuỗi con của văn bản, số và ký tự đặc biệt.

Nói cách khác, Regexreplace có thể được sử dụng để trích xuất/thay thế mọi thể hiện của loại ký tự được chỉ định được tìm thấy trong một chuỗi, trong đó hàm regexextract có thể được sử dụng để trích xuất các phần của chuỗi nguồn trong đó các ký tự được chỉ định xuất hiện liên tiếp.

.

So sánh hai chức năng dưới đây, chúng tôi sẽ sử dụng rất nhiều trong bài viết này để đạt được nhiều loại trích xuất khác nhau.

Mô tả chức năng của Google Sheets Regexreplace:

Cú pháp: regexreplace (văn bản, thông thường_expression, thay thế)
REGEXREPLACE(text, regular_expression, replacement)

Tóm tắt công thức: Thay thế một phần của chuỗi văn bản bằng một chuỗi văn bản khác bằng cách sử dụng các biểu thức thông thường. “Replaces part of a text string with a different text string using regular expressions.”

Mô tả chức năng của Google Sheets RegExexTract:

Cú pháp: regexextract (văn bản, thông thường_expression)
REGEXEXTRACT(text, regular_expression)

Tóm tắt công thức: Trích xuất các phần khớp nối theo một biểu thức thông thường. “Extracts matching substrings according to a regular expression.”

Biểu thức chính quy trong các hàm regexreplace / regexextract:

Bạn sẽ nhận thấy rằng những gì tạo ra tất cả sự khác biệt trong cách hai công thức này hoạt động, là "các biểu thức chính quy" trong mỗi công thức.

Một biểu thức thông thường cho phép chúng tôi chỉ định loại ký tự nào chúng tôi muốn chỉ định trong công thức của chúng tôi (tức là văn bản, số, v.v.), bằng cách sử dụng cái được gọi là "lớp ký tự".

Google Sheets cung cấp một số cách viết các biểu thức/ lớp ký tự khác nhau thực hiện các chức năng giống nhau và vì vậy đây là lý do tại sao bạn sẽ thấy các công thức trông khác nhau nhưng làm điều tương tự.

Ví dụ: biểu thức [0-9] giống như biểu thức [[: Digit:]] giống như biểu thức \ d (phiên bản tốc ký).

Chúng tôi sẽ sử dụng các phiên bản không viết tắt của các lớp biểu thức/ ký tự trong bài viết này cho các ví dụ, bởi vì mặc dù các phiên bản tốc ký là phổ biến trên internet, nhưng không có phiên bản ngắn cho mỗi lớp nhân vật và một số trong số đó Các lớp ký tự không có phiên bản ngắn là rất quan trọng., because even though the shorthand versions are popular across the internet, there is not a short-hand version for every character class, and some of those characters classes without a short-hand version are very important.

Dưới đây tôi sẽ liệt kê một số lớp ký tự và loại ký tự nào mà mỗi người thể hiện. Lưu ý rằng khi sử dụng hầu hết các "lớp ký tự" như [: Digit:], nó phải được đặt bên trong một bộ dấu ngoặc thứ hai khi được sử dụng làm biểu thức trong công thức, như [[: Digit:]]. Điều này có thể gây nhầm lẫn vì một số lớp ký tự như [A-A-Z] và [0-9] không yêu cầu dấu ngoặc kép.Note that when using most "character classes" such as [:digit:], it must be put inside a second set of brackets when used as an expression in the formula, like [[:digit:]]. This can be confusing because some character classes like [a-zA-Z] and [0-9] do not require double brackets.

Nội dung này ban đầu được tạo và viết bởi bảng tínhClass.com

Các lớp ký tự cho regexreplace và regexextract:

Ký tự bảng chữ cái (chữ cái): [: alpha:] & nbsp; ~ & nbsp; & nbsp; [a-za-z]
[:alpha:]  ~   [a-zA-Z]

Chữ số: [: chữ số:] & nbsp; ~ & nbsp; & nbsp; [0-9] & nbsp; & nbsp; ~ & nbsp; & nbsp; \ d
[:digit:]  ~   [0-9]   ~   \d

Ký tự chữ và số (chữ cái hoặc chữ số): [: alnum:] & nbsp; & nbsp; ~ & nbsp; & nbsp; [A-A-Z0-9]
[:alnum:]   ~   [a-zA-Z0-9]

Ký tự từ (chữ cái, chữ số và dấu gạch dưới): [: word:] ~ & nbsp; & nbsp; \ w
[:word:] ~   \w

Dấu câu (ký tự/ký hiệu đặc biệt)): [: chấm câu:]
[:punct:]

Ký tự có thể nhìn thấy (không có khoảng trắng): [: đồ thị:]
[:graph:]

Ký tự có thể nhìn thấy (bao gồm không gian): [: in:]
[:print:]

Ký tự khoảng trắng (không gian, tab, v.v.): [: không gian:] & nbsp; ~ & nbsp; & nbsp; \ s
[:space:]  ~   \s

Bao gồm một dấu cộng (+) với các lớp ký tự

Ngoài ra, điều rất quan trọng cần lưu ý là khi sử dụng regexextract, nếu bạn muốn hiển thị nhiều hơn một ký tự trong kết quả trích xuất của mình, bạn phải đặt một dấu cộng sau biểu thức thông thường, như \ d+hoặc [: chữ số:]] +.

Nếu bạn không bao gồm một dấu cộng sau khi biểu thức, chỉ có một ký tự có thể xuất hiện trong đầu ra (có thể là những gì bạn muốn trong một số trường hợp).

Tuy nhiên, nếu bạn muốn hiển thị nhiều hơn một ký tự trong kết quả của mình, thì thực tế là bao gồm một dấu cộng với các biểu thức của bạn. Ngay cả trong các tình huống khi sử dụng Regexreplace, nơi bạn không phải lúc nào cũng cần bao gồm một dấu cộng để xuất nhiều hơn một ký tự, nó sẽ không ảnh hưởng tiêu cực đến công thức của bạn để bao gồm nó.

Bao gồm một không gian với các lớp nhân vật

Bao gồm một không gian ở vị trí chính xác trong một số biểu thức nhất định có thể tạo ra sự khác biệt lớn trong đầu ra được tạo ra bởi công thức, trong đó bao gồm một không gian sẽ chỉ định rằng không gian phải là một ký tự trong biểu thức.

Ví dụ: công thức = regexreplace (c8, "[^a-za-z]", "") sẽ chỉ trả về văn bản, không có khoảng trắng. Tuy nhiên, công thức = regexreplace (c8, "[^a-za-z]", "") có không gian được thêm vào trước khung đóng, sẽ trả về bất kỳ văn bản nào, bao gồm cả khoảng trắng.

Khi bao gồm một không gian trong các biểu thức có một bộ dấu ngoặc, không gian đi vào bên trong khung bên phải (như hiển thị ở trên).

Khi thêm một không gian vào một biểu thức có dấu ngoặc kép (không giống như dấu cộng được đề cập trước đó đi bên ngoài cả hai giá đỡ), không gian đi giữa hai giá đỡ ở phía bên phải, như thế này [[: Digit:]].

Bao gồm một củ cà rốt (^) với các lớp nhân vật

Trong nhiều trường hợp khi cố gắng chỉ định tập hợp các ký tự chính xác, bạn sẽ cần sử dụng ký hiệu cà rốt (^) để khớp các ký tự không nằm trong một lớp ký tự nhất định.

Ví dụ: để chỉ định bất kỳ ký tự nào là số bạn sẽ sử dụng biểu thức [[: Digit:]], nhưng nếu bạn muốn chỉ định tất cả các ký tự không phải là số (bao gồm cả văn bản và ký tự đặc biệt), bạn sẽ đặt một củ cà rốt vào Biểu thức, như thế này [^[: Digit:]].

Khi sử dụng một củ cà rốt có biểu thức có dấu ngoặc kép, cà rốt đi giữa hai giá đỡ ở phía bên trái (như hiển thị ở trên).

Khi sử dụng một củ cà rốt có biểu thức có một bộ ngoặc, cà rốt đi vào bên trong khung bên trái, như thế này [^0-9].

Đối với các phiên bản tốc ký của các lớp ký tự, thay vì sử dụng cà rốt, chữ cái trong biểu thức được chuyển đổi đơn giản từ chữ thường sang chữ hoa, chẳng hạn như (\ d) (\ d).

*Hãy nhớ sử dụng một dấu gạch chéo lùi (\) với các lớp tốc ký, thay vì một dấu gạch chéo phía trước.

Văn bản so với hiệu ứng định dạng số

Đối với nhiều công thức trong bài viết này, dữ liệu nguồn không được định dạng số để công thức hoạt động chính xác. Đây thường là mặc định khi bạn mở một bảng mới và dữ liệu đầu vào và không phải là vấn đề đối với bất kỳ chuỗi nào đã có giá trị không số trong đó, tuy nhiên với một chuỗi chỉ có số "số đó có thể cho" số "đó Chuỗi ở định dạng văn bản đơn giản hoặc số thực.the source data must NOT be in number format for the formula to work properly. This is usually the default when you open a new sheet and input data, and should not be a problem for any string that already has a non-number value in it… however with a string of only numbers it is possible for that "number" string to be in either plain text or actual number format.

Khi cố gắng trích xuất từ ​​một chuỗi các số được nhập vào một ô ở định dạng số thực (thường khiến các số thẳng hàng bên phải), công thức thường sẽ gây ra lỗi. Bạn có thể thấy điều này trong nhiều ví dụ trong suốt bài viết này, trong hàng 12, trong đó chuỗi "123456789" được liệt kê ở định dạng số và hầu như luôn khiến công thức hiển thị thông báo lỗi. Nếu chuỗi số này ở định dạng văn bản đơn giản (điều này sẽ khiến chúng căn chỉnh sang trái), thì nhiều công thức sẽ thực sự hoạt động trên chuỗi này thay vì đưa ra thông báo lỗi.

Hiển thị/hiểu những hạn chế của các công thức này là một phần quan trọng khác để hiểu cách trích xuất trong Google Sheets

Trích xuất văn bản, số, v.v ... trong Google Sheets

Vì vậy, hãy bắt đầu với việc tìm hiểu nhiều công thức mà bạn có thể sử dụng để trích xuất theo nhiều cách khác nhau trong Google Sheets.

Trích xuất số vào các cột riêng biệt

Đầu tiên tôi sẽ chỉ cho bạn cách trích xuất các số từ một chuỗi bằng cách sử dụng chức năng phân chia, trong đó mọi phần phụ của các số liên tiếp được tìm thấy trong chuỗi ban đầu sẽ được hiển thị/chiếu thành các cột riêng lẻ. Nói cách khác, bạn sẽ chỉ còn lại với các số trong kết quả của mình, nhưng chúng sẽ được chia thành các cột riêng lẻ nơi mỗi lần xuất hiện của những người không phải là người.

Nếu bạn muốn sử dụng chức năng phân chia để trích xuất các số nhưng muốn thu thập các số vào một cột, (trong trường hợp bạn thích chức năng phân chia và chưa thoải mái với một số công thức bên dưới), thì bạn có thể kết hợp các cột từ kết quả "chia" bằng cách sử dụng hàm mảng.combine the columns from the "split" results by using the ARRAYFORMULA function.

Khi sử dụng hàm phân chia để trích xuất các giá trị mà chúng tôi muốn, chúng tôi phải nêu các giá trị mà chúng tôi không muốn trong công thức và vì vậy khi trích xuất các số, điều này có nghĩa là chúng tôi phải bao gồm tất cả các ký tự văn bản trong các tiêu chí công thức (cũng như Các ký tự dấu câu giả định dữ liệu nguồn của bạn có thể có ký tự đặc biệt).

Vì đối với mục đích này, chữ thường và chữ in hoa được đối xử khác nhau, chúng tôi phải bao gồm cả phiên bản viết thường và chữ hoa của văn bản theo tiêu chí của chúng tôi, để đảm bảo rằng chúng tôi chỉ trích xuất số.

Để làm điều này, chúng tôi có thể nhập thủ công phiên bản chữ hoa/trên của mỗi chữ cái hoặc chúng tôi có thể bọc phạm vi nguồn ở hàm thấp hơn, để chúng tôi có thể chỉ cần bao gồm các phiên bản chữ thường của các chữ cái trong tiêu chí. Trong ví dụ chúng tôi đã sử dụng hàm thấp hơn, nhưng tôi cũng đã bao gồm phiên bản mà không có nó để tham khảo, bên dưới.

Nhiệm vụ: Chỉ trích xuất số từ một chuỗi văn bản và số, và chia các số liên tiếp thành các cột riêng biệt Extract numbers only from a string of text and numbers, and split the consecutive numbers into separate columns

Logic: Chia các ô trong phạm vi A3: A12, bằng bất kỳ ký tự văn bản hoặc dấu chấm câu nào. Bao bọc hàm thấp hơn xung quanh phạm vi nguồn để đảm bảo rằng các chữ in hoa không bị bỏ qua. Split the cells in the range A3:A12, by any text or punctuation character. Wrap the LOWER function around the source range to assure that capital letters are not ignored.

Công thức: Công thức bên dưới, được nhập vào các ô màu xanh trong phạm vi C3: C12, cho ví dụ này The formula below, is entered in the blue cells in the range C3:C12, for this example

= Split (thấp hơn (A3), "

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Nhiều công thức hơn:

Dưới đây là nhiều công thức thực hiện một nhiệm vụ tương tự/chính xác như công thức được thể hiện trong ví dụ trên.

Các cách khác để viết công thức trong ví dụ trên:

= Split (A3, "

Trích xuất văn bản vào các cột riêng biệt

Ở đây chúng ta sẽ sử dụng chức năng chia tách một lần nữa như trong ví dụ trên, nhưng lần này chúng ta sẽ trích xuất văn bản thay vì số.

Lần này có rất ít ký tự được gõ vào tiêu chí phân chia, vì có ít chữ số hơn nhiều so với các chữ cái.

Nhiệm vụ: Chỉ trích xuất văn bản từ một chuỗi văn bản và số, và chia các ký tự văn bản liên tiếp thành các cột riêng biệt Extract text only from a string of text and numbers, and split the consecutive text characters into separate columns

Logic: Chia các ô trong phạm vi A3: A12, theo bất kỳ số hoặc ký tự dấu câu nào. Split the cells in the range A3:A12, by any number or punctuation character.

Công thức: Công thức bên dưới, được nhập vào các ô màu xanh trong phạm vi C3: C12, cho ví dụ này The formula below, is entered in the blue cells in the range C3:C12, for this example

= Split (thấp hơn (A3), "

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Nhiều công thức hơn:

Dưới đây là nhiều công thức thực hiện một nhiệm vụ tương tự/chính xác như công thức được thể hiện trong ví dụ trên.

Các cách khác để viết công thức trong ví dụ trên:

= Split (A3, "

Trích xuất văn bản vào các cột riêng biệt
MID(string, starting_at, extract_length)

Ở đây chúng ta sẽ sử dụng chức năng chia tách một lần nữa như trong ví dụ trên, nhưng lần này chúng ta sẽ trích xuất văn bản thay vì số. “Returns a segment of a string.”

Lần này có rất ít ký tự được gõ vào tiêu chí phân chia, vì có ít chữ số hơn nhiều so với các chữ cái.As mentioned above, this is the raw source data that we will be using in every example for the rest of the article.

Nhiệm vụ: Chỉ trích xuất văn bản từ một chuỗi văn bản và số, và chia các ký tự văn bản liên tiếp thành các cột riêng biệt Extract the third character from each cell/string

Logic: Chia các ô trong phạm vi A3: A12, theo bất kỳ số hoặc ký tự dấu câu nào. Extract one character, starting at the third character, from the strings in each cell in the range A3:A12

= Split (A3, "1234567890`-= [] \; ',./[Email & nbsp; được bảo vệ]#$%^&*()") The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

=MID(A3,3,1)

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Nhiều công thức hơn:

Dưới đây là nhiều công thức thực hiện một nhiệm vụ tương tự/chính xác như công thức được thể hiện trong ví dụ trên.

Các cách khác để viết công thức trong ví dụ trên:

  • = Split (A3, "
  • Trích xuất văn bản vào các cột riêng biệt
  • Ở đây chúng ta sẽ sử dụng chức năng chia tách một lần nữa như trong ví dụ trên, nhưng lần này chúng ta sẽ trích xuất văn bản thay vì số.
  • Lần này có rất ít ký tự được gõ vào tiêu chí phân chia, vì có ít chữ số hơn nhiều so với các chữ cái.
  • Nhiệm vụ: Chỉ trích xuất văn bản từ một chuỗi văn bản và số, và chia các ký tự văn bản liên tiếp thành các cột riêng biệt
  • Logic: Chia các ô trong phạm vi A3: A12, theo bất kỳ số hoặc ký tự dấu câu nào.
  • = Split (A3, "1234567890`-= [] \; ',./[Email & nbsp; được bảo vệ]#$%^&*()")
  • Trích xuất n ký tự bắt đầu từ ký tự thứ n
  • Trước khi chúng tôi bắt đầu trích xuất đầy đủ các chuỗi văn bản/số, v.v., hãy đi qua hàm giữa.
  • = Mid ((regexreplace (a3, "[a-za-z]", "")), 3,1)-trích xuất n không có chữ
  • = Mid ((regexreplace (A3, "[[: alnum:]]"
  • = Mid ((regexreplace (a3, "[a-za-z0-9]"
  • = Mid ((regexreplace (a3, "[^[: punct:]]"
  • = Mid ((regexreplace (a3, "[[: word:]]"
  • = Mid ((regexreplace (a3, "\ w", "")), 3,1) - trích xuất các ký tự dấu câu N bắt đầu từ ký tự dấu câu thứ n (bao gồm không gian nhưng không nhấn mạnh)
  • = Mid ((regexreplace (a3, "[[: punct:]]"
  • = Mid ((regexreplace (a3, "[^[: alnum:]]"
  • = Mid ((regexreplace (a3, "[^a-za-z0-9]"
  • = Mid ((regexreplace (a3, "[^[: word:]]" gạch dưới là)
  • = Mid ((regexreplace (A3, "\ w", "")), 3,1) (không gian/dấu gạch nối không bao gồm nhưng nhấn mạnh là)

Trích xuất các ký tự còn lại bắt đầu từ ký tự thứ n

Trong ví dụ này, chúng tôi sẽ sử dụng hàm MID cùng với hàm LEN, để trích xuất các ký tự còn lại trong một chuỗi bắt đầu ở một ký tự/vị trí được chỉ định.

Lưu ý rằng đối với các chuỗi có ít hơn 11 ký tự, công thức sẽ xuất ra một chuỗi trống.

Nhiệm vụ: Trích xuất các ký tự còn lại từ mỗi ô/chuỗi, bắt đầu từ ký tự thứ 11 Extract the remaining characters from each cell/string, starting at the 11th character

Logic: Bắt đầu từ ký tự thứ 11, trích xuất các ký tự còn lại từ mỗi ô trong phạm vi A3: A12 Starting at the 11th character, extract the remaining characters from each cell in the range A3:A12

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, và sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

=MID(A3,11,LEN(A3))

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Bây giờ chúng tôi cuối cùng sẽ bắt đầu sử dụng hàm regexreplace, để trích xuất toàn bộ chuỗi văn bản, số và các loại ký tự được chỉ định khác.

Để giải thích chuyên sâu về cách sử dụng các hàm regexreplace và regexextract, hãy quay lại đầu trang để biết nhiều thông tin. Nhưng ở đây chúng tôi sẽ chỉ đơn giản là sử dụng các chức năng theo nhiều cách khác nhau.

Trong ví dụ này, tôi sẽ chỉ cho bạn cách trích xuất các số từ một chuỗi trong Google Sheets, bằng cách thay thế bất kỳ ký tự nào không phải là một số, không có gì/ một chuỗi trống.

*Trong ví dụ cụ thể này, chúng tôi cũng đang sử dụng hàm giá trị, để đảm bảo rằng các số chúng tôi đang trích xuất ở định dạng số.

Mặc dù chúng tôi đang hiển thị các số trong đầu ra công thức của mình, công thức dự kiến ​​văn bản sẽ nằm trong đầu vào, vì vậy hãy lưu ý rằng trong hàng 12, công thức dẫn đến lỗi vì đầu vào cho mục đó chỉ là số nhưng cụ thể hơn là ở định dạng số (do đó liên kết đúng). Nếu cùng một chuỗi chính xác này (123456789) chỉ đơn giản được thay đổi thành định dạng văn bản đơn giản, công thức sẽ xuất ra toàn bộ chuỗi.

Nhiệm vụ: Trích xuất các số từ & nbsp; mỗi ô/chuỗi Extract the numbers from each cell/string

Logic: Trích xuất các số từ mỗi ô trong phạm vi A3: A12, bằng cách thay thế bất kỳ chữ số nào bằng một chuỗi trốngExtract the numbers from each cell in the range A3:A12, by replacing any non-digit with an empty string

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, và sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

Bây giờ chúng tôi cuối cùng sẽ bắt đầu sử dụng hàm regexreplace, để trích xuất toàn bộ chuỗi văn bản, số và các loại ký tự được chỉ định khác.

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Để giải thích chuyên sâu về cách sử dụng các hàm regexreplace và regexextract, hãy quay lại đầu trang để biết nhiều thông tin. Nhưng ở đây chúng tôi sẽ chỉ đơn giản là sử dụng các chức năng theo nhiều cách khác nhau.

Trong ví dụ này, tôi sẽ chỉ cho bạn cách trích xuất các số từ một chuỗi trong Google Sheets, bằng cách thay thế bất kỳ ký tự nào không phải là một số, không có gì/ một chuỗi trống.

*Trong ví dụ cụ thể này, chúng tôi cũng đang sử dụng hàm giá trị, để đảm bảo rằng các số chúng tôi đang trích xuất ở định dạng số.

  • Mặc dù chúng tôi đang hiển thị các số trong đầu ra công thức của mình, công thức dự kiến ​​văn bản sẽ nằm trong đầu vào, vì vậy hãy lưu ý rằng trong hàng 12, công thức dẫn đến lỗi vì đầu vào cho mục đó chỉ là số nhưng cụ thể hơn là ở định dạng số (do đó liên kết đúng). Nếu cùng một chuỗi chính xác này (123456789) chỉ đơn giản được thay đổi thành định dạng văn bản đơn giản, công thức sẽ xuất ra toàn bộ chuỗi.
  • Nhiệm vụ: Trích xuất các số từ & nbsp; mỗi ô/chuỗi

Logic: Trích xuất các số từ mỗi ô trong phạm vi A3: A12, bằng cách thay thế bất kỳ chữ số nào bằng một chuỗi trống

  • = Value (regexreplace (A3, "[^[: chữ số:]]", "")))
  • Nhiều công thức hơn:
  • Dưới đây là nhiều công thức thực hiện một nhiệm vụ tương tự/chính xác như công thức được thể hiện trong ví dụ trên.
  • Các cách khác để viết công thức trong ví dụ trên:

= Value (regexreplace (A3, "[^0-9]", "")))

= Value (regexreplace (a3, "\ d", "")))

Công thức tương tự:

= RegexexTract (a3, "(\ d+\.? \ D+)") - trích xuất số với số thập phân

Nhiệm vụ: Trích xuất văn bản từ mỗi ô/chuỗi Extract the text from each cell/string

Logic: Trích xuất văn bản từ mỗi ô trong phạm vi A3: A12, bằng cách thay thế bất kỳ ký tự không văn bản nào bằng một chuỗi trốngExtract the text from each cell in the range A3:A12, by replacing any non-text character with an empty string

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, và sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

= Regexreplace (A3, "[^[: alpha:]]", "")

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Nhiều công thức hơn:

Dưới đây là nhiều công thức thực hiện một nhiệm vụ tương tự/chính xác như công thức được thể hiện trong ví dụ trên.

Các cách khác để viết công thức trong ví dụ trên:

  • = Regexreplace (a3, "[^a-za-z]", "")

Công thức tương tự:

  • = Regexreplace (A3, "[[: alpha:]]", "")-trích xuất các ký tự không phải là văn bản
  • = Regexreplace (a3, "[a-za-z]", "")-trích xuất các ký tự không phải là văn bản

Cách xóa dấu câu từ chuỗi trong Google Sheets

Bây giờ tôi sẽ chỉ cho bạn cách xóa dấu câu từ các chuỗi trong Google Sheets, hay nói cách khác là cách trích xuất các ký tự không có dấu chấm câu.

Nhiệm vụ: Xóa dấu câu từ mỗi ô/chuỗi Remove the punctuation from each cell/string

Logic: Xóa dấu câu từ mỗi ô trong phạm vi A3: A12, bằng cách thay thế bất kỳ ký tự không có thời gian nào bằng một chuỗi trống Remove the punctuation from each cell in the range A3:A12, by replacing any non-punctuation character with an empty string

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, và sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

= Regexreplace (A3, "[^[: alpha:]]", "")

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Nhiều công thức hơn:

Dưới đây là nhiều công thức thực hiện một nhiệm vụ tương tự/chính xác như công thức được thể hiện trong ví dụ trên.

Công thức tương tự:

  • = Regexreplace (A3, "[[: alpha:]]", "")-trích xuất các ký tự không phải là văn bản
  • = Regexreplace (a3, "[a-za-z]", "")-trích xuất các ký tự không phải là văn bản
  • Cách xóa dấu câu từ chuỗi trong Google Sheets
  • Bây giờ tôi sẽ chỉ cho bạn cách xóa dấu câu từ các chuỗi trong Google Sheets, hay nói cách khác là cách trích xuất các ký tự không có dấu chấm câu.
  • Nhiệm vụ: Xóa dấu câu từ mỗi ô/chuỗi
  • Logic: Xóa dấu câu từ mỗi ô trong phạm vi A3: A12, bằng cách thay thế bất kỳ ký tự không có thời gian nào bằng một chuỗi trống
  • = Regexreplace (A3, "[[: punct:]]", "")
  • = Regexreplace (A3, "[^[: alnum:]]", "") - xóa dấu câu (và không gian)
  • = Regexreplace (a3, "[^a-za-z0-9]", "")-xóa dấu câu (và không gian)

= Regexreplace (a3, "[^[: word:]]", "") - loại bỏ dấu câu (và không gian, nhưng không nhấn mạnh)

= Regexreplace (A3, "\ w", "") - xóa dấu câu (và không gian, nhưng không nhấn mạnh)

= Regexreplace (A3, "[[: alnum:]]", "") - trích đoạn trích đoạn (bao gồm không gian)

= Regexreplace (A3, "[A-A-Z0-9]", "")-Trích xuất dấu câu (bao gồm không gian) Extract the characters before a suffix, from each cell/string

= Regexreplace (a3, "[^[: punct:]]", "") - trích đoạn dấu câu (không bao gồm không gian)Extract a string of characters before the suffix "Code", from each cell in the range A3:A12, by specifying a suffix after the character class, in the REGEXEXTRACT regular expression

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, và sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

=REGEXEXTRACT(A3,"([[:print:]]+)Code")

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Nhiều công thức hơn:

Dưới đây là nhiều công thức thực hiện một nhiệm vụ tương tự/chính xác như công thức được thể hiện trong ví dụ trên.

Công thức tương tự:

  • = Regexreplace (A3, "[[: alpha:]]", "")-trích xuất các ký tự không phải là văn bản

= Regexreplace (a3, "[a-za-z]", "")-trích xuất các ký tự không phải là văn bản

Cách xóa dấu câu từ chuỗi trong Google Sheets

Bây giờ tôi sẽ chỉ cho bạn cách xóa dấu câu từ các chuỗi trong Google Sheets, hay nói cách khác là cách trích xuất các ký tự không có dấu chấm câu.

Nhiệm vụ: Xóa dấu câu từ mỗi ô/chuỗi Extract the characters that are found before a specified suffix, from each cell/string

Logic: Xóa dấu câu từ mỗi ô trong phạm vi A3: A12, bằng cách thay thế bất kỳ ký tự không có thời gian nào bằng một chuỗi trống Extract a string of characters before the suffix "Code", from each cell in the range A3:A12, by using the SEARCH function to locate the position of a suffix and therefore provide the number of characters to extract with the LEFT function.

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, và sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

= Regexreplace (A3, "[[: punct:]]", "")

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

= Regexreplace (A3, "[^[: alnum:]]", "") - xóa dấu câu (và không gian)

= Regexreplace (a3, "[^a-za-z0-9]", "")-xóa dấu câu (và không gian)

= Regexreplace (a3, "[^[: word:]]", "") - loại bỏ dấu câu (và không gian, nhưng không nhấn mạnh) Extract the first name from each cell/string

= Regexreplace (A3, "\ w", "") - xóa dấu câu (và không gian, nhưng không nhấn mạnh)Extract the first word/name (1st string of characters before a space), from each cell in the range A3:A12, by extracting a string of non-space characters found before the first space

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, và sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

=REGEXEXTRACT(A3,"[^[:space:]]+")

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Nhiều công thức hơn:

Dưới đây là nhiều công thức thực hiện một nhiệm vụ tương tự/chính xác như công thức được thể hiện trong ví dụ trên.

Các cách khác để viết công thức trong ví dụ trên:

  • = RegexexTract (A3, "\ s+")
  • =REGEXEXTRACT(A3,"[[:graph:]]+")

Công thức tương tự:

  • = RegexexTract (A3, "[[: Digit:]]+") - Trích xuất chuỗi số đầu tiên
  • = RegexexTract (A3, "[0-9]+")-trích xuất chuỗi số đầu tiên
  • = RegexexTract (a3, "\ d+") - trích xuất chuỗi số đầu tiên
  • = RegexexTract (A3, "[^[: Digit:]]+")-trích xuất chuỗi không số đầu tiên
  • = RegexexTract (A3, "[^0-9]+")-trích xuất chuỗi không số đầu tiên
  • = RegexexTract (A3, "\ d+")-trích xuất chuỗi không số đầu tiên
  • = RegexexTract (A3, "[[: alpha:]]+") - trích xuất chuỗi văn bản đầu tiên
  • = RegexexTract (A3, "[a-za-z]+")-trích xuất chuỗi văn bản đầu tiên
  • = RegexexTract (A3, "[^[: alpha:]]+")-trích xuất chuỗi không phải văn bản đầu tiên
  • = RegexexTract (a3, "[^a-za-z]+")-trích xuất chuỗi không phải văn bản đầu tiên
  • = RegexexTract (A3, "[[: alnum:]]+")-trích xuất chuỗi không có thời gian đầu tiên (không bao gồm khoảng trắng)
  • = RegexexTract (A3, "[A-A-Z0-9]+")-Trích xuất chuỗi không có thời gian đầu tiên (không bao gồm khoảng trắng)
  • = RegexexTract (A3, "[^[: punct:]]+")-trích xuất chuỗi không có thời gian đầu tiên (bao gồm không gian)
  • = RegexexTract (A3, "[[: word:]]
  • = RegexexTract (A3, "\ w+")-trích xuất chuỗi không có thời gian đầu tiên (không gian/dấu gạch nối không bao gồm nhưng dấu gạch dưới)
  • = RegexexTract (A3, "[^[: alnum:]]+") - trích xuất chuỗi dấu chấm câu đầu tiên (bao gồm không gian)
  • = RegexexTract (a3, "[^a-za-z0-9]+")-trích xuất chuỗi dấu chấm câu đầu tiên (bao gồm khoảng trống)
  • = RegexexTract (A3, "[[: punct:]]+")- trích xuất chuỗi dấu chấm câu đầu tiên (không bao gồm khoảng trống)
  • = RegexexTract (A3, "[^[: word:]]")- trích xuất chuỗi dấu chấm câu đầu tiên (không bao gồm dấu gạch dưới)
  • = RegexexTract (A3, "\ w+")- trích xuất chuỗi dấu chấm câu đầu tiên (không bao gồm dấu gạch dưới)

Trích xuất tên đầu tiên/Word- Phần 2

Trong ví dụ này, tôi sẽ chỉ cho bạn một cách khác để trích xuất tên/từ đầu tiên trong Google Sheets, bằng cách sử dụng bên trái và tìm các chức năng. Điều này sẽ cho bạn thấy chuỗi ký tự đầu tiên xuất hiện trước không gian đầu tiên.

Lưu ý rằng công thức này sẽ chỉ hoạt động trên các chuỗi có không gian bên trong chúng. Cũng lưu ý rằng trong hàng 5 trong đó không gian là ký tự/vị trí đầu tiên trong một chuỗi, công thức xuất ra một chuỗi trống.

Nhiệm vụ: Trích xuất từ ​​đầu tiên từ mỗi ô/chuỗi Extract the first word from each cell/string

Logic: Trích xuất từ ​​đầu tiên (tức là tên) từ mỗi ô trong phạm vi A3: A12, bằng cách sử dụng hàm tìm để cung cấp các tiêu chí cho hàm bên tráiExtract the first word (i.e. name) from each cell in the range A3:A12, by using the FIND function to provide the criteria for the LEFT function

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, và sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

= Trái (A3, Tìm ("", A3) -1)

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Trích xuất ký tự đầu tiên từ một chuỗi

Trong ví dụ này, tôi sẽ chỉ cho bạn cách trích xuất ký tự đầu tiên từ một chuỗi trong Google Sheets. Bạn sẽ nhận thấy rằng công thức này gần giống với một công thức đã được sử dụng trước đây trong bài viết để trích xuất tên đầu tiên nhưng lưu ý rằng trong ví dụ này không có dấu cộng nào được sử dụng trong lớp ký tự, điều đó có nghĩa là chỉ có một ký tự sẽ là được trích xuất bởi hàm regexextract.

Nhiệm vụ: Trích xuất ký tự đầu tiên từ mỗi ô/chuỗi Extract the first character from each cell/string

Logic: Trích xuất ký tự đầu tiên từ mỗi ô trong phạm vi A3: A12, bằng cách trích xuất ký tự không gian đầu tiên với hàm regexextract (không sử dụng dấu cộng trên lớp ký tự)Extract the first character from each cell in the range A3:A12, by extracting the first non-space character with the REGEXEXTRACT function (without using a plus sign on the character class)

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, và sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

=REGEXEXTRACT(A3,"[^[:space:]]")

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Nhiều công thức hơn:

Dưới đây là nhiều công thức thực hiện một nhiệm vụ tương tự/chính xác như công thức được thể hiện trong ví dụ trên.

Các cách khác để viết công thức trong ví dụ trên:

=REGEXEXTRACT(A3,"[[:graph:]]")

= RegexexTract (A3, "\ s+")

Công thức tương tự:

= RegexexTract (A3, "[[: Digit:]]+") - Trích xuất chuỗi số đầu tiên

= RegexexTract (A3, "[0-9]+")-trích xuất chuỗi số đầu tiên

= RegexexTract (a3, "\ d+") - trích xuất chuỗi số đầu tiên

= RegexexTract (A3, "[^[: Digit:]]+")-trích xuất chuỗi không số đầu tiên

= RegexexTract (A3, "[^0-9]+")-trích xuất chuỗi không số đầu tiên Extract the last name from each cell/string

= RegexexTract (A3, "\ d+")-trích xuất chuỗi không số đầu tiênExtract the last name from each cell in the range A3:A12, by using the following functions: RIGHT, LEN, FIND, and SUBSTITUTE.

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, và sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

= Right (A3, Len (A3) -find ("*", thay thế (A3, "", "*", len (A3) -Len (thay thế (A3, "", "")))))

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Trích xuất từ ​​thứ n trong google sheets

Vì vậy, chúng tôi đã đi qua các công thức trích xuất từ ​​đầu tiên hoặc cuối cùng từ một ô, nhưng nếu bạn muốn chỉ định từ bạn muốn trích xuất trong Google Sheets, bạn có thể làm điều này bằng cách sử dụng chỉ mục và các chức năng phân chia.

Lưu ý rằng đối với các chuỗi không có khoảng trống trong đó, công thức này sẽ trích xuất toàn bộ nội dung của ô. Cũng lưu ý rằng với công thức này, ở hàng 5 rằng mặc dù một khoảng trống nằm ở vị trí đầu tiên của chuỗi để xuất ra một chuỗi trống).

Nhiệm vụ: Trích xuất từ ​​đầu tiên từ mỗi ô/chuỗi Extract the first word from each cell/string

Logic: Trích xuất từ ​​đầu tiên từ mỗi ô trong phạm vi A3: A12, bằng cách tách (các) chuỗi bằng một không gian và trích xuất ô đầu tiên từ kết quả phân chia.Extract the first word from each cell in the range A3:A12, by splitting the string(s) by a space, and extracting the first cell from the split results.

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

= Index (chia (A3, ""), 1)

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Trích xuất n ký tự từ bên trái/bên phải của chuỗi

Trong ví dụ này, chúng tôi sẽ trích xuất một số lượng ký tự được chỉ định từ phía bên trái của chuỗi, bằng cách sử dụng hàm bên trái.

Chức năng bên trái trong Google Sheets sẽ hiển thị một chuỗi con là một số lượng ký tự được chỉ định dài, bắt đầu từ đầu chuỗi mà bạn chỉ định.

Google Sheets Chức năng để mô tả:

Cú pháp: trái (chuỗi, [number_of_characters])
LEFT(string, [number_of_characters])

Tóm tắt công thức: Trò chơi trả về một chuỗi con từ đầu của một chuỗi được chỉ định. “Returns a substring from the beginning of a specified string.”

Nhiệm vụ: Trích xuất 2 ký tự từ phía bên trái của mỗi ô/chuỗi Extract 2 characters from the left side of each cell/string

Logic: Trích xuất 2 ký tự từ bên trái của mỗi ô trong phạm vi A3: A12, bằng cách sử dụng hàm bên tráiExtract 2 characters from the left of each cell in the range A3:A12, by using the LEFT function

Công thức: Công thức dưới đây, được nhập vào các ô màu xanh. Ban đầu nó vào ô C3, sau đó được sao chép/điền vào phạm vi C3: C12 The formula below, is entered in the blue cells. It is initially into the cell C3, and then copied/filled into the range C3:C12

=LEFT(A3,2)

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

= Index (chia (A3, ""), 1)

Trích xuất n ký tự từ bên trái/bên phải của chuỗi

Trong ví dụ này, chúng tôi sẽ trích xuất một số lượng ký tự được chỉ định từ phía bên trái của chuỗi, bằng cách sử dụng hàm bên trái.

  • Chức năng bên trái trong Google Sheets sẽ hiển thị một chuỗi con là một số lượng ký tự được chỉ định dài, bắt đầu từ đầu chuỗi mà bạn chỉ định.
  • Google Sheets Chức năng để mô tả:
  • Cú pháp: trái (chuỗi, [number_of_characters])
  • Tóm tắt công thức: Trò chơi trả về một chuỗi con từ đầu của một chuỗi được chỉ định.
  • Nhiệm vụ: Trích xuất 2 ký tự từ phía bên trái của mỗi ô/chuỗi

Logic: Trích xuất 2 ký tự từ bên trái của mỗi ô trong phạm vi A3: A12, bằng cách sử dụng hàm bên trái

Nhiều công thức hơn:

Dưới đây là nhiều công thức thực hiện một nhiệm vụ tương tự/chính xác như công thức được thể hiện trong ví dụ trên.

Công thức tương tự:

= Right (a3,2) - trích xuất n ký tự ở bên phải của chuỗi

= Trái (regexreplace (a3, "\ d+", ""), 2)) - trích xuất n số ở bên trái của chuỗi

  1. = Right (regexreplace (a3, "\ d+", ""), 2)) - trích xuất n số ở bên phải của chuỗi
  2. = Trái (regexreplace (a3, "\ d+", ""), 2)) - trích xuất n chữ
  3. = Right (regexreplace (a3, "\ d+", ""), 2)) - trích xuất n chữ cái ở bên phải của chuỗi

Câu đố pop: Kiểm tra kiến ​​thức của bạn

Trả lời các câu hỏi dưới đây về trích xuất, để tinh chỉnh kiến ​​thức của bạn! Cuộn xuống đáy để tìm câu trả lời cho bài kiểm tra.

  1. Tải xuống lớp học:
  2. Công thức trích xuất bảng gian lận (PDF)
  3. Câu hỏi 1

Công thức nào sau đây sẽ trích xuất văn bản?

= Value (regexreplace (a1, "[^[: chữ số:]]", "")))

  1. = Regexreplace (C1, "[^[: alpha:]]", "")
  2. = Regexreplace (g1, "[[: punct:]]", "")

Câu hỏi 2

Công thức nào sau đây sẽ trích xuất số?

  1. = Regexreplace (z11, "[[: punct:]]", "")
  2. = Regexreplace (j7, "[^[: alpha:]]", "")

= Value (regexreplace (p17, "[^[: chữ số:]]", ""))

Câu hỏi số 3

  1. [[:graph:]]
  2. [^[:graph:]]
  3. Đúng hoặc Sai: Hàm Regexreplace có thể được sử dụng để trích xuất/thay thế mọi phiên bản của loại ký tự được chỉ định, trong đó hàm regexextract có thể được sử dụng để trích xuất các phần "phụ" từ chuỗi nguồn.
  4. ĐÚNG VẬY
  5. [[:print:]]
  6. [^[:print:]]

Hướng dẫn google sheet extract text from string - google sheet trích xuất văn bản từ chuỗi

Sai

Câu hỏi số 4 2

Các lớp ký tự nào sau đây đại diện cho "ký tự không phải là văn bản"? 3

[^[: alpha:]] & nbsp; ~ & nbsp; [^a-za-z] 1

[[: alpha:]] & nbsp; ~ & nbsp; [A-AZA-Z] 1

Câu hỏi số 5 1, 4, 5

Làm cách nào để trích xuất văn bản từ một chuỗi trong Google Sheets?

Để trích xuất văn bản từ giữa chuỗi văn bản, chúng ta có thể sử dụng các hàm bên phải, tìm kiếm và len để lấy văn bản từ phía bên phải của chuỗi, sau đó sử dụng các hàm giữa và LEN để lấy văn bản ở giữa. Chúng tôi cũng sẽ kết hợp hàm cắt để cắt bất kỳ khoảng trống nào ở hai bên của chuỗi văn bản.use the RIGHT, SEARCH and LEN functions to get the text from the right side of the string, and then use the MID and LEN functions to get the text in the middle. We will also incorporate the TRIM function to trim any spaces on either side of the text string.

Làm cách nào để trích xuất số hoặc văn bản từ một chuỗi trong Google Sheets?

Chúng tôi sử dụng biểu tượng '' để Google Sheets hiểu rằng chúng tôi có nghĩa là meta-saracter 'd' chứ không phải chữ 'd'. Vì vậy, nếu bạn muốn trích xuất một chữ số số từ một chuỗi, bạn sẽ sử dụng biểu thức 'd'. Nhưng nếu bạn muốn trích xuất nhiều hơn một chữ số, bạn có thể sử dụng biểu thức 'd+'.if you want to extract a single numeric digit from a string, you use the expression 'd'. But if you want to extract more than one digits, you can use the expression 'd+'.

Làm cách nào để trích xuất văn bản từ một ô?

Ví dụ: công thức = len () cung cấp lại số lượng ký tự trong ô.Vì vậy, = trái (a1, len (a1) -2) trích xuất toàn bộ văn bản trong một ô ngoại trừ hai ký tự cuối cùng.Để phân tách DataWrapper (phần mềm) tế bào vào hai tế bào DataWrapper và phần mềm, bạn có thể sử dụng Formula = split (trái (A5, LEN (A5) -1), "(".=LEFT(A1,LEN(A1)-2) extracts the entire text in a cell except the last two characters. To separate the cell Datawrapper (Software) into the two cells Datawrapper and Software , you could use the formula =SPLIT(LEFT(A5,LEN(A5)-1),"(" .

Làm cách nào để trích xuất dữ liệu cụ thể từ Google Sheets?

Chỉ cần chọn một cột (hoặc một loạt các ô trong một cột) nơi bạn muốn rút dữ liệu ra khỏi và mở rộng một trong các nhóm dựa trên nhiệm vụ của bạn ...
Chạy các công cụ năng lượng từ menu Google Sheets: Tiện ích mở rộng> Công cụ điện> Bắt đầu:.
Chuyển đến nhóm văn bản:.
Tìm và nhấp vào biểu tượng Trích xuất:.