Tôi thích cách tiếp cận của Max Makhrov, nhưng một regex đơn giản hơn một chút sẽ là:
""
Trong công thức:
=REGEXREPLACE[A1,"",""]
Nếu bạn nhìn lại Max, các yếu tố khác mà anh ta đưa vào là:
/?
Anh ta nói rằng nhân vật đầu tiên là '/' hay không. Bởi vì bạn thấy những thứ như thẻ "" hoặc "" và chúng tôi muốn khớp cả hai.
\S+
"\ S" có nghĩa là bất kỳ ký tự "không phải trắng" nào. "+" có nghĩa là một hoặc nhiều lần. Để chém được theo sau bởi một số ký tự có thể nhìn thấy.
Sau đó, anh ta có "[^]*" - bất kỳ ký tự khung không góc nào không hoặc nhiều lần, cuối cùng tìm thấy khung gần đó. Vì vậy, sau khi nhóm nhân vật cuối cùng của chúng tôi dừng lại [tức là chúng tôi nhấn Whitespace], sau đó chúng tôi bắt đầu tìm kiếm khung gần đó.
Nhưng chém, không phải là không gian - chúng ta có thể để "[^]" làm tất cả công việc cho chúng ta ngay từ đầu. Chúng ta có thể sử dụng "+" thay vì "*", để đảm bảo chúng ta tìm thấy ít nhất một ký tự trong thẻ. .
Vì vậy, phiên bản của tôi là "Dumber" theo một nghĩa nào đó. Nó chỉ nói rằng chúng ta đừng lo lắng về việc có dấu gạch chéo hay khoảng trắng hay không, và chỉ cần lấy bất cứ thứ gì chúng ta có được giữa hai khung góc.
Bạn có thể nhận thấy điều này khắc phục một lỗi tinh tế với câu trả lời ban đầu của Max, trong đó nó sẽ loại bỏ toàn bộ trường nếu mục nhập và thẻ không chứa khoảng trắng nào cả. "\ S+" là "tham lam". Vì vậy, nếu bạn đánh một cái gì đó như thế này:
test1test2
"\ S" sẽ khớp với mọi ký tự từ 'B' đầu tiên với 'div' cuối cùng. Nó không bao giờ dừng lại để tìm kiếm các ký tự Nonbracket, bởi vì nó chưa tìm thấy một không gian. Vì vậy, bạn sẽ không nhận được bất cứ điều gì trở lại trong lĩnh vực của bạn. [Nó sẽ xuất hiện để tìm thấy nếu bạn có khoảng trống trong các thẻ của mình, đó là lý do tại sao nó hoạt động trong cái nhìn đầu tiên với các ví dụ trên.]
Nếu bạn muốn làm cho nhà điều hành đó không màu xám, bạn phải thêm một "?" nhân vật sau nó, như vậy:
""
Tuy nhiên, nếu bạn sử dụng phiên bản đơn giản hơn của tôi, thì nó không sao, vì nó sẽ dừng bất cứ lúc nào nó tìm thấy khung góc tiếp theo mà không thực sự quan tâm đến không gian.
Vì vậy:
=REGEXREPLACE[A1,"",""]
hoặc
=ARRAYFORMULA[REGEXREPLACE[offset[A1,,,COUNTA[A:A]],"",""]]
May mắn nhất!
Cách xóa & nbsp; loại bỏ html khỏi excel
Chọn & nbsp; các ô chứa HTML
- Từ tab & nbsp; home & nbsp; nhấp vào & nbsp; tìm và chọn & nbsp; lệnh, sau đó chọn & nbsp; thay thế & nbsp; từ menu thả xuống. [Bạn cũng có thể sử dụng phím tắt Windows & NBSP;
- Trong & nbsp; tìm những gì & nbsp; trường nhập ________ 9 & nbsp;Home tab, click the Find and Select command, then select Replace from the drop-down menu. [ You can also use the Windows Shortcut key Ctrl + h ]
- Để lại & nbsp; thay thế bằng & nbsp; trường trốngFind what field enter
- Nhấp vào & nbsp; thay thế tất cả & nbsp; nút. Bây giờ bạn còn lại với nội dung văn bản.Replace with field blank
- Cách xóa & nbsp; xóa HTML khỏi Google SheetReplace All button. Now you are left with the text content.
Với Google Sheet, & NBSP; Nó không dễ dàng vì nó ở Excel, nhưng bạn có thể thực hiện tương tự bằng cách sử dụng các biểu thức thông thường.
Từ tab & nbsp; edit & nbsp; nhấp vào & nbsp; tìm và thay thế & nbsp; tùy chọn. [Bạn cũng có thể sử dụng phím tắt Windows & NBSP;
- Từ tab & nbsp; home & nbsp; nhấp vào & nbsp; tìm và chọn & nbsp; lệnh, sau đó chọn & nbsp; thay thế & nbsp; từ menu thả xuống. [Bạn cũng có thể sử dụng phím tắt Windows & NBSP;
- Trong & nbsp; tìm những gì & nbsp; trường nhập ________ 9 & nbsp;Edit tab, click the Find and Replace option. [ You can also use the Windows Shortcut key Ctrl + h ]
- Để lại & nbsp; thay thế bằng & nbsp; trường trốngFind field enter
0=REGEXREPLACE[A1,"",""]
- Nhấp vào & nbsp; thay thế tất cả & nbsp; nút. Bây giờ bạn còn lại với nội dung văn bản.Replace with field blank and select Search using regular expressions
- Cách xóa & nbsp; xóa HTML khỏi Google SheetReplace All button. Now you are left with the text content.
Vì vậy, tôi thực hiện rất nhiều dữ liệu trang web chỉnh sửa và HTML trong Google Sheets. Rất nhiều thời gian, nó có rất nhiều thứ cũ mà người khác đã cư trú, đôi khi nó được trích xuất từ một trang web của nhà cung cấp, và nó hầu như luôn luôn cần sửa chữa.
Gần đây tôi bắt gặp vẻ đẹp này:
Điều đó khiến tôi nghĩ về một cách mà trước tiên tôi cần phải lau tất cả HTML. Thông thường, tôi sẽ chỉ tìm và thay thế cho hoặc thẻ và loại bỏ chúng cùng một lúc, nhưng như bạn có thể thấy từ hình ảnh. Đây là một trường hợp đặc biệt đặc biệt và tôi đã tìm thấy giải pháp này trên Stack Overflow mà tôi đã muốn chia sẻ ở đây để sử dụng cá nhân của riêng tôi và hy vọng giúp đỡ bất kỳ ai khác gặp phải vấn đề này.
Trong bài đăng Stack Overflow, họ đề cập đến 2 cách để thực hiện điều này, nhưng tôi sẽ chỉ đi qua một trong số họ [và sửa đổi nó một chút]:
=REGEXREPLACE[A1,"",""]
Vì vậy, nhìn vào những gì Google nói về thẻ này [regexreplace [văn bản, thông thường_expression, thay thế]], nó khá dễ dàng để thấy những gì chúng tôi làm. Ở đây, văn bản đề cập đến ô mà chúng tôi đang tìm kiếm HTML [ở đây chúng tôi đã sử dụng A1, nhưng ô trong hình ảnh ví dụ của tôi sẽ là K14625], và sự thay thế đang nói với nó là trống, nhưng những gì đang diễn ra trong thông thường_expression ?the text refers to the cell we’re searching for HTML in [here we used A1, but the cell in my example image would have been K14625], and replacement is telling it to be empty, but what’s going on in the regular_expression?
- [^] = Phủ định lớp ký tự, khiến nó khớp với một ký tự không được liệt kê trong lớp ký tự [lớn hơn & nhỏ hơn].
- [^] = Phủ định lớp ký tự, khiến nó khớp với một ký tự không được liệt kê trong lớp ký tự [lớn hơn & nhỏ hơn].
- *> = Tìm thấy tất cả lớn hơn các ký hiệu để làm cho điểm dừng đó [dấu hoa thị giúp nó bỏ qua mọi thứ sau khi lớn hơn]
Nếu bạn quay lại bài viết gốc, bạn sẽ thấy rằng tôi đã loại bỏ \ s+ ở giữa mà tôi tin rằng nó sẽ bỏ qua khoảng trắng, nhưng điều đó không liên quan đến những gì tôi đang cố gắng thực hiện và biểu hiện của tôi dường như Làm việc tốt. Nếu bạn gặp sự cố, hãy thử nó với \ S+ có thể tìm thấy bằng cách sử dụng liên kết ở trên. \S+ in the middle which I believe tells it to ignore whitespace, but that wasn’t relevant for what I was trying to accomplish, and my expression seemed to work just fine. If you’re experiencing problems, try it with the \S+ which can be found using the link above.
Tags: Excel, định dạng, công thức, bảng Google, HTML, xóa mã, xóa HTML, công thức bảng, bảng tính, tước HTML, bảng, thiết kế web, trang webexcel, formatting, formulas, Google Sheets, HTML, remove code, remove html, sheets formula, spreadsheets, stripping HTML, tables, Web Design, websites