Hướng dẫn remove link from string python - xóa liên kết khỏi chuỗi python
Tôi muốn xóa tất cả các URL bên trong một chuỗi (thay thế chúng bằng "") Tôi đã tìm kiếm xung quanh nhưng thực sự không thể tìm thấy thứ tôi muốn. Show Example:
Tôi muốn kết quả là:
hỏi ngày 4 tháng 7 năm 2012 lúc 15:30Jul 4, 2012 at 15:30
3 cách ngắn nhất
Đã trả lời ngày 26 tháng 11 năm 2016 lúc 21:01Nov 26, 2016 at 21:01
Tolgayilmaztolgayilmaztolgayilmaz 3.7492 Huy hiệu vàng19 Huy hiệu bạc18 Huy hiệu đồng2 gold badges19 silver badges18 bronze badges 6 Kịch bản Python:
Output:
Kiểm tra mã này ở đây. Đã trả lời ngày 4 tháng 7 năm 2012 lúc 16:15Jul 4, 2012 at 16:15
MegaΩmegaΩmega 41K32 Huy hiệu vàng126 Huy hiệu bạc194 Huy hiệu Đồng32 gold badges126 silver badges194 bronze badges 1 Điều này làm việc cho tôi:
Result:
Đã trả lời ngày 4 tháng 7 năm 2012 lúc 16:12Jul 4, 2012 at 16:12
TahatahaTaha 1.5022 huy hiệu vàng18 Huy hiệu bạc24 Huy hiệu đồng2 gold badges18 silver badges24 bronze badges Loại bỏ các liên kết/URL HTTP trộn lẫn trong bất kỳ văn bản nào:
Đã trả lời ngày 26 tháng 4 năm 2018 lúc 6:48Apr 26, 2018 at 6:48
PranzellpranzellPranzell 2.07815 huy hiệu bạc21 Huy hiệu đồng15 silver badges21 bronze badges 2 Giải pháp này phục vụ cho HTTP, HTTPS và các ký tự đặc biệt loại URL bình thường khác:
Đã trả lời ngày 21 tháng 7 năm 2016 lúc 8:05Jul 21, 2016 at 8:05
Lee Martinlee MartinLee Martin Phim huy hiệu bạc 1711 Huy hiệu đồng1 silver badge3 bronze badges 3 Tôi không thể tìm thấy bất kỳ điều gì đã xử lý tình huống cụ thể của mình, đó là loại bỏ các URL ở giữa các tweet cũng có khoảng trắng ở giữa các URL nên tôi đã tự làm:
Đây là một lời giải thích: 5 khớp http: // hoặc https: // 6 không gian trắng tùy chọn 7 Tùy chọn khớp với www. 6 Tùy chọn khớp với khoảng trắng 9 khớp với 0 hoặc nhiều hơn một hoặc nhiều ký tự từ theo sau là khoảng thời gian 0 khớp với 0 hoặc nhiều từ một hoặc nhiều từ (hoặc một dấu gạch ngang) theo sau là '\' 1 bất kỳ đường dẫn còn lại ở cuối URL theo sau là kết thúc tùy chọn 2 khớp với các thông số truy vấn kết thúc (ngay cả với không gian trắng, v.v.) 5 matches http:// or https:// 6 optional whitespaces 7 optionally matches www. 6 optionally matches whitespaces 9 matches 0 or more of one or more word characters followed by a period 0 matches 0 or more of one or more words(or a dash or a space) followed by '\' 1 any remaining path at the end of the url followed by an optional ending 2 matches
ending query params (even with white spaces,etc) Kiểm tra điều này ở đây: https: //regex101.com/r/nmvgoo/8 Đã trả lời ngày 16 tháng 8 năm 2018 lúc 20:20Aug 16, 2018 at 20:20
3 Những gì bạn thực sự muốn làm là loại bỏ bất kỳ chuỗi nào bắt đầu bằng 3 hoặc 4 cộng với bất kỳ sự kết hợp nào của các ký tự không gian trắng. Đây là cách tôi sẽ giải quyết nó. Giải pháp của tôi rất giống với giải pháp của @tolgayilmaz 0Và kết quả của việc chạy một trong hai mã ở trên là 1Tôi thích cái thứ hai vì nó dễ đọc hơn. Đã trả lời ngày 15 tháng 1 năm 2019 lúc 20:42Jan 15, 2019 at 20:42
Samuel Ndesamuel ndeSamuel Nde 2.4022 Huy hiệu vàng22 Huy hiệu bạc23 Huy hiệu đồng2 gold badges22 silver badges23 bronze badges 4 Để xóa bất kỳ URL nào trong chuỗi trong Python, bạn có thể sử dụng chức năng Regex này:remove any URL within a string in Python, you can use this RegEx function : 2Đã trả lời ngày 28 tháng 8 năm 2020 lúc 11:55Aug 28, 2020 at 11:55
1 Tôi biết điều này đã được trả lời và nó ngu ngốc muộn nhưng tôi nghĩ điều này nên ở đây. Đây là một regex phù hợp với bất kỳ loại url nào. 3Nó có thể được sử dụng như 4Đã trả lời ngày 13 tháng 3 năm 2018 lúc 13:39Mar 13, 2018 at 13:39
5 Bạn cũng có thể nhìn nó từ cách khác ... 5Đã trả lời ngày 4 tháng 7 năm 2012 lúc 16:48Jul 4, 2012 at 16:48
Jon Clements ♦ Jon Clements♦Jon Clements 135K32 Huy hiệu vàng240 Huy hiệu bạc273 Huy hiệu Đồng32 gold badges240 silver badges273 bronze badges Biểu thức chính quy sau đây trong Python hoạt động tốt để phát hiện (các) URL trong văn bản:Python works well for detecting URL(s) in the text: 6Đầu ra::
Đã trả lời ngày 2 tháng 9 năm 2017 lúc 14:19Sep 2, 2017 at 14:19
2 8Ngoài 9Đã trả lời ngày 5 tháng 11 năm 2019 lúc 6:07Nov 5, 2019 at 6:07 1 Tôi nghĩ rằng mẫu Regex URL tổng quát nhất là mô hình này: 0Có một mô -đun nhỏ làm những gì bạn muốn: 1 2Đã trả lời ngày 11 tháng 8 năm 2021 lúc 9:21Aug 11, 2021 at 9:21
Một đơn giản.* Với một cái nhìn tích cực phía sau nên làm công việc. 3Đã trả lời ngày 20 tháng 9 năm 2021 lúc 7:07Sep 20, 2021 at 7:07
TbhavnanitbhavnaniTBhavnani 6716 Huy hiệu bạc12 Huy hiệu đồng6 silver badges12 bronze badges Tại sao không sử dụng cái này nó hoàn thành như vậy 4
Fobersteiner 18.2K5 Huy hiệu vàng29 Huy hiệu bạc57 Huy hiệu đồng5 gold badges29 silver badges57 bronze badges Đã trả lời ngày 12 tháng 7 lúc 4:41Jul 12 at 4:41
0 Làm thế nào để bạn xóa một liên kết khỏi một chuỗi trong Python?sub (r'http \ s+',' ', my_string).Ở đó.Phương thức Sub () sẽ xóa bất kỳ URL nào khỏi chuỗi bằng cách thay thế chúng bằng các chuỗi trống. . The re. sub() method will remove any URLs from the string by replacing them with empty strings.
Làm cách nào để trích xuất một url từ văn bản trong Python?Trích xuất URL đạt được từ một tệp văn bản bằng cách sử dụng biểu thức chính quy.Biểu thức tìm nạp văn bản bất cứ nơi nào nó phù hợp với mẫu.Chỉ các mô -đun RE được sử dụng cho mục đích này.using regular expression. The expression fetches the text wherever it matches the pattern. Only the re module is used for this purpose.
Làm thế nào để bạn làm sạch URL trong Python?Bạn cần xác định sạch ... Sắp xếp các đối số truy vấn, đầu tiên theo khóa, sau đó theo giá trị .. Phần trăm mã hóa đường dẫn và đối số truy vấn..... Bình thường hóa tất cả các không gian (trong các đối số truy vấn) '+' (biểu tượng cộng). Bình thường hóa trường hợp mã hóa phần trăm ( %2F -> %2F). Làm cách nào để loại bỏ 20 từ URL trong Python?Thay thế ('%20+', '') sẽ thay thế '%20+' bằng chuỗi trống. will replace '%20+' with empty string. |