Hướng dẫn dùng replace regex trong PHP

Cú pháp hàm preg_replace()

Hàm preg_replace sử dụng RegExp (xem cách viết biểu thức chính quy RegExp) để tìm kiếm và thay thế chuỗi.

preg_replace($pattern, $replacement,$subject)

Hàm này tìm trong $subject các chuỗi con phù hợp với mẫu $pattern là một biểu thức RegExp, thay thế chuỗi tìm thấy bởi $replacement

  • $pattern : Biểu thức RegExp để tìm kiếm có thể là một chuỗi hoặc một mảng.
  • $subject : Chuỗi nhập vào để tìm kiếm
  • $replacement : Giá trị thay thế, có thể là chuỗi hoặc mảng. Nếu $pattern là mảng $replacement là chuỗi thì mọi kết quả tìm kiểm theo $pattern được thay thể bởi $replacement. Nếu cả $pattern, $replacement là mảng thì nó thay thế theo phần tử tương ứng.

$replacement đặc biệt có thể được biểu diễn một cách đặc biệt, nó có thể chứa các tham chiếu dùng để chèn nội dung, tham chiếu có dạng $n với n = 0 - 99. Với $0 tương ứng với sự phù hợp với toàn bộ $pattern, $1, $2 ... tương ứng với mẫu con theo thứ tự trong $pattern (Xem ví dụ 2)

Hàm preg_replace trả về chuỗi hoặc mảng các chuỗi để tìm kiếm và thay thế.

Ví dụ 1 về preg_replace

Dùng biểu thức chính quy và hàm preg_replace tìm các cụm số thay thế bằng 2000


//OUT:
Ví dụ về hàm preg_replace 2000 2000

Ví dụ 2 $replacement đặc biệt

Ví dụ sau, cho chuỗi có nội dung: 'Tháng ... Năm ....' đảo thành 'Năm ..., Tháng ...'


//OUT:Năm 2017, Tháng 12

Với ví dụ trên về $pattern cờ ui cho biết không phân biệt chữ hoa, chữ thường và dùng chuỗi Unicode. Với mẫu này trong nó có các $pattern con là (\w+) tương ứng với $1, (\d+) tương ứng với $2 ...Và $replacement sử dụng các chỉ số này để tạo chuỗi thay thế.

Ví dụ 3 dùng preg_replace với mảng xử lý BBCODE

Ví dụ sau sẽ chuyển các mã bbcode: b, i, u, img, url thành mã HTML thông thường.

$1',
        '$1',
        '$1',
        '',
        '$1',
        '$2'
    );

    $str = preg_replace ($search, $replace, $str);
    return $str;
}
//Test
$bbcdoe = '[url=https://xuanthulab.net][b]xuanthulab.net[/b][/url]';
echo bbcode2Html($bbcdoe);
//OUT HTML: xuanthulab.net

Trong bài này chúng ta tìm hiểu một hàm khá giống với hàm str_replace đó là hàm preg_replace.

Hướng dẫn dùng replace regex trong PHP

Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.

1. Hàm preg_replace trong PHP

Hàm preg_replace dùng để replace một chuỗi nào đó khớp với đoạn Regular Expression truyền vào. Hàm này có chức năng tương tự như str_replace nhưng có sự khác biệt là một bên dùng regex một bên không dùng.

Cú pháp: preg_replace ( $pattern, $replacement, $subject)

Trong đó:

Bài viết này được đăng tại [free tuts .net]

  • $partern: là chuỗi Regular Expression
  • $replacement: là chuỗi replace thành
  • $subject: là string muốn duyệt và replace

Kết quả trả về của hàm preg_replace là chuỗi đã được replace.

2. Ví dụ hàm preg_relace trong PHP

Ví dụ 1: Replace chuỗi hi thành chuỗi hello trong chuỗi hi everybody, hi there

$partern = '/hi/';
$subject = 'hi everybody, hi there';
$replacement = 'hello';
echo preg_replace($partern, $replacement, $subject);

Kết quả xuất ra màn hình là chuỗi hello everybody, hello there đã được replace

Ví dụ 2: Xóa thẻ h2 trong chuỗi

Welcome to freetuts.net

Nhận xét: Ta thấy để xóa thẻ h2 thì sẽ phải replace cho cả thẻ đóng và thẻ mở

thành ký tự trống ''. Ta sẽ có 2 cách xử lý cho bài này.

Cách 1: Dùng toán tử OR trong Regular Expression, tức là sẽ kiểm tra nếu là thẻ đóng hoặc thẻ mở thì sẽ bị replace thành ký tự trống. Chuỗi regex sẽ như sau $partern = '/(

)|(<\/h2>)/'. Tôi đã dùng dấu mở và đóng () để gộp 2 nhóm thẻ mở và thẻ đóng lại, luôn luôn làm như vậy nha các bạn.

$partern = '/(

)|(<\/h2>)/'; $subject = '

Welcome to freetuts.net

'; $replacement = ''; echo preg_replace($partern, $replacement, $subject);

Các bạn chạy lên và dùng firebug soi sẽ thấy mất thẻ h2.

Cách 2: Dùng toán tử kiểm tra có hoặc không đó là dấu ?. Bạn quay lại bài trước để xem các ví dụ và cách dùng dấu này nhé.

Các bạn thấy thẻ mở

và thẻ đóng

chỉ khác nhau ở chỗ dấu /. Như vậy chuỗi partern sẽ như sau $partern = '/(<\/?h2>)/'. Vì dấu / là ký tự đặc biệt trong Regular Expression nên tôi đã thêm một dấu \ để đặt trước nó. Những điều này tôi đã nói ở bài trước rồi nên bạn quay lại xem nhé. Dấu ? là có ý nghĩa có hoặc không có ký tự, tức là

hoặc

$partern = '/(<\/?h2>)/';
$subject = '

Welcome to freetuts.net

'; $replacement = ''; echo preg_replace($partern, $replacement, $subject);

Chạy lên kết quả tương đương như cách 1.

Ví dụ 3: Dùng Regular Expression xóa tất cả những thẻ html (h2, h2, h3, h4, h5) của một đoạn text

Nếu không dùng hàm preg_replace kết hợp với Regular Expression thì trong php có cung cấp 1 hàm để xử lý vấn đề này, đó là hàm strip_tags. Nhưng trong đề bài yêu cầu dùng Regular Expresision nên phải làm vậy thôi.

Ý tưởng: Ở ví dụ 2 ta đã xóa được một thẻ h2, như vậy muốn xóa các thẻ khác thì chỉ cần copy và thay đổi giá trị thẻ là được, cách làm như sau:

$subject = '

This is h2

This is h2

This is h3

This is h4

This is h5
'; // H1 $subject = preg_replace('/<\/?h2>/', '', $subject); // H2 $subject = preg_replace('/<\/?h2>/', '', $subject); // H3 $subject = preg_replace('/<\/?h3>/', '', $subject); // H4 $subject = preg_replace('/<\/?h4>/', '', $subject); // H5 $subject = preg_replace('/<\/?h5>/', '', $subject); echo $subject;

Nhưng các bạn thấy liệu có hay không? có cách này để đưa vào một partern mà xử lý hết các thẻ luôn hay không? Câu trả lời là có nhé. Bạn kết hợp ví dụ 1 và ví dụ 2 lại sẽ có được chuỗi partern mong muốn. Các bạn xem bài giải sau:

$subject = '

This is h2

This is h2

This is h3

This is h4

This is h5
'; echo preg_replace('/(<\/?h2>)|(<\/?h2>)|(<\/?h3>)|(<\/?h4>)|(<\/?h5>)/', '', $subject);

Rất gọn đúng không nào, các bạn tham khảo thêm một cách giải nữa:

$subject = '

This is h2

This is h2

This is h3

This is h4

This is h5
'; echo preg_replace('/<\/?h(1|2|3|4|5)>/', '', $subject);

Cách này tôi dùng toán tử OR cho các số 1 hoặc 2 hoặc 3 hoặc 4 hoặc 5. Đây là cách gọn và tối ưu nhất đúng không nào.

3. Lời kết

Qua 3 ví dụ trên chắc hẳn bạn đã biết các sử dụng hàm preg_replace trong php kết hợp với Regular Expression rồi nhỉ. Có rất nhiều bài toán khác nhau và ứng dụng khác nhau nên không thể quy ra một công thức chung được, các bạn cố gắng nắm vững các biểu thức Regular Expression để kết hợp là ok.