Hướng dẫn dùng define tokenize trong PHP

Mở đầu

Có rất nhiều điều xảy ra khi chúng ta thực hiện một đoạn mã PHP. Nói chung, trình thông dịch PHP đi qua bốn giai đoạn khi thực hiện 1 đoạn code:

  • Lexing
  • Parsing
  • Compilation
  • Interpretation

Chúng ta sẽ đi qua các giai đoạn này và thực hiện các ví dụ để thấy kết quả từ mỗi giai đoạn, xem điều gì đang xảy ra. Lưu ý rằng mặc dù một số phần mở rộng đã được sử dụng trong các ví dụ như là một phần của PHP [như tokenizer và OPcache] nhưng những phần khác cần phải được cài đặt và bật theo cách thủ công [như php-ast và VLD]

Bước 1 – Lexing

Lexing [hoặc tokenizing] là quá trình biến một chuỗi [trong trường hợp này mã nguồn PHP] thành một chuỗi mã thông báo liên tục [sequence of tokens]. Một mã thông báo [token] chỉ đơn giản là một tên nhận dạng được đặt tên cho giá trị mà nó đã khớp. PHP sử dụng re2c để tạo ra lexer của nó từ tập tin định nghĩa zend_language_scanner.l. Chúng ta có thể thấy đầu ra của giai đoạn lexing thông qua phần mở rộng tokenizer:

$code = 

Chủ Đề