Ký tự khoảng trắng trong php là gì?

Bạn có thể sử dụng hàm PHP trim[] để xóa khoảng trắng bao gồm khoảng trắng không ngắt, dòng mới và tab từ đầu và cuối chuỗi. Nó sẽ không xóa khoảng trắng xảy ra ở giữa chuỗi. Hãy xem một ví dụ để hiểu cơ bản nó hoạt động như thế nào

Câu hỏi thường gặp liên quan

Dưới đây là một số câu hỏi thường gặp khác liên quan đến chủ đề này

❮ Tham chiếu chuỗi PHP

Thí dụ

Xóa các ký tự ở cả hai phía của chuỗi ["Anh ấy" trong "Xin chào" và "d. " trong thế giới"]

$str = "Xin chào thế giới. ";
echo $str. "
";
echo trim[$str,"Hed. "];
?>

Tự mình thử »

Định nghĩa và cách sử dụng

Hàm trim[] xóa khoảng trắng và các ký tự được xác định trước khác khỏi cả hai phía của chuỗi

chức năng liên quan

  • ltrim[] - Xóa khoảng trắng hoặc các ký tự được xác định trước khác khỏi phía bên trái của chuỗi
  • rtrim[] - Xóa khoảng trắng hoặc các ký tự được xác định trước khác khỏi phía bên phải của chuỗi

cú pháp

Giá trị tham số

Tham sốChuỗi mô tảBắt buộc. Chỉ định chuỗi cho checkcharlistOptional. Chỉ định các ký tự cần xóa khỏi chuỗi. Nếu bỏ qua, tất cả các ký tự sau sẽ bị xóa
  • "\0" - NULL
  • "\ t" - tab
  • "\n" - dòng mới
  • "\x0B" - tab dọc
  • "\ r" - xuống dòng
  • " " - khoảng trắng thông thường

chi tiết kỹ thuật

Giá trị trả về. Trả về phiên bản stringPHP đã sửa đổi. 4+Nhật ký thay đổi. Tham số charlist đã được thêm vào trong PHP 4. 1

Thêm ví dụ

Thí dụ

Xóa khoảng trắng ở cả hai phía của chuỗi

$str = " Xin chào thế giới. ";
echo "Không cắt. ". $str;
echo "
";
echo "Có viền. ". trim[$str];
?>

Đầu ra HTML của đoạn mã trên sẽ là [Xem nguồn]



Không cắt. Chào thế giới.
Có viền. Chào thế giới.

Đầu ra trình duyệt của đoạn mã trên sẽ là

Không cắt. Chào thế giới.
Có viền. Chào thế giới.

Tự mình thử »

Thí dụ

Xóa dòng mới [\n] khỏi cả hai bên của chuỗi

$str = "\n\n\nXin chào thế giới. \n\n\n";
echo "Không cắt. ". $str;
echo "
";
echo "Có viền. ". trim[$str];
?>

Đầu ra HTML của đoạn mã trên sẽ là [Xem nguồn]



không trang trí

Chào thế giới


với trang trí. Chào thế giới

Đầu ra trình duyệt của đoạn mã trên sẽ là

Không cắt. Chào thế giới.
Có viền. Chào thế giới.

Tự mình thử »

❮ Tham chiếu chuỗi PHP

Trong lập trình máy tính, khoảng trắng là bất kỳ ký tự hoặc chuỗi ký tự nào đại diện cho không gian ngang hoặc dọc trong kiểu chữ. Khi được hiển thị, ký tự khoảng trắng không tương ứng với dấu có thể nhìn thấy nhưng thường chiếm một vùng trên trang. Ví dụ: ký hiệu khoảng trắng phổ biến U+0020   SPACE [cũng là ASCII 32] biểu thị một ký tự dấu chấm câu khoảng trống trong văn bản, được sử dụng làm dấu phân cách từ trong chữ viết phương Tây

Tổng quan[sửa]

Độ rộng tương đối của các khoảng trắng khác nhau trong Unicode

Với nhiều bố cục bàn phím, một ký tự khoảng trắng có thể được nhập bằng cách nhấn phím cách. Khoảng trắng ngang cũng có thể được nhập trên nhiều bàn phím bằng phím Tab ↹, mặc dù độ dài của khoảng trắng có thể khác nhau. Khoảng trắng dọc có thể được nhập bằng cách nhập ↵ Enter, thao tác này sẽ tạo chuỗi mã 'dòng mới' trong hầu hết các chương trình. Trên các bàn phím cũ hơn, thay vào đó, phím này có thể được gắn nhãn Return, một phần giữ lại từ các phím xuống dòng của bàn phím máy đánh chữ, tạo ra sự quay lại cơ điện về điểm dừng bên trái [ký tự Unicode U+000D] và chuyển sang dòng tiếp theo [U+000A]. Nhiều trò chơi máy tính đầu tiên đã sử dụng các ký tự khoảng trắng để vẽ màn hình [e. g. Vương quốc Kroz] và phần mềm xử lý văn bản đã sử dụng chúng để tạo ra các hiệu ứng in như in đậm, gạch chân và gạch ngang. [cần dẫn nguồn]

Thuật ngữ "khoảng trắng" dựa trên sự xuất hiện của các ký tự trên giấy thông thường. Tuy nhiên, trong một ứng dụng, các ký tự khoảng trắng có thể được xử lý giống như bất kỳ mã ký tự nào khác và các chương trình khác nhau có thể xác định ngữ nghĩa riêng của chúng cho các ký tự

Unicode [ chỉnh sửa ]

Bảng bên dưới liệt kê 25 ký tự được định nghĩa là ký tự khoảng trắng ["WSpace=Y", "WS"] trong Cơ sở dữ liệu ký tự Unicode. [1] Mười bảy sử dụng định nghĩa khoảng trắng phù hợp với thuật toán viết hai chiều ["Kiểu ký tự hai chiều=WS"] và được gọi là ký tự "Bidi-WS". Các ký tự còn lại cũng có thể được sử dụng, nhưng không thuộc loại "Bidi" này

Ghi chú. Tùy thuộc vào trình duyệt và phông chữ được sử dụng để xem bảng sau, không phải tất cả các khoảng trắng đều có thể được hiển thị đúng cách

NameCode pointWidth boxMay break?In
IDN?ScriptBlockGeneral
categoryGhi chú lập bảng ký tựU+00099YesNoCommonBasic LatinOther,
controlHT, Horizontal . Thực thể có tên HTML/XML. , Mủ cao su. '\ tab', C thoát. '\t'line feedU+000A10Là ngắt dòngTiếng Latin cơ bản thông dụngKhác,
controlLF, Nguồn cấp dữ liệu dòng. Thực thể có tên HTML/XML. , C thoát. '\n'lập bảng dòngU+000B11Là ngắt dòngTiếng Latinh cơ bản thông thườngKhác,
controlVT, Tab dọc. C thoát. '\v'nguồn cấp biểu mẫuU+000C12Là ngắt dòngTiếng Latinh cơ bản thông thườngKhác,
controlFF, Nguồn cấp biểu mẫu. C thoát. '\f'carriage returnU+000D13Là ngắt dòngTiếng Latinh cơ bản thông dụngKhác,
controlCR, Trả về xuống hàng. C thoát. '\r'dấu cáchU+002032YesNoCommonBasic LatinSeparator,
dấu cáchPhổ biến nhất [dấu cách ASCII thông thường]dòng tiếp theoU+0085133Là ngắt dòngCommonLatin-1
Bổ sungKhác,
controlNEL, Next lineno-break spaceU+00A0160NoNoCommonLatin-1
SupplementSeparator,
spaceNon-breaking space: identical to U+0020, but not a point at which a line may be broken. HTML/XML named entity:  ,   LaTeX: '\ 'ogham space markU+16805760YesNoOghamOghamSeparator,
dấu cáchĐược sử dụng để phân tách giữa các từ trong văn bản Ogham. Thông thường là một đường thẳng đứng trong văn bản dọc hoặc một đường ngang trong văn bản ngang, nhưng cũng có thể là khoảng trống trong phông chữ "không thân". Yêu cầu phông chữ Ogham. en quadU+20008192YesNoCommonGeneral
Dấu phân cách dấu câu,
dấu cáchChiều rộng của một en. U+2002 về cơ bản tương đương với ký tự này; . em quadU+20018193YesNoCommonGeneral
Dấu phân cách dấu câu,
dấu cách Còn được gọi là "quad thịt cừu". Chiều rộng của một em. U+2003 về mặt kinh điển tương đương với ký tự này; . en spaceU+20028194YesNoCommonGeneral
Dấu phân cách dấu câu,
dấu cách Còn được gọi là "đai ốc". Chiều rộng của một vi. U+2000 En Quad về cơ bản tương đương với ký tự này; . Thực thể có tên HTML/XML. , LaTeX. '\enspace'em dấu cáchU+20038195YesNoCommonGeneral
Dấu phân cách dấu câu,
dấu cách Còn được gọi là "thịt cừu". Chiều rộng của một em. U+2001 Em Quad về cơ bản tương đương với ký tự này; . Thực thể có tên HTML/XML. , LaTeX. '\quad'three-per-em space+20048196YesNoCommonGeneral
Dấu phân cách dấu câu,dấu cách Còn được gọi là "dấu cách dày". Một phần ba của một em rộng. Thực thể có tên HTML/XML. dấu cách bốn trên mỗi emU+20058197CóKhôngChungChung
spaceAlso known as "thick space". One third of an em wide. HTML/XML named entity: four-per-em spaceU+20058197YesNoCommonGeneral
Dấu phân cách dấu câu,
dấu cáchCòn được gọi là "dấu cách giữa". Một phần tư của một em rộng. Thực thể có tên HTML/XML. six-per-em spaceU+20068198YesNoCommonGeneral
Dấu phân cách dấu câu,
dấu cáchMột phần sáu của một em rộng. Trong kiểu chữ máy tính, đôi khi tương đương với U+2009. không gian hìnhU+20078199NoNoCommonGeneral
Dấu phân cách dấu câu,
dấu cáchKhông gian hình. Trong phông chữ có các chữ số cách nhau, bằng chiều rộng của một chữ số. Thực thể có tên HTML/XML. ________ 8 dấu cách dấu câu+20088200Có KhôngThông thườngChung
Dấu phân cách dấu câu,
dấu cách Rộng bằng dấu câu hẹp trong một phông chữ, tôi. e. chiều rộng trước của dấu chấm hoặc dấu phẩy. [2] Thực thể có tên HTML/XML. khoảng cách mỏngU+20098201CóKhôngChungChung
Dấu phân cách dấu câu,
dấu cáchKhoảng cách mỏng; . Được khuyến nghị sử dụng làm dấu tách hàng nghìn cho các số đo được thực hiện bằng đơn vị SI. Không giống như U+2002 đến U+2008, chiều rộng của nó có thể được điều chỉnh khi sắp chữ. [3] Thực thể có tên HTML/XML. trim[]0, trim[]1, LaTeX. '\,'hair spaceU+200A8202YesNoCommonGeneral
Dấu phân cách dấu câu,
dấu cáchMỏng hơn khoảng cách mỏng. Thực thể có tên HTML/XML.  0  0 [không hoạt động trong tất cả các trình duyệt]dấu phân cách dòngU+20288232Là dấu ngắt dòngChung chung
Dấu phân cách dấu câu,
dấu phân cách đoạnU+20298233Là dấu ngắt dòngChung chung
PunctuationSeparator,
paragraphnarrow no-break spaceU+202F8239NoNoCommonGeneral
PunctuationSeparator,
spaceNarrow no-break space. Similar in function to U+00A0 No-Break Space. When used with Mongolian, its width is usually one third of the normal space; in other context, its width sometimes resembles that of the Thin Space [U+2009].medium mathematical spaceU+205F8287YesNoCommonGeneral
Dấu phân cách dấu câu,
dấu cáchMMSP. Được sử dụng trong các công thức toán học. Bốn phần mười tám của một em. [4] Trong kiểu chữ toán học, độ rộng của khoảng trắng thường được tính theo bội số nguyên của 1/18 em và 4/18 em có thể được sử dụng trong một số trường hợp, ví dụ giữa a và + và giữa + và . [5] Thực thể có tên HTML/XML.  2không gian chữ tượng hìnhU+300012288CóKhôngThông thườngKý hiệu CJK

Dấu phân cách dấu câu,
khoảng cáchRộng bằng một ô ký tự CJK [toàn bộ chiều rộng]. Được sử dụng, ví dụ, trong tai tou. Tên Điểm mãHộp chiều rộngCó thể ngắt?In
IDN?ScriptBlockGeneral
categoryGhi chú Dấu tách nguyên âm tiếng Mông CổU+180E6158᠎CóKhôngTiếng Mông CổTiếng Mông CổKhác,
Định dạngMVS. Một ký tự không gian hẹp, được sử dụng trong tiếng Mông Cổ để làm cho hai ký tự cuối cùng của một từ có các hình dạng khác nhau. [6] Nó không còn được phân loại là ký tự khoảng trắng [i. e. trong danh mục Zs] trong Unicode 6. 3. 0, mặc dù đó là trong các phiên bản trước của tiêu chuẩn. không gian có độ rộng bằng 0U+200B8203​YesNo?General
Dấu chấm câuKhác,
Định dạngZWSP, không gian có độ rộng bằng 0. Được sử dụng để biểu thị ranh giới từ cho hệ thống xử lý văn bản khi sử dụng tập lệnh không sử dụng khoảng cách rõ ràng. Nó tương tự như dấu gạch nối mềm, với điểm khác biệt là dấu gạch nối mềm được sử dụng để biểu thị ranh giới âm tiết và sẽ hiển thị dấu gạch nối có thể nhìn thấy khi ngắt dòng tại đó. Thực thể có tên HTML/XML.  3[7][c]không nối có chiều rộng bằng 0U+200C8204‌Có Phụ thuộc vào ngữ cảnh[12]?Chung
Dấu chấm câuKhác,
Định dạngZWNJ, không nối có chiều rộng bằng 0. Khi được đặt giữa hai ký tự lẽ ra sẽ được kết nối với nhau, một ZWNJ sẽ làm cho chúng được in ở dạng cuối cùng và dạng ban đầu tương ứng. Thực thể có tên HTML/XML.  4bộ nối có chiều rộng bằng 0U+200D8205‍Có Phụ thuộc vào ngữ cảnh[13]?Chung
Dấu chấm câuKhác,
Định dạngZWJ, bộ nối có chiều rộng bằng 0. Khi được đặt giữa hai ký tự không được kết nối với nhau, ZWJ sẽ khiến chúng được in ở dạng được kết nối của chúng. Cũng có thể được sử dụng để hiển thị các biểu mẫu tham gia một cách riêng biệt. Tùy thuộc vào việc một chữ ghép hoặc liên từ được mong đợi theo mặc định, có thể tạo ra [như trong biểu tượng cảm xúc và trong Sinhala] hoặc triệt tiêu [như trong Devanagari] thay thế bằng một hình tượng duy nhất, trong khi vẫn cho phép sử dụng các hình thức liên kết riêng lẻ [không giống như ZWNJ]. Thực thể có tên HTML/XML.  5 bộ nối từU+20608288⁠KhôngKhông?Chung
Dấu chấm câuKhác,
Định dạngWJ, bộ nối từ. Tương tự như U+200B, nhưng không phải là điểm mà tại đó đường có thể bị đứt. Thực thể có tên HTML/XML.  6Khoảng trắng không ngắt có chiều rộng bằng 0U+FEFF65279KhôngKhông?Tiếng Ả Rập
Bản trình bày
Biểu mẫu-BKhác,
Định dạngKhoảng cách không ngắt có chiều rộng bằng 0. Được sử dụng chủ yếu như một Dấu thứ tự Byte. Sử dụng như một dấu hiệu không phá vỡ không được chấp nhận kể từ Unicode 3. 2; .

  1. ^ White_Space là thuộc tính Unicode nhị phân. [14]
  2. ^
  3. ^ Mặc dù  3 là một thực thể có tên HTML5 cho U+200B, nhưng các tên bổ sung  8,  9, 0 và 1 [là các tên được sử dụng trong Ngôn ngữ Wolfram cho khoảng trắng trước âm, mà nó ánh xạ tới Khu vực sử dụng riêng][8] . g.  3]. [7]

Hình ảnh thay thế[sửa]

Unicode cũng cung cấp một số ký tự hiển thị có thể được sử dụng để biểu thị các ký tự khoảng trắng khác nhau, trong ngữ cảnh phải hiển thị biểu tượng hiển thị

Ký tự minh họa dấu cách Unicode [hiển thị]CodeDecimalNameBlockDisplayDescriptionU+00B7183Middle dotLatin-1 Supplement·Interpunct
Thực thể được đặt tên. 3U+21A18609Mũi tên hai đầu hướng xuốngMũi tên↡ECMA-17 / Biểu tượng ISO 2047 cho nguồn cấp dữ liệu biểu mẫu [ngắt trang][15]U+22618810Giống với Toán học
Toán tử≡Trong số các mục đích sử dụng khác, là ECMA-17 / ISO . làm ký hiệu cho dấu phân cách từU+24239251Mở hộpKiểm soát Hình ảnh␣Được sử dụng trong chữ viết tay khối chữ cái ít nhất là từ những năm 1980 khi cần chỉ rõ số lượng ký tự khoảng cách [e. g. khi lập trình bằng bút và giấy]. Được sử dụng trong sách giáo khoa [xuất bản năm 1982, 1984, 1985, 1988 bởi Springer-Verlag] trên Modula-2,[18] một ngôn ngữ lập trình trong đó mã không gian yêu cầu chỉ dẫn rõ ràng. Cũng được sử dụng trong bàn phím[n 1] của sê-ri máy tính vẽ đồ thị TI-8x của Texas Instruments.
Thực thể được đặt tên. 4U+24249252Biểu tượng cho dòng mớiĐiều khiển Ảnh␤Thay thế cho ngắt dòngU+25B39651Hình tam giác hướng lên màu trắngHình dạng hình học△Trong số các mục đích sử dụng khác, là ký hiệu ECMA-17 / ISO 2047 cho không gian ASCII[15]U+2A5B10843Hợp lý Hoặc có gốc ở giữaBổ sung
Mathematical
Operators⩛Amongst other uses, is the ECMA-17 / ISO 2047 symbol for vertical tab [line tab][15]U+2AAA10922Smaller thanSupplemental
Mathematical
Operators⪪Amongst other uses, is the ECMA-17 / ISO 2047 symbol for carriage return[15]U+2AAB10923Larger thanSupplemental
Mathematical
Operators⪫Amongst other uses, is the ECMA-17 / ISO 2047 symbol for the tab character[15]U+303712343Ideographic Telegraph Line Feed
Separator SymbolCJK Symbols
and Punctuation〷Graphic used for code 9999 in Chinese telegraph code, representing a line feed

  1. ^ Phía trên phím "0" hoặc âm "[‒]"

không gian chính xác
  • Cambridge Z88 cung cấp một "không gian chính xác" đặc biệt [điểm mã 160 hay còn gọi là 0xA0] [có thể gọi bằng phím tắt ⌑+SPACE[19]], được trình điều khiển hiển thị của hệ điều hành hiển thị dưới dạng "…". [20][21] Do đó, nó còn được gọi là "không gian dấu chấm" cùng với BBC BASIC. [20][21]
  • Theo điểm mã 224 [0xE0], máy tính cũng cung cấp một ký hiệu SPACE rộng ba ký tự đặc biệt 5 [tương tự như U+2420 một ô rộng của Unicode]. [20][21]

Khoảng trống không có dấu cách[sửa]

  • Khối Unicode Mẫu chữ nổi chứa U+2800 ⠀ BRAILLE PATTERN BLANK, một mẫu chữ nổi không có dấu chấm nổi. Một số phông chữ hiển thị ký tự dưới dạng khoảng trống có chiều rộng cố định, tuy nhiên, tiêu chuẩn Unicode tuyên bố rõ ràng rằng nó không hoạt động như một khoảng trắng. [22]
  • Độ bao phủ của bảng chữ cái tiếng Hàn của Unicode bao gồm một số điểm mã thể hiện sự vắng mặt của một chữ cái được viết và do đó không hiển thị glyph
    • Unicode bao gồm một ký tự Hangul Filler trong khối Jamo Tương thích Hangul [U+3164 ㅤ HANGUL FILLER]. Đây được phân loại là một chữ cái, nhưng được hiển thị dưới dạng khoảng trống, giống như một khối Hangul không chứa jamo. Nó được sử dụng trong KS X 1001 Hangul kết hợp trình tự để giới thiệu chúng hoặc biểu thị sự vắng mặt của một chữ cái trong một vị trí, nhưng không phải trong hệ thống jamo kết hợp của Unicode. [23]
    • Hệ thống jamo kết hợp của Unicode sử dụng các ký tự Hangul Choseong Filler và Hangul Jungseong Filler tương tự để biểu thị sự vắng mặt của một chữ cái ở vị trí đầu hoặc giữa trong một khối âm tiết, được bao gồm trong khối Hangul Jamo [U+115F ᅟ HANGUL CHOSEONG FILLER, U+ . [24]
    • Ngoài ra, Bộ đệm Hangul Nửa chiều rộng được bao gồm trong Biểu mẫu Nửa chiều rộng và Toàn chiều rộng [U+FFA0 ᅠ HALFWIDTH HANGUL FILLER], được sử dụng khi ánh xạ từ mã hóa bao gồm các ký tự từ cả Johab [hoặc Wansung] và N-byte Hangul [hoặc EBCDIC của nó . [25][26]

Khoảng trắng và kiểu chữ kỹ thuật số[sửa | sửa mã nguồn]

Hiển thị trên màn hình[sửa]

Trình soạn thảo văn bản, trình xử lý văn bản và phần mềm xuất bản trên máy tính để bàn khác nhau về cách chúng biểu thị khoảng trắng trên màn hình và cách chúng biểu thị khoảng trắng ở cuối dòng dài hơn chiều rộng của màn hình hoặc cột. Trong một số trường hợp, khoảng trắng được hiển thị đơn giản là khoảng trống; . Nhiều ký tự khác nhau [được mô tả bên dưới] có thể được sử dụng để tạo khoảng trắng và các chức năng không phải ký tự [chẳng hạn như cài đặt lề và tab] cũng có thể ảnh hưởng đến khoảng trắng

Không gian đa năng có chiều rộng thay đổi[sửa]

Trong mã hóa ký tự máy tính, có một khoảng trống thông thường có mục đích chung [ký tự Unicode U+0020] có chiều rộng sẽ thay đổi tùy theo thiết kế của kiểu chữ. Các giá trị điển hình nằm trong khoảng từ 1/5 em đến 1/3 em [trong kiểu chữ kỹ thuật số, em bằng với kích thước danh nghĩa của phông chữ, vì vậy đối với phông chữ 10 điểm, khoảng cách có thể nằm trong khoảng từ 2 đến 3. 3 điểm]. Các phông chữ phức tạp có thể có các khoảng trống có kích thước khác nhau cho các kiểu chữ đậm, nghiêng và chữ hoa nhỏ và thường các nhà tổng hợp sẽ điều chỉnh độ rộng của khoảng cách theo cách thủ công tùy thuộc vào kích thước và độ nổi bật của văn bản

Ngoài không gian có mục đích chung này, có thể mã hóa một không gian có chiều rộng cụ thể. Xem bảng dưới đây để biết danh sách đầy đủ

Khoảng cách tóc xung quanh dấu gạch ngang[sửa | sửa mã nguồn]

Dấu gạch ngang em được sử dụng làm dấu phân cách trong ngoặc đơn và dấu gạch ngang en khi được sử dụng làm dấu nối từ, thường được đặt liên tục với văn bản. [27] Tuy nhiên, một dấu gạch ngang như vậy có thể tùy chọn được bao quanh bằng khoảng cách tóc, U+200A hoặc khoảng cách mỏng, U+2009. Không gian tóc có thể được viết bằng HTML bằng cách sử dụng các tham chiếu ký tự số  0 hoặc  0 hoặc thực thể có tên  0, nhưng chưa được hỗ trợ phổ biến trong các trình duyệt kể từ năm 2016. [cái nào?] Không gian mỏng được đặt tên là thực thể trim[]0 và tham chiếu số trim[]0 hoặc trim[]0. Những khoảng trống này mỏng hơn nhiều so với khoảng trắng thông thường [ngoại trừ trong phông chữ đơn cách [không theo tỷ lệ]], với khoảng cách tóc mỏng hơn trong hai khoảng trống

Khoảng trống thông thường so với khoảng cách tóc và khoảng cách mỏng [do trình duyệt của bạn hiển thị] Khoảng cách thông thường với em gạch ngangtrái— phảiKhoảng cách mỏng với em gạch ngangtrái — phảiKhoảng cách tóc với em gạch ngangtrái — phảiKhông có khoảng trắng với em gạch ngangtrái—phải

Ngôn ngữ lập trình[sửa]

Trong cú pháp ngôn ngữ lập trình, khoảng trắng thường được sử dụng để phân tách rõ ràng các mã thông báo. Trong hầu hết các ngôn ngữ, nhiều ký tự khoảng trắng được coi giống như một ký tự khoảng trắng duy nhất [bên ngoài các chuỗi được trích dẫn]; . Trong một số ngôn ngữ, bao gồm Haskell, occam, ABC và Python, khoảng trắng và thụt đầu dòng được sử dụng cho các mục đích cú pháp. Trong ngôn ngữ châm biếm được gọi là Khoảng trắng, các ký tự khoảng trắng là ký tự hợp lệ duy nhất để lập trình, trong khi bất kỳ ký tự nào khác đều bị bỏ qua

Việc sử dụng quá nhiều khoảng trắng, đặc biệt là khoảng trắng ở cuối dòng, được coi là một điều phiền toái. Tuy nhiên, việc sử dụng đúng khoảng trắng có thể làm cho mã dễ đọc hơn và giúp logic liên quan đến nhóm

Hầu hết các ngôn ngữ chỉ nhận dạng các ký tự ASCII dưới dạng khoảng trắng hoặc trong một số trường hợp, cả các dòng mới Unicode, nhưng không phải hầu hết các ký tự được liệt kê ở trên. Ngôn ngữ C định nghĩa các ký tự khoảng trắng là "dấu cách, tab ngang, dòng mới, tab dọc và nguồn cấp dữ liệu biểu mẫu". [28] Giao thức mạng HTTP yêu cầu các loại khoảng trắng khác nhau được sử dụng trong các phần khác nhau của giao thức, chẳng hạn như. chỉ ký tự khoảng trắng trong dòng trạng thái, CRLF ở cuối dòng và "khoảng trắng tuyến tính" trong các giá trị tiêu đề. [29]

Giao diện người dùng dòng lệnh[sửa]

Trong các lệnh được xử lý bởi bộ xử lý lệnh, e. g. , trong các tập lệnh và được nhập vào, ký tự khoảng trắng có thể gây ra sự cố vì nó có thể có hai chức năng. như một phần của lệnh hoặc tham số hoặc dưới dạng tham số hoặc dấu tách tên. Sự mơ hồ có thể được ngăn chặn bằng cách cấm các khoảng trắng được nhúng hoặc bằng cách đặt tên có khoảng trắng được nhúng giữa các ký tự trích dẫn

Ngôn ngữ đánh dấu[sửa]

Một số ngôn ngữ đánh dấu, chẳng hạn như SGML, giữ nguyên khoảng trắng khi viết

Các ngôn ngữ đánh dấu trang web như XML và HTML xử lý các ký tự khoảng trắng một cách đặc biệt, bao gồm các ký tự khoảng trắng, để thuận tiện cho người lập trình. Một hoặc nhiều ký tự khoảng trắng được đọc bởi bộ xử lý thời gian hiển thị phù hợp của các ngôn ngữ đánh dấu đó được thu gọn thành 0 hoặc 1 khoảng trắng, tùy thuộc vào ngữ cảnh ngữ nghĩa của chúng. Ví dụ: khoảng trắng kép [hoặc nhiều hơn] trong văn bản được thu gọn thành một khoảng trắng duy nhất và khoảng trắng xuất hiện ở hai bên của "2" ngăn cách tên thuộc tính khỏi giá trị của nó không ảnh hưởng đến việc diễn giải tài liệu. Thẻ kết thúc phần tử có thể chứa khoảng trắng ở cuối và thẻ phần tử trống trong XML có thể chứa khoảng trắng trước "3". Trong các ngôn ngữ này, khoảng trắng không cần thiết sẽ làm tăng kích thước tệp và do đó có thể làm chậm quá trình truyền mạng. Mặt khác, khoảng trắng không cần thiết cũng có thể đánh dấu mã một cách kín đáo, tương tự, nhưng ít rõ ràng hơn so với nhận xét trong mã. Điều này có thể được mong muốn để chứng minh hành vi vi phạm giấy phép hoặc bản quyền do sao chép và dán

Trong các giá trị thuộc tính XML, các chuỗi ký tự khoảng trắng được coi là một khoảng trắng khi tài liệu được đọc bởi trình phân tích cú pháp. [30] Trình phân tích cú pháp không thay đổi khoảng trắng trong nội dung phần tử XML theo cách này, nhưng một ứng dụng nhận thông tin từ trình phân tích cú pháp có thể chọn áp dụng các quy tắc tương tự cho nội dung phần tử. Tác giả tài liệu XML có thể sử dụng thuộc tính 4 trên một phần tử để hướng dẫn trình phân tích cú pháp không khuyến khích ứng dụng xuôi dòng thay đổi khoảng trắng trong nội dung của phần tử đó

Trong hầu hết các thành phần HTML, một chuỗi các ký tự khoảng trắng được coi là một dấu tách giữa các từ, có thể hiển thị dưới dạng một ký tự khoảng trắng khi hiển thị văn bản bằng ngôn ngữ thường chèn khoảng trắng như vậy giữa các từ. [31] Trình kết xuất HTML phù hợp được yêu cầu áp dụng cách xử lý khoảng trắng theo nghĩa đen hơn trong một số thành phần được quy định, chẳng hạn như thẻ 5 và bất kỳ thành phần nào mà CSS đã được sử dụng để áp dụng xử lý khoảng trắng giống như 5. Trong các phần tử như vậy, các ký tự khoảng trắng sẽ không bị "thu gọn" thành các dấu phân cách giữa các từ

Trong cả XML và HTML, ký tự khoảng trắng không ngắt, cùng với các khoảng trắng không "chuẩn" khác, không được coi là "khoảng trắng" có thể thu gọn, do đó, ký tự này không tuân theo các quy tắc ở trên

Tên tập tin[sửa]

Cách sử dụng như vậy tương tự như các tên tệp nhiều từ được viết cho các hệ điều hành và ứng dụng bị nhầm lẫn bởi các mã không gian được nhúng—các tên tệp như vậy thay vì sử dụng dấu gạch dưới [_] làm dấu tách từ, as_in_this_phrase

Một biểu tượng khác như vậy là U+2422 ␢ BLANK SYMBOL. Điều này đã được sử dụng trong những năm đầu lập trình máy tính khi viết trên các biểu mẫu mã hóa. Các nhà khai thác Keypunch ngay lập tức nhận ra biểu tượng là một "không gian rõ ràng". [16] Nó được sử dụng trong BCDIC,[16] EBCDIC,[16] và ASCII-1963. [16]

Ký tự khoảng trắng này là gì?

Dấu cách, tab, xuống dòng [dòng mới], xuống dòng, nạp biểu mẫu và tab dọc được gọi là "ký tự khoảng trắng" vì chúng có cùng mục đích như ký tự .

Khoảng trắng có nghĩa là gì?

danh từ. . các khu vực của trang không có chữ in hoặc hình ảnh .

Khoảng trắng so với khoảng trắng là gì?

Khái niệm đằng sau khoảng trắng rất đơn giản. Nó chỉ đơn giản là khoảng cách giữa văn bản, đồ họa, hình ảnh và khối . Khoảng trắng còn được gọi là khoảng trống hoặc không gian trống. Một số người tạo nội dung sẽ không bao gồm bất kỳ khoảng trắng nào trong thiết kế của họ, giúp họ có không gian để phù hợp với nhiều nội dung hơn.

Tại sao PHP được gọi là không nhạy cảm với khoảng trắng?

PHP không phân biệt khoảng trắng . PHP không phân biệt khoảng trắng nghĩa là việc bạn có bao nhiêu ký tự khoảng trắng trong một hàng gần như không quan trọng .

Chủ Đề