Multibyte String 소개

소개

필요한 모든 문자를 8비트 값에 대한 일대일 매핑으로 나타낼 수 있는 많은 언어가 있지만 서면 통신에 너무 많은 문자가 필요하여 범위 내에 포함될 수 없는 언어도 있습니다. 단순한 바이트는 코딩할 수 있습니다(바이트는 8비트로 구성됩니다. 각 비트에는 1 또는 0의 두 가지 고유한 값만 포함될 수 있습니다. 이 때문에 바이트는 256개의 고유 값(2의 8제곱)만 나타낼 수 있습니다. 멀티바이트 문자 인코딩 체계는 일반 바이트 단위 코딩 시스템에서 256개 이상의 문자를 표현하기 위해 개발되었습니다.

멀티바이트 인코딩으로 인코딩된 문자열을 조작(트림, 분할, 스플라이스 등)하는 경우 이러한 인코딩 체계에서 두 개 이상의 연속 바이트가 단일 문자를 나타낼 수 있으므로 특수 함수를 사용해야 합니다. 그렇지 않고 멀티바이트를 인식하지 않는 문자열 함수를 문자열에 적용하면 멀티바이트 문자의 시작 또는 끝을 감지하지 못하고 결국 원래 의미를 잃을 가능성이 높은 손상된 가비지 문자열로 끝납니다.

mbstring은 PHP에서 멀티바이트 인코딩을 처리하는 데 도움이 되는 멀티바이트 특정 문자열 함수를 제공합니다. 그 외에도 mbstring은 가능한 인코딩 쌍 간의 문자 인코딩 변환을 처리합니다. mbstring은 편의를 위해 UTF-8 및 UCS-2와 같은 유니코드 기반 인코딩과 많은 단일 바이트 인코딩을 처리하도록 설계되었습니다(아래 나열).