Internationalization Normalizer 클래스

(PHP 5 >= 5.3.0, PHP 7, PHP 8, PECL intl >= 1.0.0)


소개

정규화는 문자와 문자 시퀀스를 공식적으로 정의된 기본 표현으로 변환하는 과정입니다. 이 프로세스는 정렬 및 검색을 위해 텍스트를 비교해야 할 때 가장 중요하지만 텍스트를 일관된 표현으로 저장하기 위해 텍스트를 저장할 때도 사용됩니다.

유니코드 컨소시엄은 애플리케이션의 다양한 요구를 반영하는 여러 정규화 형식을 정의했습니다.

  • Normalization Form D (NFD) - Canonical Decomposition
  • Normalization Form C (NFC) - Canonical Decomposition followed by Canonical Composition
  • Normalization Form KD (NFKD) - Compatibility Decomposition
  • Normalization Form KC (NFKC) - Compatibility Decomposition followed by Canonical Composition

다른 형식은 텍스트에 대한 일련의 변환, 알고리즘 및 데이터 파일 세트 모두에 의해 표현되는 변환의 관점에서 정의됩니다.


클래스 개요

class Normalizer {
  /* Methods */
  public static getRawDecomposition(string $string, int $form = Normalizer::FORM_C): ?string
  public static isNormalized(string $string, int $form = Normalizer::FORM_C): bool
  public static normalize(string $string, int $form = Normalizer::FORM_C): string|false
}
                

미리 정의된 상수

다음 상수는 노멀라이저에서 사용하는 정규화 형식을 정의합니다.

Normalizer::FORM_C (int)
정규화 형식 C(NFC) - 정규 분해 후 정규 합성
Normalizer::FORM_D (int)
정규화 형식 D(NFD) - 정규 분해
Normalizer::FORM_KC (int)
정규화 형식 KC(NFKC) - 호환성 분해 후 표준 구성
Normalizer::FORM_KD (int)
정규화 형식 KD(NFKD) - 호환성 분해
Normalizer::NONE (int)
분해/구성 없음
Normalizer::OPTION_DEFAULT (int)
기본 정규화 옵션

기타


목차