Multibyte String 지원되는 인코딩 요약

지원되는 인코딩 요약

IANA 문자 집합 레지스트리의 이름 기본 문자 집합 설명 추가 참고 사항
ISO-10646-UCS-4 ISO 10646 ISO/IEC 10646에서 UCS-4로 표준화한 31비트 코드 공간의 범용 문자 집합입니다. 최신 버전의 유니코드 코드 맵과 동기화된 상태로 유지됩니다. 이 이름이 인코딩 변환 기능에서 사용되는 경우 변환기는 후속 바이트가 표시되는 엔디안이 있는 선행 BOM(바이트 순서 표시)으로 식별을 시도합니다.
ISO-10646-UCS-4 UCS-4 위 참조. UCS-4와 달리 문자열은 항상 빅 엔디안 형식으로 간주됩니다.
ISO-10646-UCS-4 UCS-4 위 참조. UCS-4와 달리 문자열은 항상 리틀 엔디안 형식으로 가정됩니다.
ISO-10646-UCS-2 UCS-2 ISO/IEC 10646에 의해 UCS-2로 표준화된 16비트 코드 공간의 범용 문자 집합입니다. 최신 버전의 유니코드 코드 맵과 동기화된 상태로 유지됩니다. 이 이름이 인코딩 변환 기능에서 사용되는 경우 변환기는 후속 바이트가 표시되는 엔디안이 있는 선행 BOM(바이트 순서 표시)으로 식별을 시도합니다.
ISO-10646-UCS-2 UCS-2 위 참조. UCS-2와 달리 문자열은 항상 빅 엔디안 형식으로 간주됩니다.
ISO-10646-UCS-2 UCS-2 위 참조. UCS-2와 달리 문자열은 항상 리틀 엔디안 형식으로 간주됩니다.
UTF-32 Unicode 인코딩 공간이 유니코드의 코드 세트 표준을 참조하는 32비트 단위 너비의 유니코드 변환 형식입니다. 이 인코딩 체계는 유니코드의 코드 공간이 21비트 값으로 제한되었기 때문에 UCS-4와 동일하지 않았습니다. 이 이름이 인코딩 변환 기능에서 사용되는 경우 변환기는 후속 바이트가 표시되는 엔디안이 있는 선행 BOM(바이트 순서 표시)으로 식별을 시도합니다.
UTF-32BE Unicode 위 참조 UTF-32와 달리 문자열은 항상 빅 엔디안 형식으로 간주됩니다.
UTF-32LE Unicode 위 참조 UTF-32와 달리 문자열은 항상 리틀 엔디안 형식으로 간주됩니다.
UTF-16 Unicode 16비트 단위 너비의 유니코드 변환 형식입니다. UTF-16은 유니코드 2.0 이후로 대리 메커니즘이 도입되었고 이제 UTF-16이 21비트 코드 공간을 참조하기 때문에 UTF-16은 더 이상 UCS-2와 동일한 사양이 아닙니다. 이 이름이 인코딩 변환 기능에서 사용되는 경우 변환기는 후속 바이트가 표시되는 엔디안이 있는 선행 BOM(바이트 순서 표시)으로 식별을 시도합니다.
UTF-16BE Unicode 위 참조. UTF-16과 달리 문자열은 항상 빅 엔디안 형식으로 간주됩니다.
UTF-16LE Unicode 위 참조. UTF-16과 달리 문자열은 항상 빅 엔디안 형식으로 간주됩니다.
UTF-8 Unicode / UCS 8비트 단위 너비의 유니코드 변환 형식입니다. 없음
UTF-7 Unicode » RFC2152에 지정된 유니코드의 메일 안전 변환 형식입니다. 없음
(none) Unicode » IMAP protocol에서 사용하도록 특수화된 UTF-7의 변형입니다. 없음
US-ASCII (preferred MIME name) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII ASCII / ISO 646 정보 교환을 위한 미국 표준 코드는 일반적으로 사용되는 7비트 인코딩입니다. 또한 국제 표준인 ISO 646으로 표준화되었습니다. (없음)
EUC-JP (preferred MIME name) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese Compound of US-ASCII / JIS X0201:1997 (hankaku kana part) / JIS X0208:1990 / JIS X0212:1990 이름에서 알 수 있듯이 일본어용 확장 UNIX 코드 팩 형식의 약어에서 파생된 것으로 이 인코딩은 대부분 UNIX 또는 유사한 플랫폼에서 사용됩니다. 원래 인코딩 체계인 확장 UNIX 코드는 ISO 2022를 기반으로 설계되었습니다. EUC-JP에서 참조하는 문자 집합은 OS/2® 및 Microsoft® Windows®에서 사용되는 IBM932 / CP932와 다릅니다. 해당 플랫폼과의 정보 교환을 위해 EUCJP-WIN을 대신 사용하십시오.
Shift_JIS (preferred MIME name) / MS_Kanji / csShift_JIS Compound of JIS X0201:1997 / JIS X0208:1997 Shift_JIS는 레거시 인코딩 체계 JIS X 0201:1976과의 호환성을 유지하기 위해 개인용 일본어 워드 프로세서가 시장에 출시된 80년대 초에 개발되었습니다. IANA 정의에 따르면 Shift_JIS의 코드 세트는 IBM932/CP932와 약간 다릅니다. 그러나 "SJIS" / "Shift_JIS"라는 이름은 종종 이러한 코드 세트를 참조하는 데 잘못 사용됩니다. CP932 코드맵의 경우 SJIS-WIN을 대신 사용하십시오.
(none) Compound of JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions 이 "인코딩"은 EUC-JP와 동일한 인코딩 체계를 사용하지만 기본 문자 집합은 다릅니다. 즉, 일부 코드 포인트는 EUC-JP와 다른 문자에 매핑됩니다. none
Windows-31J / csWindows31J Compound of JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions 이 "인코딩"은 Shift_JIS와 동일한 인코딩 체계를 사용하지만 기본 문자 집합은 다릅니다. 즉, 일부 코드 포인트는 Shift_JIS와 다른 문자에 매핑됩니다. (none)
ISO-2022-JP (preferred MIME name) / csISO2022JP US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 » RFC1468 (none)
JIS
ISO-8859-1
ISO-8859-2
ISO-8859-3
ISO-8859-4
ISO-8859-5
ISO-8859-6
ISO-8859-7
ISO-8859-8
ISO-8859-9
ISO-8859-10
ISO-8859-13
ISO-8859-14
ISO-8859-15
ISO-8859-16
byte2be
byte2le
byte4be
byte4le
BASE64
HTML-ENTITIES
7bit
8bit
EUC-CN
CP936
HZ
EUC-TW
CP950
BIG-5
EUC-KR
UHC (CP949)
ISO-2022-KR
Windows-1251 (CP1251)
Windows-1252 (CP1252)
CP866 (IBM866)
KOI8-R
KOI8-U