Multibyte String 지원되는 인코딩 요약
지원되는 인코딩 요약
IANA 문자 집합 레지스트리의 이름 | 기본 문자 집합 | 설명 | 추가 참고 사항 |
---|---|---|---|
ISO-10646-UCS-4 | ISO 10646 | ISO/IEC 10646에서 UCS-4로 표준화한 31비트 코드 공간의 범용 문자 집합입니다. 최신 버전의 유니코드 코드 맵과 동기화된 상태로 유지됩니다. | 이 이름이 인코딩 변환 기능에서 사용되는 경우 변환기는 후속 바이트가 표시되는 엔디안이 있는 선행 BOM(바이트 순서 표시)으로 식별을 시도합니다. |
ISO-10646-UCS-4 | UCS-4 | 위 참조. | UCS-4 와 달리 문자열은 항상 빅 엔디안 형식으로 간주됩니다. |
ISO-10646-UCS-4 | UCS-4 | 위 참조. | UCS-4 와 달리 문자열은 항상 리틀 엔디안 형식으로 가정됩니다. |
ISO-10646-UCS-2 | UCS-2 | ISO/IEC 10646에 의해 UCS-2로 표준화된 16비트 코드 공간의 범용 문자 집합입니다. 최신 버전의 유니코드 코드 맵과 동기화된 상태로 유지됩니다. | 이 이름이 인코딩 변환 기능에서 사용되는 경우 변환기는 후속 바이트가 표시되는 엔디안이 있는 선행 BOM(바이트 순서 표시)으로 식별을 시도합니다. |
ISO-10646-UCS-2 | UCS-2 | 위 참조. | UCS-2 와 달리 문자열은 항상 빅 엔디안 형식으로 간주됩니다. |
ISO-10646-UCS-2 | UCS-2 | 위 참조. | UCS-2 와 달리 문자열은 항상 리틀 엔디안 형식으로 간주됩니다. |
UTF-32 | Unicode | 인코딩 공간이 유니코드의 코드 세트 표준을 참조하는 32비트 단위 너비의 유니코드 변환 형식입니다. 이 인코딩 체계는 유니코드의 코드 공간이 21비트 값으로 제한되었기 때문에 UCS-4와 동일하지 않았습니다. | 이 이름이 인코딩 변환 기능에서 사용되는 경우 변환기는 후속 바이트가 표시되는 엔디안이 있는 선행 BOM(바이트 순서 표시)으로 식별을 시도합니다. |
UTF-32BE | Unicode | 위 참조 | UTF-32 와 달리 문자열은 항상 빅 엔디안 형식으로 간주됩니다. |
UTF-32LE | Unicode | 위 참조 | UTF-32 와 달리 문자열은 항상 리틀 엔디안 형식으로 간주됩니다. |
UTF-16 | Unicode | 16비트 단위 너비의 유니코드 변환 형식입니다. UTF-16은 유니코드 2.0 이후로 대리 메커니즘이 도입되었고 이제 UTF-16이 21비트 코드 공간을 참조하기 때문에 UTF-16은 더 이상 UCS-2와 동일한 사양이 아닙니다. | 이 이름이 인코딩 변환 기능에서 사용되는 경우 변환기는 후속 바이트가 표시되는 엔디안이 있는 선행 BOM(바이트 순서 표시)으로 식별을 시도합니다. |
UTF-16BE | Unicode | 위 참조. | UTF-16 과 달리 문자열은 항상 빅 엔디안 형식으로 간주됩니다. |
UTF-16LE | Unicode | 위 참조. | UTF-16 과 달리 문자열은 항상 빅 엔디안 형식으로 간주됩니다. |
UTF-8 | Unicode / UCS | 8비트 단위 너비의 유니코드 변환 형식입니다. | 없음 |
UTF-7 | Unicode | » RFC2152에 지정된 유니코드의 메일 안전 변환 형식입니다. | 없음 |
(none) | Unicode | » IMAP protocol에서 사용하도록 특수화된 UTF-7의 변형입니다. | 없음 |
US-ASCII (preferred MIME name) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII | ASCII / ISO 646 | 정보 교환을 위한 미국 표준 코드는 일반적으로 사용되는 7비트 인코딩입니다. 또한 국제 표준인 ISO 646으로 표준화되었습니다. | (없음) |
EUC-JP (preferred MIME name) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese | Compound of US-ASCII / JIS X0201:1997 (hankaku kana part) / JIS X0208:1990 / JIS X0212:1990 | 이름에서 알 수 있듯이 일본어용 확장 UNIX 코드 팩 형식의 약어에서 파생된 것으로 이 인코딩은 대부분 UNIX 또는 유사한 플랫폼에서 사용됩니다. 원래 인코딩 체계인 확장 UNIX 코드는 ISO 2022를 기반으로 설계되었습니다. | EUC-JP에서 참조하는 문자 집합은 OS/2® 및 Microsoft® Windows®에서 사용되는 IBM932 / CP932와 다릅니다. 해당 플랫폼과의 정보 교환을 위해 EUCJP-WIN을 대신 사용하십시오. |
Shift_JIS (preferred MIME name) / MS_Kanji / csShift_JIS | Compound of JIS X0201:1997 / JIS X0208:1997 | Shift_JIS는 레거시 인코딩 체계 JIS X 0201:1976과의 호환성을 유지하기 위해 개인용 일본어 워드 프로세서가 시장에 출시된 80년대 초에 개발되었습니다. IANA 정의에 따르면 Shift_JIS의 코드 세트는 IBM932/CP932와 약간 다릅니다. 그러나 "SJIS" / "Shift_JIS"라는 이름은 종종 이러한 코드 세트를 참조하는 데 잘못 사용됩니다. | CP932 코드맵의 경우 SJIS-WIN을 대신 사용하십시오. |
(none) | Compound of JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions | 이 "인코딩"은 EUC-JP와 동일한 인코딩 체계를 사용하지만 기본 문자 집합은 다릅니다. 즉, 일부 코드 포인트는 EUC-JP와 다른 문자에 매핑됩니다. | none |
Windows-31J / csWindows31J | Compound of JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions | 이 "인코딩"은 Shift_JIS와 동일한 인코딩 체계를 사용하지만 기본 문자 집합은 다릅니다. 즉, 일부 코드 포인트는 Shift_JIS와 다른 문자에 매핑됩니다. | (none) |
ISO-2022-JP (preferred MIME name) / csISO2022JP | US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 | » RFC1468 | (none) |
JIS | |||
ISO-8859-1 | |||
ISO-8859-2 | |||
ISO-8859-3 | |||
ISO-8859-4 | |||
ISO-8859-5 | |||
ISO-8859-6 | |||
ISO-8859-7 | |||
ISO-8859-8 | |||
ISO-8859-9 | |||
ISO-8859-10 | |||
ISO-8859-13 | |||
ISO-8859-14 | |||
ISO-8859-15 | |||
ISO-8859-16 | |||
byte2be | |||
byte2le | |||
byte4be | |||
byte4le | |||
BASE64 | |||
HTML-ENTITIES | |||
7bit | |||
8bit | |||
EUC-CN | |||
CP936 | |||
HZ | |||
EUC-TW | |||
CP950 | |||
BIG-5 | |||
EUC-KR | |||
UHC (CP949) | |||
ISO-2022-KR | |||
Windows-1251 (CP1251) | |||
Windows-1252 (CP1252) | |||
CP866 (IBM866) | |||
KOI8-R | |||
KOI8-U |