Multibyte String 일본어 멀티바이트 인코딩의 기초

일본어 문자는 멀티바이트 인코딩으로만 표현할 수 있으며 플랫폼 및 텍스트 목적에 따라 여러 인코딩 표준이 사용됩니다. 설상가상으로 이러한 인코딩 표준은 서로 약간 다릅니다. 일본 환경에서 사용할 수 있는 웹 응용 프로그램을 만들기 위해 개발자는 적절한 문자 인코딩이 사용되도록 이러한 복잡성을 염두에 두어야 합니다.

  • 문자 저장 공간은 최대 6바이트입니다.
  • 대부분의 일본어 멀티바이트 문자는 싱글바이트 문자 너비의 두 배입니다. 이 문자는 일본어로 "전각"을 의미하는 "젠카쿠"라고 합니다. 다른 좁은 문자는 "반 너비"를 의미하는 "한카쿠"라고 합니다. 그러나 문자의 그래픽 속성은 문자를 표시하는 데 사용되는 서체에 따라 다릅니다.
  • 일부 문자 인코딩은 ISO-2022에 정의된 시프트(이스케이프) 시퀀스를 사용하여 특정 코드 영역(00h에서 7fh)의 코드 맵을 전환합니다.
  • ISO-2022-JP는 SMTP/NNTP에서 사용해야 하며 헤더와 엔터티는 RFC 요구 사항에 따라 다시 인코딩해야 합니다. 이것이 필수 사항은 아니지만 여러 인기 있는 사용자 에이전트가 다른 인코딩 방법을 인식할 수 없기 때문에 여전히 좋은 생각입니다.
  • » i-mode 또는 » EZweb과 같은 휴대전화 서비스용으로 만든 웹 페이지는 Shift_JIS를 사용해야 합니다.
  • » i-mode 또는 » EZweb과 같은 휴대전화 서비스에 사용되는 이모티콘이 지원됩니다.