무민이의 반반무많이

문자 인코딩(Character Encoding) – ASCII, ANSI, Unicode, UTF 본문

Assembly/Theory

문자 인코딩(Character Encoding) – ASCII, ANSI, Unicode, UTF

M00min 2016.07.08 00:49

(공감과 댓글 하나는 글쓴이에게 큰 힘이 됩니다.)


문자 인코딩(Character Encoding)이란 문자나 기호들의 집합을 컴퓨터에 저장하거나 사용할 목적으로 부호화 하는 방법을 말한다.

 

● 아스키(ASCII)

- bit(비트) 문자 인코딩으로 0(0x00) ~ 127(0x7F)까지 총 128개의 부호가 사용

- 영문 키보드로 입력할 수 있는 모든 기호들이 할당되어 있는 부호 체계

- 한글과 같은 2바이트 이상의 코드를 표현 불가능


● ANSI

- 영어 이외의 문자를 표현하기 위해 사용

- 2바이트 문자와 1바이트 ASCII 문자를 혼용하는 가변길이 인코딩

- 한글은 표현되지만 더 많은 문자들을 인코딩하지는 못함

 

● Unicode

- 전 세계의 모든 문자를 일관되게 표현할 수 있도록 설계된 산업 표준

- 모든 글자를 2바이트로 표현

 

● UTF8

- 유니코드 인코딩 중에 하나로 문자열을 8Bit 기반으로 저장

- ANSI 문자는 그대로, 아시아 문자는 3바이트로 가변 표기

 

● UTF16

- 문자열을 16Bit 기반으로 저장

- 한글을 2바이트로 저장할 수 있어서 영어와 한글을 함께 처리할 경우 편리

- ANSI와 호환이 안된다는 단점

0 Comments
댓글쓰기 폼