-
UTF-8 과 ASCII 의 관계에 대해 아시나요?알아두면 좋은것 2018. 5. 24. 15:47
오늘은 UTF-8과 ASCII 의 관계성에 대해 알아보겠습니다~
우선 ASCII와 UTF-8의 정의에 대해 살펴보겠습니다!
ASCII
American Standard Code for Information Interchange
의 줄임말로 ASCII (아스키) 라고 불리며
영문 알파벳을 사용하는 대표적인 문자 인코딩 방식
1바이트(8bit) 인코딩으로 최상위 비트는 항상 0으로 고정되어 있다.
따라서 2^8 = 128개를 표현할 수 있다.
(아스키코드 표)
UTF-8
유니코드를 위한 가변 길이 문자 인코딩 방식
한 문자를 나타내기 위해 1바이트 ~ 4바이트 까지를 사용한다
한글, 중국어 등 모든 유니코드 언어의 문자를 처리할 수 있기에
다국어 국제 표준이다
그럼 중요한 UTF-8과 ASCII와의 상관관계를 알아보겠습니다UTF-8은 앞선 정의와 같이 가변 길이를 가지기 때문에
ASCII코드로 나타낼 수 있는 문자라면 ASCII 문자와 동일한 방법으로 표시되며 1바이트의 길이를 가질 수 있습니다.
1바이트로 표시된 문자는 ASCII코드와 마찬가지고 최상위 비트는 항상 0을 가지기 때문에
-> 쉽게 보면 ASCII ⊂ UTF-8 이라고 볼 수 있습니다.
'알아두면 좋은것' 카테고리의 다른 글
[Java Spring] Spring Singleton (0) 2018.12.05 [Java Spring] Application context (0) 2018.12.05 Singleton Pattern 싱글턴 패턴 (0) 2018.12.05 [Java Spring] Spring Bean (0) 2018.12.05 객체 지향 5대 원칙 : SOLID 원칙 (0) 2018.12.05 댓글