SW/면접

컴퓨터는 character(문자) 정보를 어떻게 표현할까?

얇은생각 2019. 3. 18. 12:30
반응형

컴퓨터는 character(문자) 정보를 어떻게 표현할까?


character(문자) 정보를 어떻게 표현할까?

컴퓨터 및 기계기반 전기통신용어에 있어서 character(문자)는 자연어의 알파벳이나 음절과 같이 유사한 단위 또는 기호에 해당하는 정보 단위입니다.


문자의 예로는 문자, 숫자, 공통 문장 부호("." 또는 "-) 및 공백이 있습니다. 이 개념에는 특정 자연 언어의 기호에 해당하지 않고 하나 이상의 언어로 텍스트를 처리하는 데 사용되는 다른 정보 비트에 해당하는 제어 문자도 포함됩니다. 제어 문자의 예로는 텍스트를 표시하거나 처리하는 프린터 또는 기타 장치에 대한 지시사항뿐만 아니라 리턴 또는 탭이 있습니다.


문자 인코딩

컴퓨터와 통신장비는 각 문자를 할당하는 문자 인코딩을 사용하여 문자를 나타냅니다. 일반적으로 네트워크를 통해 저장하거나 전송할 수 있는 자릿수로 대표되는 정수량이다. 통상적인 인코딩의 두 가지 예는 유니코드를 위한 UTF-8 인코딩이다. 대부분의 문자 인코딩이 숫자 및/또는 비트 시퀀스에 문자를 매핑하는 반면, 모스 코드는 길이가 다른 일련의 전기 임펄스를 사용하여 문자를 대신 나타낸다.



ASCCII와 유니코드의 차이점

Ascii는 정보 교환을 위한 미국 표준 코드를 나타냅니다. 8비트 인코딩을 사용합니다. Ascii는 128자를 나타냅니다. Ascii는 8비트 바이트로 저장됩니다. ASCII가 표준화되지 않았습니다.


유니코드도 문자 인코딩이지만 가변 비트 인코딩을 사용합니다. 유니코드는 2^21자를 정의합니다. 유니코드는 ASCII의 상위 집합입니다. 유니코드는 ASCII보다 더 많은 문자를 나타냅니다. 유니코드가 UTF-32 및 UTF-8과 같은 바이트 시퀀스에 저장됩니다. 유니코드가 표준화되었습니다.



만약 아스키가 있는 데 유니코드가 왜 필요할까요?

유니코드는 엄청난 수의 문자를 나타내므로 필요합니다. 이것은 ASCII의 상위 집합입니다. 따라서 128자만을 나타내는 ASCII가 이미 있을 때 유니코드가 더 많은 문자를 나타내야 합니다. 

반응형