본문 바로가기

백엔드/os 및 일반 지식

컴퓨터 내부의 언어 체계 - 텍스트 표현

반응형

** 아스키 코드

- ASCII (American Standard Code for Information Interchange)

- 키보드에 있는 모든 기호에 대해 7비트 값을 할당했다.

 

 

- 글자 출력 용도뿐만이 아니라, 장치 제어 용도로 쓰이는 것도 있다.

**유니코드 변환형식 8비트

- 컴퓨터는 7비트 값을 처리하도록 설계되지 않았기 때문에 8비트를 사용해 아스키 문자를 저장한다.

- 인코딩이란, 다른 비트 패턴을 표현하기 위해 사용하는 비트 패턴을 뜻한다.

- 미국 컴퓨터 과학자 켄 톰슨과 캐나다 프로그래머 롭 파이크가 만든 유니코드 변환 형식 8비트라는 인코딩 방법이

하위 호환성과 효율성 때문에 가장 널리 쓰인다.

- UTF-8은 모든 아스키 문자를 8비트로 표현하기 때문에 아스키 데이터를 인코딩 할 때는 추가 공간이 필요하지 않다.또한 아스키가 아닌 문자를 받는 경우 프로그램이 깨지지 않는 방법으로 인코딩한다.

- UTF-8은 8비트 덩어리의 시퀀스로 인코딩한다.

 

반응형