아스키코드 유니코드

2025. 3. 28. 09:35JAVA/JAVA 기초 문법

컴퓨터는 문자를 직접 저장할 수 없고, 대신 숫자로 변환하여 저장합니다.

이때, 각 문자에 고유한 숫라를 부여하는 체계가 문자인코딩(Character Encoding)입니다.

대표적인 문자 인코딩 방식에는 아스키코드(ASCII code)와 유니코드(Uni code)가 있습니다.

🔹 ASCII(아스키) 코드란?

ASCII (American Standard Code for Information Interchange)
미국에서 개발한 문자 인코딩 표준
영문 알파벳, 숫자, 일부 특수 문자만 포함
7비트(0~127)로 구성 (총 128개 문자 표현 가능)
한글, 한자, 기타 언어 지원 ❌ (비영어권에서는 사용 어려움)

 

🟥 ASCII의 한계 🟥

영어권 외의 문자(한글, 한자 등) 지원 불가
7비트로는 다양한 언어를 표현하기 어려움
✔️ 이를 해결하기 위해 확장 ASCII(8비트, 256개 문자)와 유니코드(Unicode)가 등장!

 

🔹 유니코드(Unicode)란?

유니코드(Unicode)  = 전 세계 모든 문자를 표현할 수 있는 문자 인코딩 표준
국제 표준 문자 인코딩
모든 언어(한글, 한자, 아랍어 등) 지원
1~4바이트 사용 (UTF-8, UTF-16, UTF-32 방식 존재)

유니코드 코드 포인트

🔵 유니코드 vs ASCII 비교 🔵

  ASCII 유니코드
지원 문자 영어, 숫자, 특수 문자 전 세계 모든 문자(한글, 한자 포함)
비트 크기 7비트(128개의 문자) 1~4바이트 (약 100만 개 문자)
대표 인코딩 ASCII UTF-8, UTF-16, UTF-32
한글 지원 

 

🎯 정리 🎯

ASCII (7비트) → 영어 및 기본 문자만 표현 가능 (128개 문자)
유니코드 (1~4바이트) → 전 세계 모든 문자 표현 가능
UTF-8(웹 표준), UTF-16(Windows), UTF-32(고정 크기)
한글(가)의 유니코드 값: U+AC00 (UTF-8에서 3바이트로 표현됨)

🚀 유니코드는 전 세계 모든 언어를 표현하는 강력한 표준! 💡

'JAVA > JAVA 기초 문법' 카테고리의 다른 글

데이터 캡슐화(Data Encapsulaton)  (0) 2025.03.28
Expression 과 Statement  (0) 2025.03.28
Data type  (0) 2025.03.28
High Level Language  (0) 2025.03.28
마크 다운 단어  (0) 2025.03.28