2025. 3. 28. 09:35ㆍJAVA/JAVA 기초 문법
컴퓨터는 문자를 직접 저장할 수 없고, 대신 숫자로 변환하여 저장합니다.
이때, 각 문자에 고유한 숫라를 부여하는 체계가 문자인코딩(Character Encoding)입니다.
대표적인 문자 인코딩 방식에는 아스키코드(ASCII code)와 유니코드(Uni code)가 있습니다.
🔹 ASCII(아스키) 코드란?
ASCII (American Standard Code for Information Interchange)
✅ 미국에서 개발한 문자 인코딩 표준
✅ 영문 알파벳, 숫자, 일부 특수 문자만 포함
✅ 7비트(0~127)로 구성 (총 128개 문자 표현 가능)
✅ 한글, 한자, 기타 언어 지원 ❌ (비영어권에서는 사용 어려움)
🟥 ASCII의 한계 🟥
❌ 영어권 외의 문자(한글, 한자 등) 지원 불가
❌ 7비트로는 다양한 언어를 표현하기 어려움
✔️ 이를 해결하기 위해 확장 ASCII(8비트, 256개 문자)와 유니코드(Unicode)가 등장!
🔹 유니코드(Unicode)란?
유니코드(Unicode) = 전 세계 모든 문자를 표현할 수 있는 문자 인코딩 표준
✅ 국제 표준 문자 인코딩
✅ 모든 언어(한글, 한자, 아랍어 등) 지원
✅ 1~4바이트 사용 (UTF-8, UTF-16, UTF-32 방식 존재)
🔵 유니코드 vs ASCII 비교 🔵
| ASCII | 유니코드 | |
| 지원 문자 | 영어, 숫자, 특수 문자 | 전 세계 모든 문자(한글, 한자 포함) |
| 비트 크기 | 7비트(128개의 문자) | 1~4바이트 (약 100만 개 문자) |
| 대표 인코딩 | ASCII | UTF-8, UTF-16, UTF-32 |
| 한글 지원 | ❌ | ✅ |
🎯 정리 🎯
✅ ASCII (7비트) → 영어 및 기본 문자만 표현 가능 (128개 문자)
✅ 유니코드 (1~4바이트) → 전 세계 모든 문자 표현 가능
✅ UTF-8(웹 표준), UTF-16(Windows), UTF-32(고정 크기)
✅ 한글(가)의 유니코드 값: U+AC00 (UTF-8에서 3바이트로 표현됨)
🚀 유니코드는 전 세계 모든 언어를 표현하는 강력한 표준! 💡
'JAVA > JAVA 기초 문법' 카테고리의 다른 글
| 데이터 캡슐화(Data Encapsulaton) (0) | 2025.03.28 |
|---|---|
| Expression 과 Statement (0) | 2025.03.28 |
| Data type (0) | 2025.03.28 |
| High Level Language (0) | 2025.03.28 |
| 마크 다운 단어 (0) | 2025.03.28 |