뭐 이게 대단한 것은 아니지만...혼자 아는 것보다는...

한글이라는 문자 체계에 대해, 행복함을 느끼고 있다.
대왕님의 자비심이...4천년 넘게 이땅에서 이루어진 어떤 일들 중에서도 가장 훌륭한 일이었다고 생각한다.
다만 컴퓨터라는 물건과 그에 따른 모든 기준이...우리 땅에서 먼저 생기지 않았다는 것이 문제였을까?

알파벳과 달리, 한글은 컴퓨터에서 구현하는데 제약이 심하다.
그건...다른 무엇보다도 풀어쓰기가 아니라는데서 오는 것이지.
도스시절 완성형이네 조합형이네 하고 싸우던 생각이 나는군. 창제 원리에 따르면 조합형이 타당했지만...결국 지금은 완성형의 세상이지. 용량 문제가 발목을 잡는 일은 결국 일어나지 않았어. 게다가 한자를 표현하려면 어차피 조합형으로는 답이 없긴 했으니까.
다만...이 완성형이라는 문제가 지금도 발목을 잡기는 했다.

문명의 문법은, XML을 기반으로 하고 있으며, 때문에 HTML규격에 의해 작성되어야 한다.
그래서 한글(=2바이트 문자)을 어떻게 표현하느냐...의 문제가 생겼지.
동아시아의 주요 3가지 문자 체계가 모두 2바이트의 지배를 받기 때문에,
적어도 문명4에 관한 한, 한글판은 버전을 막론하고 일문판이나 중문판을 무단으로;; 가져다 한글로 바꾼 것이다. 나도 그랬고...

이 2바이트를 써야 한다는 공통점...을 가장 잘 해결해 주는 인코딩 방식은 UTF-8이다.
동아 3국에서 코드가 같다면 항상 동일한 문자를 보여주는...진정한 유니코드 방식이지.
문명도 처리할 때는 내부적으로 이 코드를 사용할 수 있다. 사실 그거야 파이썬에서 자비를 베푸는 거지만...

그런데......
XML을 작성할 때에는...그것이 메모장의 규격을 따라간다는 것이 문제다--;
한글 윈도우에서 기본으로 적용시키는 유니코드 문자가...EUC-KR이라는 절름발이 체계라는 게 문제지...
메모장에서 저장할 때 UTF-8로 지정하면 되지 않느냐고?

안읽혀

문명에서 거부한단 말이야...저장할 때는 무조건 안시ANSI코드로 입력되어야 한다구...
사실 한글 쓰는데는 EUC-KR로도 충분하긴 해. 거의 실생활에서 쓰지 않는 특이한 글자들이나 못쓰는 거니까.
하지만...한자는 그렇지 않은 경우가 왕왕...물론 우리가 쓰는 한자는 거의 다 들어가있지. 근데 어제 포스팅이 뭐였지...?
삼국지였다구! 중국인들만 나온단 말이야! 우리가 쓰는 인명용 한자 제한 그런거 없다구!

자...문제가 된 인간들 중 가장 네임드...인 장합을 예로 들어보자.
이분은 한자로 張郃이라고 쓴다. 문제는 뒤의 글자...郃(고을이름 합)
합자를 치고, 한자로 바꾸기를 눌러봐.

그런거 안나와

우리는 잘 안쓰는 한자였다 이거야...그래서 빠져있지.
저걸 어떻게 썼느냐...그야 다른데서 복붙해 온거지.
메모장에다 옮겨 붙이면 어떻게 되느냐고? 한번 저장해 볼까?


미리 얘기했지만...문명은 ANSI가 아니면 취급 안한다고 했다...
이러다 보니, 저런 특수 한자를 어떻게 하면 입력할 수 있을까...하는 문제가 있지.
해결 방법은...다음과 같은 표기법을 이용하는 것이다.

張郃

이렇게 하면 알아서 저걸 郃자로 바꿔서 보여준다.
코드는 뭐...알아서 찾아야 하지만 구현 방법이 있다는 게 어디야?

크악...이게 어제 포스팅에서 썼던 '해결된 문제'야. 기쁘기는 했다만 아직도 넘어갈 산이 많지. 중요한 것은 정작...T_T


p.s. 눈치챈 사람 있는지 모르겠네. 본 포스팅은 분노와 집념의 포스팅에 대한 오마쥬입니다. 꼭 보세요^^;
 

'씨앗 농부의 하수인 > 문맹4 뒷칼 전체' 카테고리의 다른 글

나는 마라톤을 사랑한다  (0) 2011.12.21
공부가 더 필요하군...  (2) 2011.11.03
푸념  (4) 2011.10.07
본편에는 글이 아예...  (0) 2011.08.12
죠니 사사키가 작성한 글입니다.
,