주제: 0.96x -> 1.0x 이전중 NCR코드 문자 변환에 관하여..
안녕하세요.
몇주째 혼자 풀리지 않아 함께 나눠볼까 하는 생각으로 글 올려봅니다.
저와 상당히 친한 지인분 중 한분에게 테터툴즈를 소개시켜드렸고,
무척 만족하며 사용하고 계십니다.
평소에 일본문화에 관심이 많으신분이라 포스팅을 꽤 열심히 하셨고
현재는 순수 텍스트 용량만 3M를 넘어가는 엄청난 블로그가 되었습니다.
최근 일련의 무더기 스팸공격의 문제도 있었고..
일본문화에 관련된 블로그다 보니 자연스럽게 일본인 방문객도 생기구요
댓글이나 트랙백을 주고 받는 일도 종종 생기더군요.
그래서 1.0x버전으로 이주를 결정하고 차근차근 준비를 해 나갔습니다.
여기서 큰 걸림돌이 하나 생겼는데 바로 NCR 문자 처리가 불가능하다..는 겁니다.
무슨 이야기인가 하면,
국내에서 사용하는 한자와 일본식 한자는 서로 다르다는것은 알고 계실꺼구요.
그것을 예전방식인 EUC_KR테이블에서는 구현할 수 없다보니..
저장될때 彀..이런식으로 NCR코드로 변경되어 저장되어집니다.
이 글들을 migrator.php를 사용하여 XML파일로 받게 되면 htmlspecialchars 함수의 농간으로인하여
&24384;..이런식으로 변형됩니다.
당연히, 이주를 마친뒤에는 일본식 한자 모두 NCR코드로 보여지게 됩니다.
여러가지 방법을 동원하여 보았지만, 원래의 글자를 살려내지를 못하고 있습니다.
위에도 말씀드렸다시피 새로글을 쓴다거나 글자를 수정한다는 작업은 엄두도 내지 못하고 있구요.
방법이 없을까요? 조그마한 의견이라도 큰 도움이 될지 모르니 조그마한 생각이라도 나눠주셨으면 감사하겠습니다.