주제: 스팸트랙백의 로봇 원리가 어떻게 되나요?
스킨을 만들려고 계획중에 있습니다.
이왕지사 만드는거 스팸트랙백에 대한 차단까지 생각하고 있습니다.
트랙백 주소를 플래시로 띄워서 html 을 로봇이 긁지 못하도록 하는데 일단
촛점을 맞췄습니다.
그러기 위해서는 일단 로봇의 원리에 대해 두가지 정도의 정보가 필요한데요.
1 . 로봇이 html 소스를 긁는것이다.
2 . flash 안에서 동적으로 생성된 텍스트는 읽어내지 못한다.
가 확보된다면 가능성이 있는 이야기 같습니다.
1번의 경우가 확실하다면 100% 가능성 있는 이야기이고,
2번의 경우까지 문제가 된다면 flash 안에서 글자를 비트맵캐싱 한 다음에 그림으로 전환해서 보여주는
방법도 생각하고 있습니다. 트랙백 주소의 텍스트 카피가 필요한 경우엔
flash 의 setClipboard 를 사용해서 clipboard 로 가져가도록 우회해보는것도 괜찮다 싶구요.
그러기 위해선 테터툴즈에서 몇가지 기능이 필요한데요.
1 . http://domain/trackback/ 까지만의 url 주소 출력가능
2 . 트랙백 받을 넘버에 대한 출력가능
원리는... javascript 상에 스킨고유의 변수명으로 1 에 대한 명세를 우선적으로 해줘서
해당주소는 flash 의 ExternalInterface 로 가져가고,
나머지 트랙백의 아이디는 embed 태그의 flashVars 로 집어넣는 방식을 생각하고 있습니다.
아니면, flashVars 상에 트랙백 주소를 아예 조각조각내서 넣는 방법도 생각하고 있구요.
이렇게 하면 완성된 트랙백 주소에 대한 명세가 전혀 없고,
또 스킨별로 트랙백.swf 가 받아들이는 변수명을 다 다르게 줄수 있기 때문에
공통된 규칙없이 스킨별로 완전하게 다른 트랙백 주소 출력을 구현 할 수 있을것 같다는 생각이 드네요...
일단 로봇이 swf 안에서 출력된 트랙백 주소를 크롤링 할 수 있느냐에 대한 정보가 궁금하고,
두번째로 현재 테터툴즈에서 트랙백 주소를 조각조각내서 출력할 수 있는지가 궁금합니다.
ㅡ ㄴ ㅡ;;; 가능한한 확장기능을 만지는 일까지 안갔으면 좋겠다는 바램이 있어서...
... 로봇이 url 패턴을 분석해서 마지막 entry/num 을 분석해서 트랙백을 날리는 거라면
그냥 gg 치고 관둬야 겠지만, 일단 생각이 있어서 문의해 봅니다.
쎈 (2007-03-31 12:03:13)에 의해 마지막으로 수정