1

주제: 스팸트랙백의 로봇 원리가 어떻게 되나요?

스킨을 만들려고 계획중에 있습니다.
이왕지사 만드는거 스팸트랙백에 대한 차단까지 생각하고 있습니다.

트랙백 주소를 플래시로 띄워서 html 을 로봇이 긁지 못하도록 하는데 일단
촛점을 맞췄습니다.

그러기 위해서는 일단 로봇의 원리에 대해 두가지 정도의 정보가 필요한데요.

1 . 로봇이 html 소스를 긁는것이다.
2 . flash 안에서 동적으로 생성된 텍스트는 읽어내지 못한다.

가 확보된다면 가능성이 있는 이야기 같습니다.
1번의 경우가 확실하다면 100% 가능성 있는 이야기이고,
2번의 경우까지 문제가 된다면 flash 안에서 글자를 비트맵캐싱 한 다음에 그림으로 전환해서 보여주는
방법도 생각하고 있습니다. 트랙백 주소의 텍스트 카피가 필요한 경우엔
flash 의 setClipboard 를 사용해서 clipboard 로 가져가도록 우회해보는것도 괜찮다 싶구요.

그러기 위해선 테터툴즈에서 몇가지 기능이 필요한데요.

1 . http://domain/trackback/ 까지만의 url 주소 출력가능
2 . 트랙백 받을 넘버에 대한 출력가능

원리는... javascript 상에 스킨고유의 변수명으로 1 에 대한 명세를 우선적으로 해줘서
해당주소는 flash 의 ExternalInterface 로 가져가고,
나머지 트랙백의 아이디는 embed 태그의 flashVars 로 집어넣는 방식을 생각하고 있습니다.
아니면, flashVars 상에 트랙백 주소를 아예 조각조각내서 넣는 방법도 생각하고 있구요.
이렇게 하면 완성된 트랙백 주소에 대한 명세가 전혀 없고,
또 스킨별로 트랙백.swf 가 받아들이는 변수명을 다 다르게 줄수 있기 때문에
공통된 규칙없이 스킨별로 완전하게 다른 트랙백 주소 출력을 구현 할 수 있을것 같다는 생각이 드네요...

일단 로봇이 swf 안에서 출력된 트랙백 주소를 크롤링 할 수 있느냐에 대한 정보가 궁금하고,
두번째로 현재 테터툴즈에서 트랙백 주소를 조각조각내서 출력할 수 있는지가 궁금합니다.
ㅡ ㄴ ㅡ;;; 가능한한 확장기능을 만지는 일까지 안갔으면 좋겠다는 바램이 있어서...


... 로봇이 url 패턴을 분석해서 마지막 entry/num 을 분석해서 트랙백을 날리는 거라면
그냥 gg 치고 관둬야 겠지만, 일단 생각이 있어서 문의해 봅니다.

쎈 (2007-03-31 12:03:13)에 의해 마지막으로 수정

2

답글: 스팸트랙백의 로봇 원리가 어떻게 되나요?

가장 마지막 생각이 비슷합니다. 예전 겐도님 왈 방문해서 주소를 확인하는 방법이 아니라 태터 소스를 이해하고 분석해서 날리기 때문에 아무리 가려도 소용이 없다고 합니다.

제일 쉬운 방법은 trackback을 trockback등으로 이름 바꾸는 방법인데, 금방 뚫릴 방법이라...

"Everything looks different on the other side."

-Ian Malcomm, from Michael Crichton's 'The Jurassic Park'

3

답글: 스팸트랙백의 로봇 원리가 어떻게 되나요?

재밌고 참신한 아이디어네요^^; 플래시까지는 생각을 못했습니다. 2의 경우는 잘 모르겠습니다만, 1의 경우는 검색엔진의 여파가 확실히 있는것 같더군요. 스팸 댓글의 경우 구글쥬스(구글의 상위 랭크)된 글에 달리더군요.

inureyes님 말씀처럼 태터툴즈 블로그 주소에 트랙백 주소체계를 덧붙여서 무차별적으로 쏘는 것으로 추정되기 때문에 효용성에서는 미지수 일듯 싶습니다. 그러고보니 예전에 트랙백 주소 변경 플러그인이 나온적이 있었지요. hxxp://lunamoth.biz/trackback/9999 를 hxxp://lunamoth.biz/trackback/09999 로 바꿔주는, 이런것도 어느정도는 효과는 있겠지요. http://lunamoth.biz/1854, http://lunamoth.biz/1863 에서 언급된 차후 방지책보다는 스팸 로봇 자체를 차단하는 방안이 효과적일듯 싶습니다.