<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
	<channel>
		<title><![CDATA[TNF : Tatter Network Foundation forum - 베이지언 스팸 필터링]]></title>
		<link>http://forum.tattersite.com/ko/viewtopic.php?id=4991</link>
		<description><![CDATA[베이지언 스팸 필터링 의 최근 RSS 글들.]]></description>
		<lastBuildDate>Thu, 27 Mar 2008 03:21:21 +0000</lastBuildDate>
		<generator>PunBB</generator>
		<item>
			<title><![CDATA[RSS 답글: 베이지언 스팸 필터링]]></title>
			<link>http://forum.tattersite.com/ko/viewtopic.php?pid=25755#p25755</link>
			<description><![CDATA[<p>디텍션 시스템에서 중요한 것은 미탐도 있지만 오탐도 중요하다는 것입니다.</p><p>전에 어떤 블로그에서 sex란 단어를 금칙어로 써라라고 글을 쓰셨는데 제가 가서 sexy란 단어가 포함된 도메인을 쓰는 사람이 많다고 지적한 적이 있습니다. 스팸보다도 일반인의 댓글이 더 스팸처럼 보이는 경우가 많습니다. (뭐 실제로 까페나 홈피 방문해 주세요라고 실컷 스팸 날리고는 스팸 날린적도 없는데 왠 차단이냐고 항의하시는 분들도 꽤 되시지만.)</p><p>저도 몇가지 준비하는 것도 있습니다만 이 분야로 챌린징 하고 있는 전문가 분들도 몇 계시고... 아무튼 많은 아이디어와 실험 결과들은 계속 보고 있고 바라고 있습니다.</p><p>다만 여러 알고리즘을 직렬로 연결하는 것은 큰 문제가 있습니다. 최대한 간단해야 합니다. 그래서 더 어렵더군요.</p>]]></description>
			<author><![CDATA[null@example.com (gendoh)]]></author>
			<pubDate>Thu, 27 Mar 2008 03:21:21 +0000</pubDate>
			<guid>http://forum.tattersite.com/ko/viewtopic.php?pid=25755#p25755</guid>
		</item>
		<item>
			<title><![CDATA[RSS 답글: 베이지언 스팸 필터링]]></title>
			<link>http://forum.tattersite.com/ko/viewtopic.php?pid=25742#p25742</link>
			<description><![CDATA[<p>겐도님이 가장 잘 아시겠지만.. 이올린 스팸 필터가 아마 내부적으로 여러 가지(?) 방법을 혼합해서 사용하지 않나 싶군요.;<br />베이시안 필터를 쓴다고 해도 정상적인 댓글·트랙백의 내용을 섞어서 스팸을 보내는 경우는 잡아내지 못하는 경우가 많습니다. 최근의 스팸 폭격 사건도 그러한 예라고 볼 수 있겠죠.</p><p>겐도님께서 어떤 생각을 하고 계시는지는 모르겠지만, 댓글이나 트랙백의 내용에만 기반한 것이 아니라, 비슷한 어휘의 반복 여부, 뉴럴네트워크 등을 이용한 번역문인지 여부의 판단 결과 등 다양한 파라메터들을 기반으로 필터링 알고리즘을 강화(...이미 그렇다면 어쩔 수 없고...)했으면 좋겠다는 생각이 들더군요..;</p>]]></description>
			<author><![CDATA[null@example.com (daybreaker)]]></author>
			<pubDate>Wed, 26 Mar 2008 16:30:15 +0000</pubDate>
			<guid>http://forum.tattersite.com/ko/viewtopic.php?pid=25742#p25742</guid>
		</item>
		<item>
			<title><![CDATA[RSS 답글: 베이지언 스팸 필터링]]></title>
			<link>http://forum.tattersite.com/ko/viewtopic.php?pid=25500#p25500</link>
			<description><![CDATA[<p>친구분의 블로그를 알려주시죠. 확인좀 해 볼것들이 있습니다.</p>]]></description>
			<author><![CDATA[null@example.com (gendoh)]]></author>
			<pubDate>Tue, 18 Mar 2008 02:03:14 +0000</pubDate>
			<guid>http://forum.tattersite.com/ko/viewtopic.php?pid=25500#p25500</guid>
		</item>
		<item>
			<title><![CDATA[베이지언 스팸 필터링]]></title>
			<link>http://forum.tattersite.com/ko/viewtopic.php?pid=25473#p25473</link>
			<description><![CDATA[<p>Bayesian (베이지언) 스팸 필터링 기능을 제안합니다.</p><p>혹시 이미 있는 기능이라면 죄송합니다. 친구가 하도 스팸으로 고생을 해서요.. 아마 이 기능이 없어서 고생하는 것이리라 생각해서 제안해봅니다.</p><p>베이지언 필터(소위 학습형 스팸 필터)의 추가를 검토해주시면 감사하겠습니다.</p><p>참고 링크: <a href="http://www.paulgraham.com/spam.html">http://www.paulgraham.com/spam.html</a></p>]]></description>
			<author><![CDATA[null@example.com (검은해)]]></author>
			<pubDate>Mon, 17 Mar 2008 13:52:04 +0000</pubDate>
			<guid>http://forum.tattersite.com/ko/viewtopic.php?pid=25473#p25473</guid>
		</item>
	</channel>
</rss>
