블로그 저품질 유사문서 위험성 한방에 간다.

블로그 저품질 유사문서 위험성을 간과하는 사람들이 많다. 지적재산에 대한 개념이나 더 나아가 이러한 행위가 범법행위임을 인지 못하는게 놀라울 정도입니다.
필자는 티스토리 블로그이든 워드프레스든 포스팅 한번 하는데 적게는 1시간 길게는 2시간이 넘기도 하고, 해당 주제를 공부하는 시간까지 합하면 글 하나 작성하는데 꽤 긴 시간을 투자를 합니다.
오늘은 실제 제 블로그의 글을 토씨 하나 다르지 않게 그대로 복사하여 원글인 내 블로그 글 보다도 상위에 랭크된 블로그를 직접 폐쇄 시킨 사례를 통해 설명드려보겠습니다.

모든 검색엔진의 가장 강력한 패널티

특히 네이버의 경우에는 공식 블로그에 아예 공고를 하고 있습니다.

네이버 UGC (블로그/카페/포스트/리뷰/VIEW 검색 전반) 검색에는 글 원작자의 권리를 보호하기 위해, ‘유사문서 판독시스템’이 적용되어 있습니다. 

유사문서 판독 시스템은 어려운 기술이 아닙니다. 일전에도 말씀드렸지만, (저품질 블로그 탈출 방법 참조) 유사문서는 그 어떤 패널티보다 가장 패널티를 먹습니다.

블로그 저품질 유사문서 위험성

블로그 수익 강좌나 워드 프레스 수익 강좌들을 가끔 보면, 무슨 대단한 방법처럼 다른 분의 블로글을 옆에 띄워 놓고 말 조금씩 바꾸며 자신의 어투로 바꿔서 포스팅을 하면 된다고 강의(?) 비슷하게 약을 팔고 있습니다. 지적 재산의 도둑질을 스스럼없이 떠들고 있는 모습에 경악을 금치 못했습니다.

물론 안 걸리면 상관없습니다. 그들도 지금까지 한번도 제재를 당해보지 않았거나, 그들 스스로도 이와 같은 방법을 지속하면서 수익화 블로그의 매출이 줄고, 돈벌이가 시원찮아지면서 잘 모르는 사람들에게 약을 팔아 돈을 벌어야겠다.는 생각으로 바뀌었는지도 모릅니다.

필자 실제 사례 1

저는 꾸준하게 정보성 글과 이슈글을 적정한 비율로 작성하는 편입니다. 이슈글은 방문자수를 단기간에 확 올릴 수는 있지만, 전체 통계치로 내 블로그를 보게 되면 등락이 심해 좋은 광고가 붙지 않습니다.
그러나 사람들이 자주 찾게 되는 정보성글은 꾸준한 유입량이 있으면서 그런 양질의 글이 차곡차곡 쌓이면서 탄탄하고 좋은 블로그가 되기 마련입니다.(편법이 아닌 정도의 길입니다.)

얼마전 이슈글을 작성했는데 하루 방문자수가 3만이 넘고 애드센스 수익도 하루에 150불을 넘기는 좋은 반응을 얻고 있었습니다. 금방 사그라질 이슈가 아니라서 ‘며칠 괜찮은 수익이 나겠다.’고 생각하고 있었는데 이틀 뒤부터 급격히 방문자가 줄고 있었습니다.

하도 이상해서 여러 가용 키워드를 이리저리 검색해 보니, 제목 부분만 달리하고 본문 전체를 완전히 복사해서 그대로 쓰고 있었습니다. 심지어는 제 포스팅 보다 상위에 있었습니다.(다음포탈의 제 포스팅은 메인페이지에서 1,2위 아니면 3위 이상 넘어가는 일이 없습니다. 그러니 해당글이 첫번째 글인 상태였습니다.)

너무나 황당하여 해당 블로그의 다른 포스팅들을 보니, 대부분 똑같은 방식으로 하고 있었습니다. 이거는 그냥 넘어가면 안되겠다. 는 생각을 하고 바로 권리침해 신고를 진행하였습니다.
티스토리 블로그 권리침해신고는 해당 글에서 쉽게 하실 수 있습니다.

권리침해 신고하기

결과는 다음과 같이 받았습니다. 신고 후 일주일 후 다시 해당 블로그에 갔을 때 나오는 페이지 입니다.
블로그 전체가 폐쇄되었습니다.

블로그 저품질 유사문서

제가 작성한 포스팅의 작성 시기와 원문을 캡처해서 자료 첨부하고 원작자의 동의 없이 무단으로 사용함을 주장했습니다. 이걸로 이 블로그는 “끝” 입니다.

이렇게 생각하시기 바랍니다. 남의 글을 함부로 베껴서 쓰시는 분들 아직까지 아무일이 없었던 것은 원작자가 당신의 글을 발견하지 못했기 때문입니다. 자신의 글을 그대로 차용한 당신에게 관용을 베풀 원작자는 단 한명도 없음을 인지하시기 바랍니다.

필자 실제 사례2

포스팅 했던 글의 키워드로 네이버를 서핑 하던 중 가장 상단에 있던 블로그를 방문해 보았습니다.
네이버 최상단의 글은 어떻게 작성했을까 많이 모니터링을 하는 편 입니다.
그런데 이미지로 올려놓은 목차의 이미지가 많이 보던 화면이었습니다. 헉. 티스토리 제 블로그의 목차와 스니펫이 그대로 캡처되어 사용되고 있었습니다. (진심 놀랐습니다. 티스토리 내에서 복사글을 찾았을 때 보다 더 놀랐었습니다.)

네이버 역시 유사문서에 대해서는 용서가 없습니다. 이것 역시 게시물 중단 요청을 통해 저작권이 나에게 있으며, 그 증명도 함께 하였습니다. 네이버는 즉시 조치를 해줍니다.
글 작성자는 이의가 있으면 따로 다시 이의 신청을 해야하는데 이럴 경우 원작자인 저와 법적인 다툼을 해야 합니다. 그런 바보는 없겠죠? 네이버는 해당 블로그에 앞으로의 검색에 패널티를 부여할 겁니다.

유사문서는 어떻게 판단되는가?

블로그 저품질이 되는 가장 빠른 방법이 바로 유사문서라고 말씀드렸습니다. 그래서 쿠팡 자동화 프로그램을 사용하던 사람들이 모두 한방에 나락으로 갔습니다. ‘유사문서 피하는 법’ 을 작성한 어떤 블로그에서 텍스트를 이미지로 만들면 된다고 하였는데 위의 사례2에서 보셨듯이 결과는 어떻게 되었나요?

이미지는 검색이 안되는데 어떻게 발견할 수 있나?

이미지의 텍스트를 분석해주는 프로그램과 사이트가 있습니다. 원작자 창작물을 이미지화 했더라도 조금만 노력해도 잡으려면 다 잡습니다.

논문을 작성하고 제출해보셨던 분들이 많이 아시는 논문 유사도 검사 기준이 있습니다.

구분표절검사 기준조치 사항
양호수준0% 이상∼10% 미만학생 본인의 연구윤리 위배사항 검토 후 이상이 없을 경우 활용
유의수준10% 이상∼15% 미만양호수준으로 낮추거나, 학생 본인이 결과확인서 검토의견란에 사유를 기술하여 활용
의심수준15% 이상∼20% 미만양호수준으로 낮추거나, 지도교수가 결과 확인서 검토의견란에 사유를 기술하여 활용
위험수준20% 이상양호수준으로 낮추거나, 지도교수가 별도의 ‘사유서’(양식) 사유를 기술하고 해당논문에 문제가 없음을 확인하여야함.
카피킬러 기준입니다.

블로그 포스팅글의 유사문서 기준은?

위 논문 기준보다도 강하고 매몰찹니다.
질문) 쓰다보면 비슷한 이야기와 똑같은 단어가 쓰일 수 있는데 유사문서로 인정되면 억울할것 같다.
문맥이라는게 있습니다. 같은 이야기를 하더라도 글자의 쓰임새와 논조는 완전히 똑같을 수는 없습니다. 이런 문제라면 걱정하지 않으셔도 됩니다. 어떤 사건에 대해 기술하는데 사실을 기술하다보면 결국 다 비슷한 이야기를 하고 있습니다. (정보성 글에 위험성이 높습니다.)

질문) 최근 챗GPT등을 활용하여 글을 쓰는데 어뷰징이 될 수 있는가?
기계가 기계를 알아보는 것 너무 쉽지 않겠습니까? 네이버는 아주 강하게 이렇게 밝히고 있습니다. ‘기계적으로 대량의 글을 생산한 경우나 내용 상 앞뒤 문맥이 전혀 맞지 않는 자동 생성기를 사용한 경우 검색 결과 노출이 제한됩니다.’

글을 마치며,

조금 힘들고 더디더라도 자신이 생각하는 가장 양질의 좋은 글을 온라인에 남겨 놓으세요.
그 글은 언젠가는 당신에게 좋은 보답을 할 것 입니다. 이 점은 분명합니다. 글도 자꾸 쓰다보면 성장합니다. 그리고 어느 순간부터 재미있어집니다. 그렇게 온라인에서 수익을 차근히 만들어 나가 보세요.

긴 글 읽어 주셔서 감사합니다.

Loading