요약: 구글에서 본인이 쓴 글은 검색되지 안고 엉뚱하게 본인이 쓴 글을 펌한것이 검색되는 경우에 대한 것입니다.
아직까지 진행중인 문제지만, 중복컨텐츠와 관련해선 엉뚱한 결과가 나오기도 합니다.
구글 에서 “아마존에서 주문 방법”으로 검색하면 최상단 화면은 다음과 같습니다
( 이 결과는 꽤 몇개월전부터 지금 글을 쓰는 시점까지의 결과입니다.)
첫번째 링크의 사이트를
두번째 링크 역시 다시 첫번째 링크를 가리킵니다.
구글에서 아마존 과 관련 된 검색에서 늘 나오는 해당 사이트의 내용을보니
문제는 이 사이트의 컨텐츠는 그냥 불펌된 컨텐츠라는 것입니다.
아마존에서 주문방법관련된 이미지와 원문의 주소는
http://www.shop2world.com/blog/?p=89
입니다. 구글에서 해당 원문컨텐츠는 검색되지 안고
오히려 아마존과 관련된 검색에서 늘 나오는 이 사이트는 원문 컨텐츠에
아마존광고 코드를 넣은것 외에는 그대로 ,심지어 이미지까지 원래사이트에서
끌어다 쓰여 지지만, 구글 검색엔 오리지날 사이트로 인식되고 있는
것이죠.
중복컨텐츠 처리 알고리듬이 해결해야 할 문제중
원문은 검색되지 안고, 원문관련 링크와 출처 없는 펌들이 최상단에
나오는 문제점들입니다.
주로 이유는
1.해당 글이 여러 곳에 있을때 – 예를 들어, 블로그를 통해 펌된 글일때
2.또한 많은 하이제킹(hijacking) 관련 사이트
이럴경우가 원문을 없애게 많이 합니다.
알고리듬(Algorithm) 개발자들이 현재 계속 이 문제 해결 중입니다.