Popravdě řečeno, možností, jak se vykrádání webu bránit, mnoho není. Alespoň tedy o žádné účinné prevenci nevím. Samozřejmě můžeme vypnout RSS výstup na svém webu, pomocí JavaScriptu zablokovat pravé tlačítko myši a tak znemožnit kopírování textu přes schránku. Web je možné vytvořit v Silverlightu nebo Flashi, ze kterého se texty o poznání hůře komplikují.
Všechna tato řešení však mají více nevýhod, než přínosů. Vypnutím RSS výstupu se připravíte o potenciální zdroj návštěvnosti. Zákaz kopírování textu do schránky JavaScriptem není účinný vždy, navíc si kdokoli může zobrazit zdrojový kód stránek a obsah převzít odsud. Použití Flashe zase znemožňuje plné využití technik pro optimalizaci stránek pro vyhledávače.
Je zde možnost použít specializované nástroje, které zašifrují HTML stránky, ale toto řešení většinou stojí dost peněz, navíc jej nelze aplikovat na HTML výstup z různých redakčních systémů.
Vyzkoušejte Copyscape
Přestože neexistuje stoprocentně účinná prevence, můžete se alespoň pokusit vyhledat zloděje svých textů. Existuje speciální a v zahraničí hojně používaný nástroj Copyscape. Slouží k vyhledávání duplicitních textů. Do Copyscape zadáte adresu stránky nebo zkopírujete část textu a spustíte vyhledávání.
Pokud nějaké jiné webové stránky, které jsou indexovány ve vyhledávačích, obsahují zadaný text nebo text ze zadané webové adresy, zobrazí vám Copyscape seznam takovýchto webů. Dokonce dovede najít i nápadně shodné části vět.
Když na některou z nalezených stránek klepnete, zobrazí se její obsah v rámu Copyscape a tento nástroj vám také zvýrazní ty části, které jsou duplicitní s vaším webem.
Pokud si zvyšujete návštěvnost tím, že RSS výstup ze svého webu máte registrován v některém z veřejných RSS agregátorů, počítejte s tím, že Copyscape je bude zahrnovat do seznamu nalezených duplicit. Taktéž bude nabízet duplicity v podobě stránek, které zveřejnily například stejnou tiskovou zprávu.
Nalezli jsme vykradače, co dál?
Pokud narazíte na web, který vykradl vaše texty, pak nastává otázka, jak postupovat dále. Obecný postup (doporučovaný i Copyscape) je kontaktovat provozovatele webu a zkusit se s ním domluvit. Pokud to nepomůže, kontaktujte firmu, u které jsou stránky hostovány. Kontaktní informace můžete vyhledat i pomocí nástroje Whois zde na Maxiorlovi.
Placené služby Copyscape
Kromě jednoduchého vyhledávání duplicitního obsahu vám Copyscape nabídne i propracovanější, placené služby. Služba Premium nabízí zmíněné vkládání textu přes schránku, zatímco zdarma dostupná varianta funguje pouze s online obsahem. Vyhledávání pomocí služby Premium vás přijde na 0,05 USD (méně než jednu korunu) za jedno hledání.
Placené Copyscape Premium není omezeno počtem nalezených výsledků a dovede najít více případných duplicit. Zajímavostí je nabídka API, pomocí kterého můžete Copyscape implementovat přímo do nějakého skriptu. Díky podpoře vyhledávání offline obsahu Premium využijete v případě, že chcete dopředu najít případné duplicity článku, které vám dodal nějaký externí autor. Odhalení podvodníků, kteří vám slibují originální obsah, je tak otázkou několika sekund.
Druhá placená služba se jmenuje Copysentry. Jde o nástroj, který slouží k okamžitému odhalení jakékoli stránky, která vykradla váš web. Služba nepřetržitě monitoruje váš web a v případě, že najde duplicitní obsah, ihned vás upozorní e-mailem. Na výběr jsou dva intervaly kontrol – týdenní (za 4,95 USD měsíčně) a denní (za 19,95 USD měsíčně). Cena zahrnuje kontrolu deseti stránek, další jsou za mírný příplatek.
I když si placené hledání na Copyscape neobjednáte, doporučuji čas od času tuto službu využít. Není na škodu se dozvědět, zda někdo neparazituje na vaší práci.
Tvůrce webů z Brna se specializací na Drupal, WordPress a Symfony. Acquia Certified Developer & Site Builder. Autor několika knih o Drupalu.
Web Development Director v Lesensky.cz. Ve volných chvílích podnikám výlety na souši i po vodě. Více se dozvíte na polzer.cz a mém LinkedIn profilu.
Komentáře k článku
To je ale zřejmě účinné jen v českých podmínkách... Mimochodem, už jste někdo podobnou situaci musel řešit? S jakým výsledkem?
Naopak většina freehostů po reportu dané weby maže.
Ale otázkou je jestli to má cenu, jelikož se často stane, že na okopírovaném webu jsou všechny odkazy funkční a odkazují na vás apod, takže někdy tj skoro i výhoda.)
Určitě to cenu má, duplicitní obsah nemají rády vyhledávače a panelizují za něj.
I s tímto mám zkušenost, bohužel jednu dobu "frčeli" mé fotky na internetu. Nevyplatilo se mi být naivní a vstupovat do světa internetu s otevřenou náručí a vystrčeným zadkem (to aby si každý mohl spočítat kolik tam mam pih). Fake profily jsem objevovala náhodou i za pomocí známých. Většinou se moje fotografie používali jako nástroj pro "virtuální" zvyšování sebevědomí a balení co nejvíce chtivých a důveřivých chlapců a chlapů. Kuriózní byly taky případy, kde mě dokonce označovali za ruskou supermodelku, to jsem se nasmála, ale trochu mě to polichotilo :D (s rezervou). Nejhoří byl případ, kdy jsem zabránila podvodu a to tím, že jsem jednomu uživateli ( měl fake profil v přátelích) napsala o nepravosti jeho kamarádky. Začal mi vyprávět, že byl u mě doma, ale já jsem tam nebyla, nýbrž moje starší sestra (pozn.: žádnou starší nemám, mám mladší - i když bůhví třeba mám nějakou nevlastní :D) a že po něm chtěla 20 tis. Že jsem (ten fake profil) vážně nemocná atd. Ten týpek mi nevěřil, tak jsem se sešli. Je to docela síla a o podobných podvodech s využím fotky někoho jiného můžeme slyšet v médiích.
Já osobně zatím tohle nijak neřešil. Podle mě je celkem účinné (sám to tak na blogu používám), mít článek rozdělený na perex a vlastní obsah, přičemž v RSS exportu je pouze perex článku s úvodním slovem o tom, čemu se článek věnuje. Pokud pak někdo agreguje můj RSS zdroj, tak mi to paradoxně může pomoci v návštěvnosti, protože uživatel si přečte perex a zaujme-li jej, tak klikne na odkaz, který samozřejmě vede na celý článek na mém blogu ;).
Samozřejmě něco jiného by bylo, pokud by někdo cíleně kopíroval obsah mých článků a následně je zveřejňoval po svým jménem někde na svém blogu. To se ale celkem těžko zjišťuje. Pokud jde o citace, tak těm se nijak nebráním, je-li uveden odkaz na zdroj. Sám se také vždy snažím pokud píši o nějaké informaci, jíž jsem dohledal např. na nějakém konkrétním blogu, uvést odkaz na původní článek a link na daný blog.
Já to řešil kdysi dávno výše uvedeným způsobem na mých bývalých stránkách o Mirandě :) a vyřešil...
Nedávno jsem psal taky text o plagiátech, sice to není přímo k vykrádání RSS, ale obsahu webu se to hodí určitě.
Jinak s kopírováním obsahu mám vlastní zkušenost, třeba můj text o WebSpellu je hojně kopírován.
Psal jsem "autorovi" nic se nestalo, psal jsem na hosting (FREE - IC) opět se nic nestalo. Bohužel, tak jsem si na web hodil alespoň reklamu, jelikož zlodějíček měl až takovou drzost, že si linkoval obrázky přímo ode mě.
Vím jde to nějak ošetřit přes .htaccess, ale jak jsem zatím nezkoumal, ale asi se na to budu muset mrknout a do všech obrázků si hodit copyright.
toto dejte do souboru .htaccess:
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://maxiorel.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://maxiorel.com$ [NC]
RewriteRule .*\.(jpg|jpeg|gif|png|bmp)$ - [F,NC]
Prostředí dva řádky uvádějí weby, ze kterých je hotlinkování povoleno. Poslední řádek pak uvádí seznam přípon obrázků nebo jiných souborů, kterým zakazujete hotlinkování.
Podle mě je obrana proti duplicitnímu obsahu jednoduchá, obvykle stačí dané osobě jen pohrozit trestním oznámením, a pokud to nepomůže, tak jej opravdu podat. Vzhled k tomu, z jaké sorty lidí se duplikátoři skládají je první řešení skoro 100% účinné... Potíž je, když mají weby na freehostingu, ale tam se zase tolik duplicit nebojím, Google i Seznam pozná, že ten web je okopírovaný shit a dá tomu ban :)