Hvordan beskytte innhold på blogg

Jeg har innført noen tiltak for å hindre at andre stjeler mitt innhold. Andre kan også ha nytte av dette. Derfor har jeg samlet litt relevant informasjon i dette innlegget, med fokus på det tekniske.

Hotlinking

Noen er så frekke at de kopierer bilder fra der det passer dem. De som er ekstra frekke lenker til dine bilder fra sin egen side (det kalles hotlinking eller inline linking), og stjeler dermed også båndbredde fra deg. Dette kan stoppes med feks Hotlink protection plugin for WordPress. Jeg bruker det, og viser nå frem dette bildet på sidene til noen av de som er ekstra frekke:

not-hot.jpg

Se også innlegget til Martin om samme tema, men med andre løsninger.

Frames

En del steder på nett har ikke kapasitet til å lage skikkelig innhold selv, men ønsker likevel å generere trafikk for å feks tjene penger på reklame. Noen av dem er sleipe nok til å putte andres innhold inn i en boks på egen side. Sånn fremstilles det litt som noe de har lagd selv. Denne snutten en plass imellom <head> og </head> stopper sleipingene:

<script type="text/javascript">
<!--
if (parent.frames.length > 0) { parent.location.href = location.href; }
-->
</script>

Hvis man har en WordPress (ikke WordPress.com) blogg og ikke ønsker å redigere temafiler, kan man bruke feks Break out of frames innstikket for å putte inn den nødvendige snutten over.

Indeksering

Denne teksten imellom <head> og </head> stopper de aller fleste robotene, hvis man ønsker at noe ikke skal være søkbart andre steder:

<meta name="robots" content="noindex">

Noe lignende kan gjøres med robots.txt filen. Det er en tekst-fil som forteller robotene hvordan de skal forholde seg til sidene dine. For å få samme resultat som meta-dingsen over kan man knatte inn dette i filen:

User-agent: *
Disallow: /

…og legge den på toppnivå for domenet ditt. Med den filen kan man også begrense tilgang mer spesifikt. Feks sånn som jeg har gjort:

User-agent: ia_archiver
Disallow: /

User-agent: BlogSpy
Disallow: /

User-agent: Googlebot-Image
Disallow: /

User-agent: yahoo-mmcrawler
Disallow:/

User-agent: psbot
Disallow:/

User-agent: *
Disallow: /fotoalbum/
Disallow: /wp-admin/
Disallow: /wp-content/uploads/

Kort forklart er det fem roboter som ikke får indeksere (lagre sidene) hos meg, og noen områder og filtyper liker jeg ikke at noen roboter indekserer. Hadde det bare vært så enkelt som Kristin drømmer om *sukk*.

Begrenset feed

Dette har Undre skrevet utmerket om, så jeg ser ikke noe behov for å komme med noen tilføyelser.

Oppdatering om feed

Undre skriver godt om metodene som kan brukes for å begrense feed. Det finnes en del sider rundt omkring som bare baserer seg på innhold fra andre. Noen av dem kopierer feed mer eller mindre ukritisk fra der de finnes. Dermed kan det være fornuftig å ha begrenset feed, gjerne merket med copyright på hvert innlegg (feks med enten ©Feed eller Simple Feed Copyright innstikkene). Det kan også være en ide å tenke godt igjennom hvor man ping’er innleggene.

Passord

Å stenge robotene helt ute med passord er effektivt. Til og med leserene blir borte. I ett forsøk på å forenkle det å få passord lagde jeg ett WordPress innstikk som sender det på e-post (men det kan brukes til å sende andre ting også). Innstikket mitt kan kombineres med feks global post password innstikket for å unngå forskjellige passord på innlegg i bloggen.

E-post

Litt sånn på sidelinjen av dette temaet, men fordi det virker som om mange ikke tenker seg om…

Det å legge ut e-post adressen din uten beskyttelse på web er ikke noen god ide. Da blir fort innboksen full av søppel. Hvis du ønsker å gi leserene mulighet til å sende deg en e-post kan det gjøres med feks contact form 7 (jeg bruker min egen norske oversettelse til det innstikket) eller wp contact form III hos Kristin.

En annen måte å gjøre seg tilgjengelig på e-post er å legge ut adressen med feks innstikket obfuscate e-mail. Eller rett og slett skrive den inn i ett bilde, og vri og vrenge litt på den (gjerne putte på litt farger også) så det blir vanskelig for OCR-programvare å lese.

Opphavsrett

Oppdatert: Les om Opphavsrett på Internett på denne bloggen. Er det noen der ute (med juridisk kompetanse?) som kunne ha skrevet litt om opphavsrett i forbindelse med blogger og RSS-feed’er? LorelleKopinor kan være interessante kilder til informasjon.

Spørsmål

Har jeg glemt noe? Er det noe som kan gjøres enklere? Var det noe du ikke forstod? Har du beskyttet deg?

Lignende innlegg

11 kommentarer til “Hvordan beskytte innhold på blogg”


  • Gode tips du kommer med her :)

    Når det gjelder frameblockers anbefaler jeg at man ikke gjør dette, rett og slett fordi søkemotorer ikke plukker opp innhold i frames og en frames på andre sider da kun vil bidra til å øke trafikken på eget nettsted. Dessuten vil det også sperre for google images, noe som kan føre til at du blir diskreditert i google’s index.

  • Det med bildetyveri har jeg prøvd å unngå via Martins metode, uten at det hjalp. Får prøve innstikket her.

    Ellers: Suveren liste, Petter. :-)

  • Kjempefin post Petter.

    Når det gjelder bildene og innstilling i Hotlink P. Hvis jeg skriver wp-content/ istedenfor wp-content/uploads (alle bildene jeg laster opp legger seg jo rett under content)under URL Patterns, innvirker det på noen andre ting enn bildene?

  • picxx: Vet ikke om jeg forstod kommentaren din rett… Siden jeg ikke ønsker at noen roboter skal indeksere bildene mine (fordi de som gjerne laster ned og stapper dem inn på egne sider uten å spørre gjerne søker på den måten (kan de ikke bare skjønne at de må bruke feks Wikimedia Commons i steden?)) så synes jeg det er rart om feks Google rangerer teksten lavere av den grunn. Tror du det er tilfelle? Trafikk fra sidene som putter mine inn i frames er jeg ikke interessert i, men jeg kan forstå at andre er det.

    radiohode: Martins metode er mer generell og virker på andre typer blogger om man har tilgang til serveren. Men det blir nok litt mer knatting. Håper denne anti-hotlink-metoden ikke ødelegger for noe. Men de som laster ned bildene og lagrer dem hos seg selv er det ikke like lett å beskytte seg mot…

    Sissel: Takk. Tror det skal virke om du skriver inn bare wp-content også (antagelig uten skråstrek på slutten). Men om det da også virker i undermapper i wp-content… hm. Det har jeg visst ikke sjekket hos meg selv heller. Om det ikke virker og “alt forsvinner” skal du uansett kunne slette innstikket for å slå det av.

    Om du vil sjekke skikkelig at bilder virker som de skal kan du trenge å slette cache i din nettleser, da den ofte bare bruker lokale kopier av filer om de finnes der. Bildene skal da oppføre seg annerledes på bloggen din og på sider som ikke er hos deg, men som bruker dine bilder i feks en <img …> dings.

  • Takk for hyggelig omtale! :-)

    Min metode fungerer selvfølgelig for meg, men jeg tror jeg prøvde en håndfull tilsvarende metoder uten hell. Det er nok derfor en viss sannsynlighet for at man må jukke litt på koden for å få den til å fungere først.

    Når vi først snakker om hotlinking… Da jeg innførte sperre mot hotlinking for over et år siden halverte jeg båndbreddebruken fra nesten 5 til ca. 2,3 GB per måned. I dag benytter jeg 6,7 selv med denne sperren. :-)

  • Men om det da også virker i undermapper i wp-content… hm. Det har jeg visst ikke sjekket hos meg selv heller.

    Når jeg ser nærmere etter (det hjelper å ha begge øynene åpne ;) ) så ser jeg at man kan skrive inn flere stier, så da er det ve bare å skrive inn så mange stier med undermapper som man ønsker.

    Jeg skulle gjerne hatt noe som sier noe om copyright nederst i bunnen på siden … Vet du noe lurt der?

  • Martin: Hyggelig omtale fortjente du. Jeg synes flere burde oppdage at du skriver om mye interessant (men kanskje det er nerden i meg som snakker da). Halvering av båndbredden :-D Sånt kan jeg like godt. Kanskje du har mange flere lesere nå, siden tallet er større igjen.

    Sissel: En av de mappene jeg har listet i innstikket har en del undermapper. Jeg får sjekke senere om ting virker i undermappene der. Du kan kanskje bruke general headers & footers innstikket. Jeg knattet det bare rett inn i footer.php hos meg, men det er egentlig en løsning som jeg ikke er helt fornøyd med. Si gjerne i fra om du får det til, for da prøver jeg selv også.

  • Hyggelig å høre, Petter. Skal ikke legge skjul på at det er noe overfokus på teknologi borte hos meg, men det er jo en av tingene som opptar meg. :-)

    Når det gjelder økningen det siste året, skyldes det flere lesere. :-)

  • Martin: Overfokus? Det kommer nok an på øynene som ser. Du klarer å holde deg til ett begrenset område som tema. Det synes jeg virker mer profft enn feks sånn som jeg lager suppe her.

  • Dette innlegget er nå oppdatert med litt mer informasjon om feed og et par roboter til i robots.txt.

  • Et lite apropos angående opphavsrett til Sissel.. Det er strengt tatt ikke nødvendig med en “copyright notice” på hver side, selv om det selvsagt ikke skader å gjøre ekstra oppmerksom på det. Opphavsrett har man helt automatisk med akkurat de samme rettighetene uansett om man skriver en notice eller ikke.

Skriv en kommentar