Ero sivun ”Roskaamisen torjunta MediaWikissä” versioiden välillä

Siirry navigaatioon Siirry hakuun
lisää asiaa
(välitallennus)
 
(lisää asiaa)
Rivi 1: Rivi 1:
[[wikipedia:fi:Wiki|Wikien]] periaatteeseen kuuluu se, että kuka tahansa voi muokata wikin sisältöä. Tämä kuitenkin aiheuttaa joskus ongelmia, kun roskaajat yrittävät esimerkiksi parantaa sivujen sijoittumista Googlen hauissa lisäämällä wikin sivuille linkkejä eri sivustoille. Erilaiset mainostajabotit aiheuttavatkin helposti paljon työtä wikien ylläpitäjille.
[[wikipedia:fi:Wiki|Wikien]] periaatteeseen kuuluu se, että kuka tahansa voi muokata wikin sisältöä. Tämä kuitenkin aiheuttaa joskus ongelmia, kun roskaajat yrittävät esimerkiksi parantaa sivujen sijoittumista Googlen hauissa lisäämällä wikin sivuille linkkejä eri sivustoille. Erilaiset mainostajabotit aiheuttavatkin helposti paljon työtä wikien ylläpitäjille.


[[MediaWiki]], yksi suosituimmista wiki-ohjelmistoista, mahdollistaa roskaamisen torjunnan monella eri tavalla. Tässä artikkelissa käydään läpi tapoja, joilla roskaajabottien toimintaa voidaan estää. Suurin osa ohjeista perustuu tällä hetkellä Linux.fin ylläpitäjien käytännön kokemuksiin.
[[MediaWiki]], yksi suosituimmista wiki-ohjelmistoista, mahdollistaa roskaamisen torjunnan monella eri tavalla. Tässä artikkelissa käydään läpi tapoja, joilla roskaajabottien toimintaa voidaan estää. Suurin osa ohjeista perustuu tällä hetkellä Linux.fin ylläpitäjien käytännön kokemuksiin. Näillä toimenpiteillä on päästy tilanteeseen, jossa botit eivät käytännössä lainkaan roskaa Linux.fitä.


== Anonyymien muokkausten esto ==
== Anonyymien muokkausten esto ==
Rivi 9: Rivi 9:


Joissain wikeissä (kuten Linux.fissä ja Wikipediassa) tätä ei kuitenkaan ole otettu käyttöön, sillä monet asialliset käyttäjät haluavat muokata sivuja anonyymisti. Lisäksi jotkut botit osaavat rekisteröityä jolloin anonyymien muokkausten esto ei niitä haittaa.
Joissain wikeissä (kuten Linux.fissä ja Wikipediassa) tätä ei kuitenkaan ole otettu käyttöön, sillä monet asialliset käyttäjät haluavat muokata sivuja anonyymisti. Lisäksi jotkut botit osaavat rekisteröityä jolloin anonyymien muokkausten esto ei niitä haittaa.
== $wgSpamRegex ==
MediaWiki sisältää sisäänrakennetun roskantunnistajan, joka ei hyväksy muokkausta, jos se toteuttaa muuttujassa <tt>$wgSpamRegex</tt>-määritellyn säännöllisen lausekkeen. Oletuksena tämä säännöllinen lauseke ei sisällä juuri mitään, mutta sitä voi helposti laajentaa muokkaamalla tiedostoa <tt>LocalSettings.php</tt>. Linux.fissä käytössä oleva määritelmä löytyy [[Roskaamisen torjunta MediaWikissä/wgSpamRegex|täältä]].
Lisätietoja löytyy [http://www.mediawiki.org/wiki/Manual:$wgSpamRegex MediaWikin ohjeista].


== SpamBlacklist-lisäosa ==
== SpamBlacklist-lisäosa ==
Rivi 23: Rivi 28:
</pre>
</pre>
Eli taulukkoon <tt>$wgSpamBlacklistFiles</tt> määritellään säännöllisten lausekkeiden paikat. Tässä ensimmäinen kohde on hakemistossa <tt>extensions/SpamBlacklist</tt> oleva tiedosto <tt>wikimedia_blacklist</tt>, joka on tarkoitus päivittää väliajoin MediaWikin palvelimelta. Tiedoston on tarkoitus olla wikien yhteinen roskalista. Sen voi hakea osoitteesta http://meta.wikimedia.org/w/index.php?title=Spam_blacklist&action=raw&sb_ver=1. Tätä listaa ei ole pakko kopioida MediaWikiä ajavalle palvelimelle, vaan <tt>$wgSpamBlacklistFiles</tt>-taulukkoon voidaan laittaa suoraan tämä osoite.
Eli taulukkoon <tt>$wgSpamBlacklistFiles</tt> määritellään säännöllisten lausekkeiden paikat. Tässä ensimmäinen kohde on hakemistossa <tt>extensions/SpamBlacklist</tt> oleva tiedosto <tt>wikimedia_blacklist</tt>, joka on tarkoitus päivittää väliajoin MediaWikin palvelimelta. Tiedoston on tarkoitus olla wikien yhteinen roskalista. Sen voi hakea osoitteesta http://meta.wikimedia.org/w/index.php?title=Spam_blacklist&action=raw&sb_ver=1. Tätä listaa ei ole pakko kopioida MediaWikiä ajavalle palvelimelle, vaan <tt>$wgSpamBlacklistFiles</tt>-taulukkoon voidaan laittaa suoraan tämä osoite.
Näiden lisäksi tämä lisäosa hakee säännöllisiä lausekkeita myös wikin sivulta [[Mediawiki:Spam-blacklist]]. Lisäksi erityistä "valkoista listaa", jonka säännölliset lausekkeet määrittävät että kyseisiä lausekkeita toteuttavaa sivua ei koskaan tunnisteta roskaksi, haetaan sivulta [[MediaWiki:Spam-whitelist]].
SpamBlacklist-lisäosa on käytössä Linux.fissä. Käytössä on myös säännöllisin välein päivitettävä MediaWikin roskalista.
== Captcha ==
Captchalla tarkoitetaan menetelmää, jossa käyttäjän on vahvistettava olevansa ihminen kirjoittamalla generoidussa kuvassa olevat kirjaimet tekstikenttään. Kuvasta tehdään yleensä sellainen, että kirjainten tunnistaminen siitä koneellisesti on hyvin haastavaa.
MediaWikiin on mahdollista lisätä Captcha-järjestelmä helposti [http://www.mediawiki.org/wiki/Extension:ConfirmEdit ConfirmEdit]-lisäosalla. Sen asetuksista voi säätää, ketkä joutuvat tunnistautumaan ihmisiksi. Yleensä vaatimus asetetaan ainakin anonyymeille käyttäjille.
Captcha ei ole käytössä esimerkiksi Linux.fissä eikä Wikipediassa, sillä se hankaloittaa joidenkin käyttäjien toimintaa.
== Aiheesta muualla ==
*[http://www.mediawiki.org/wiki/Spam MediaWikin ohjeet roskaamisen torjuntaan]


[[Luokka:Tietoturva]]
[[Luokka:Tietoturva]]
[[Luokka:Ohjeet]]
[[Luokka:Ohjeet]]

Navigointivalikko