Connect with us

technokrata

Könyvdigitalizálás és spamvédelem egyben

Dotkom

Könyvdigitalizálás és spamvédelem egyben

ReCaptcha: a széles körben használt technika továbbfejlesztése jelentős lépés lehet a kéretlen e-mailek megfékezésében.

Habár olyan általános megoldást nem kínálhat a megújult eljárás, mint amilyenről nemrég számoltunk be, a Carnegie Mellon Egyetem programozóinak egy csoportja mégis hisz abban, hogy a ReCaptcha jelentős előrelépést hozhat a spamek elleni küzdelemben. A kóderek a népszerű, széles körben használt Captcha technikát fejlesztették tovább; a szolgáltatással szinte biztosan találkozott már mindenki, aki egyszer is hozzá akart szólni valamilyen témához, fórumhoz, bloghoz az elmúlt egy-két évben – a Terminal fórumon is ez az eljárás védi a többi internetezőt a topikokat automatikusan teleszemetelő robotoktól. Működési elve egyszerű: grafikus módon jelenít meg egy értelmes vagy értelmetlen szót, amibe zavaró jeleket (vonalakat, pontokat) vegyít, illetve a színekkel is játszhat – az emberi felhasználó képes kisilabizálni, mit kell ellenőrzőkódként beírnia, az automatizált szoftverek viszont nem. Vagyis a mintafelismerés nehezen algoritmizálhatóságát használja ki.

Visszatérve a ReCaptcha fejlesztésre: Ben Maurer, az egyetemi programozócsapat vezére úgy nyilatkozott saját blogjában, hogy a módosításokkal nem csak megnehezíthetik a spammerek dolgát, de segítik is azokat a felhasználókat, akik könyveket, folyóiratokat, vagyis papíralapú információt akarnak digitalizálni. Tulajdonképpen arról van szó, hogy az OCR (optical character recognition, optikai karakterfelismerés) feladatot ellátó szoftverek nem tudnak minden, analóg módon rögzített szót helyesen digitalizálni – nos, ezeket a szavakat az eredeti formájukban közzéteszik, hiszen így szinte biztos, hogy a spamszoftverek sem birkóznak meg vele. Viszont az emberek – fejlett, szénalapú feldolgozóegységüknek köszönhetően 🙂 – gyorsan és nagy tömegben képesek a mintafelismerésre.

A projekt sikere azon múlik, hogy hányan csatlakoznak a digitalizálási kezdeményezéshez. Úgy tűnik, hogy sikerült felkelteni a spamekkel küszködő webmesterek figyelmét: máris több százan vették alkalmazásba a ReCaptchát saját website-jukon, közölte Luis von Ahn, az egyetem segédprofesszora és a projekt „executive producere”. Egy nap alatt több mint 8 ezer szót sikerült ezzel a módszerrel átültetni az analóg világból a digitálisba, vagyis ismét sikeresnek tekinthető az önkéntes, online közösségben rejlő erő kiaknázása. Már számos, hasonló kezdeményezés futott be, pusztán az emberek segíteni akarási vágyának köszönhetően – említhető a grid computing (amellyel a klímaváltozásoktól kezdve az űrkutatáson keresztül a rák ellenszerére irányuló programok számítási igényeit egyaránt ki lehetett olcsón elégíteni), vagy a Digg, hogy csak néhánya említsünk.

Arról, hogy mekkora erő rejlik a projektben, talán a következő adat nyújthat beszédes példát: von Ahn becslése szerint a Captcha (Completely Automated Public Turing test to tell Computers and Humans Apart) révén átlagosan 60 millió tesztelés zajlik nap mint nap az Interneten. És habár ettől még nagyon messze van a ReCaptcha, bárki segíthet hasonlóan népszerűvé tenni (ide kattintva).



Szólj hozzá!

További Dotkom

Technokrata a Face-en

Tesztek