Kütyük

Jelentősen továbbfejlesztett kereső a Google-től

A megszokottnál 83 százalékkal kevesebb pontatlan találat.

Megjelent: 2008. május 5. hétfő

Egy nem szöveges információbázison alapuló adathalmazból nyilvánvalóan sokkal nehezebb releváns találatokat adni, mintha az pusztán írott tartalommal bírna. Emiatt a nagy képkereső szolgáltatásokon van is még mit fejleszteni – január végén számoltunk be például a svéd Polar Rose nevű vállalkozásról, amely az arcfelismerésben és -keresésben lépett előre nagyot. Amint az várható volt, a Google sem ült babérjain ezen a téren (sem): a múlt héten jelentették be a Pekingben tartott Nemzetközi World Wide Web Konferencián VisualRank elképzelésüket. Két, az amerikai vállalatnak dolgozó kutató a következőképp vázolta fejlesztésüket: az általuk ismertetett algoritmus révén képfelismerő szoftvereljárásokkal lehet pontosabbá tenni a találatokat.

Miért nem alkalmaztak eddig ilyen megközelítést e téren? Nos, az elmúlt évtized minden erőfeszítése ellenére azért nem, mert egyszerűen nem voltak adottak sem a tárgyi, sem a tudásbeli feltételek. Míg az arcfelismerés mára egészen jól megoldott dologgá vált, a többi, képen látható tárgy, mint amilyen például egy hegy vagy egy teafilter, algoritmizált módon való felismerése mindmáig nem igazán működik. Az a felismerés, amivel egyébként az emberi agy tizedmásodpercek alatt megbirkózik.

A képek elemzése ráadásul nem csak nehezen algoritmizálható feladat, hanem igencsak számításigényes is. Amint arról Shumeet Baluja, a Google (egyik) vezető kutatója a kínai demonstráció során beszámolt, a rangsorolt képkereső csak akkor működőképes, ha előtte indexelték a képeket. Ezt megelőzően elemzésre és összehasonlításra van szükség – no és itt kell nagy erőforrásokat fektetni a projektbe, mert ezek bizony komoly számítási teljesítményt igényelnek. Ugyan azt a Google nem árulta el, hogy hány képet indexelt a projekt során, de állításuk szerint a legkomplettebb képkereső adatbázissal rendelkeznek a Webet illetően.

Persze kompromisszumokat kötniük kellett az amerikaiaknak is. Elmondásuk értelmében a kétezer legnépszerűbb tárgyra vonatkozó keresésre koncentráltak, mint amilyenek például a következő szavak: Ipod, Xbox stb. Minden egyes keresés első 10 találatát kiemelték, majd egy 150 főből álló Google csapat relevancia szerint sorba rendezte ezeket. Ennek a beavatkozásnak köszönhetően az ezt követő keresések 83 százalékkal kevesebb irreleváns találatot adtak.

A magyar szavas képkeresés ugyanakkor semmivel sem lett jobb, nem ad több (jobb) találatot, mint korábban; de angolul azért jelentős előrelépést jelenthet a VisualRank.

Tovább