LEVAN (skraćeno od Learning Everything about Anything) je najnovija online enciklopedija koju smo otkrili na world wide webu i koja funkcioniše na nešto drugačijem principu u odnosu na standardne enciklopedije. Naime, za razliku od klasičnih enciklopedija koje uređuju ljudi, LEVAN je potpuno automatizovan open-source program koji sam pretražuje milione e-knjiga i slika na Internetu kako bi "naučio" sve potencijalne varijacije određenih pojmova, nakon čega korisnicima nudi kolekciju slika tih pojmova i tako im omogućava da istraže određene teme.

LEVAN su razvili naučnici sa Univerziteta u Washingtonu i sa Allen Instituta za umjetnu inteligenciju u Seattleu, kojima je namjera bila kreirati program koji će otkrivati veze između tekstualnih i vizuelnih podataka i koji će lako povezivati, odnosno prepoznavati komplikovane fraze sa slikama na kojima su dotične prikazane.

Način na koji LEVAN prepoznaje određene pojmove na slikama zvuči prilično zanimljivo – za razliku od standardnih online galerija slika, do čijih sadržaja ćete doći pretragom riječi prikazanih u njihovom opisu (tzv. captions), LEVAN skenira sadržaj slika i identificira karakteristične šablone koji se ponavljaju na njima korištenjem posebnih algoritama za prepoznavanje objekata i obilježavanjem skeniranih slika na osnovu njihovog sadržaja i rasporeda piksela na njima.

No, cijeli proces pretrage informacija o novim pojmovima ne kreće od slika, već od samih pojmova – LEVAN će prije prepoznavanja šablona na slikama pretražiti milione knjiga (i to isključivo onih napisanih na engleskom jeziku i dostupnih na Google Books servisu) u potrazi za određenim pojmom i njegovim varijantama. Nakon toga, poseban algoritam će se pobrinuti za filtriranje riječi koje se ne mogu predstaviti vizuelno – u primjeru koji navode na sajtu phys.org, ukoliko je pojam u pitanju "horse", LEVAN će ga znati povezati sa pojmovima "jumping horse" i recimo "eating horse", ali će isto tako znati da treba ignorisati fraze poput "my horse" i "last horse".

I tek tada će se LEVAN baciti na pretraživanje slika na osnovu odabranih pojmova koji imaju veze sa izvornim pojmom, pri tome tražeći sličnosti na pronađenim slikama.

1/1

Cijeli taj proces je prilično dugotrajan – ubacivanje određenih pojmova u LEVAN bazu podataka može potrajati i do 12 sati, zbog čega i ne čudi cifra od svega 214 pojmova koji su do sada pronašli svoje mjesto na LEVAN-u. Međutim, tih 214 pojmova nudi 79.607 podkategorija, a LEVAN je do sada procesirao preko 64 miliona slika i obilježio njih preko 15 miliona.

Svi pretraženi pojmovi se na kraju smještaju na sam LEVAN sajt, gdje im možete pristupiti iz trake na lijevoj strani, dok je najveći dio interfejsa rezervisan za prikaz slika tog pojma i njegovih brojnih podkategorija. Klik na izlistane slike će otvoriti poseban pop-up u kojem ćete pronaći link na tekst o tom pojmu/podkategoriji na Wikipediji, a tu su izlistani i svi slični pojmovi.

Također, obzirom da LEVAN sve radi automatski, vrlo lako možete i sami dodati određene pojmove u njegovu bazu podataka, iako vam niko ne može garantovati kada će se oni zapravo i pojaviti na sajtu. Ali, kada se pojavi, LEVAN će vas automatski obavijestiti putem maila, ukoliko ste prilikom unošenja pojma naveli i svoju mail adresu.

Gdje to sve ostavlja LEVAN na kraju? Pa, njegovi tvorci navode kako ga žele vidjeti i kao alat za učenje, ali i kao ogromnu bazu podataka za istraživače "kompjuterskog vida", a nadaju se da će uskoro korisnicima moći ponuditi i posebnu smartphone aplikaciju koja će moći automatski analizirati i kategorizirati slike. A iako ćemo se mi za sada držati dobre stare Wikipedije, ne možemo poreći kako cijeli LEVAN koncept izgleda i zvuči itekako zanimljivo.

http://levan.cs.washington.edu/