Ali se lahko računalnik nauči zdravega razuma?
V ne preveč oddaljeni preteklosti bi namigovanje, da bi računalnik lahko pokazal "zdravo pamet", veljalo za oksimoron. Toda superračunalniki, kot je IBM-ov Watson, lahko predstavljajo nove vloge računalnikov.Trenutno raziskovalci na univerzi Carnegie Mellon izvajajo računalniški program 24 ur na dan, 7 dni v tednu, da bi množično zajemali podatke in se učili zdrave pameti.
Program se imenuje Never Ending Image Learner (NEIL), ko programska oprema išče slike po spletu in se po svojih najboljših močeh trudi, da bi jih razumela sama, in ko gradi vedno večjo vizualno bazo podatkov, množično zbira zdravo pamet.
NEIL izkorišča nedavni napredek računalniškega vida, ki računalniškim programom omogoča prepoznavanje in označevanje predmetov na slikah, označevanje prizorov in prepoznavanje lastnosti, kot so barve, razsvetljava in materiali, vse z minimalnim človeškim nadzorom.
Podatki, ki jih ustvari, pa bodo še izboljšali sposobnost računalnikov, da razumejo vizualni svet.
NEIL ima pomemben napredek v primerjavi s prejšnjimi robotskimi napravami, saj lahko poveže stvari, da pridobi informacije o zdravi pameti. Informacije, ki jih ljudje poznajo skorajda intuitivno - da avtomobile pogosto najdemo na cestah, da so zgradbe običajno navpične in da so race videti nekako kot gosi.
Na podlagi besedilnih sklicev se morda zdi, da je barva ovc črna, toda ljudje - in zdaj NEIL - kljub temu vedo, da so ovce običajno bele.
"Slike so najboljši način za učenje vizualnih lastnosti," je povedal dr. Abhinav Gupta, docent na Inštitutu za robotiko Carnegie Mellon.
»Slike vključujejo tudi veliko zdravorazumskih informacij o svetu. Ljudje se tega naučijo sami in z NEIL-om upamo, da bodo to storili tudi računalniki. "
Računalniška skupina od konca julija izvaja program NEIL in je že analizirala tri milijone slik, na pol milijona slik pa je prepoznala 1.500 vrst predmetov in 1.200 vrst prizorov na sto tisočih slikah.
Pike je povezal, da se je na tisoče primerkov naučilo 2500 združenj.
Motivacija za projekt NEIL je ustvariti največjo vizualno strukturirano bazo znanja na svetu, kjer so predmeti, prizori, akcije, atributi in kontekstualni odnosi označeni in katalogizirani.
"V zadnjih 5-10 letih raziskav računalniškega vida smo se naučili, da več podatkov imate, boljši postane računalniški vid," je dejal Gupta.
Nekateri projekti, kot sta ImageNet in Visipedia, so poskušali zbrati te strukturirane podatke s človeško pomočjo.
Toda obseg interneta je tako velik - samo Facebook ima več kot 200 milijard slik -, da je edino upanje, da vse to analizira, naučiti računalnike, da to počnejo večinoma sami.
Ljudje NEIL-u tudi povedo, katere kategorije predmetov, prizorov itd. Naj iščejo in analizirajo. Toda včasih lahko ugotovitve družbe NEIL presenetijo celo raziskovalce.
Pričakujemo lahko na primer, da lahko iskanje "jabolka" vrne slike sadja in prenosnih računalnikov. Toda Gupta in njegova ekipa, vsi moški, sploh niso slutili, da bo iskanje F-18 identificiralo ne samo slike lovskih letal, temveč tudi katamarane razreda F18.
Z iskanjem NEIL razvija podkategorije predmetov - tricikli so lahko za otroke, odrasle in so lahko motorizirani ali pa avtomobili prihajajo v različnih znamkah in modelih.
In začne opažati asociacije - da so zebre na primer navadno najdene v savanah in da so tla za trgovanje z delnicami navadno gneča.
Preden lahko NEIL postane gospodinjsko ime, bo treba zmanjšati obseg, saj je NEIL računsko intenziven, program se izvaja na dveh gručah računalnikov, ki vključujejo 200 procesorskih jeder.
Vir: Univerza Carnegie Mellon