Godinama se razvoj umjetne inteligencije vodio jednostavnim načelom: što veće, to bolje. Dajte modelu više podataka, više čipova i više električne energije i on će postati pametniji.
To je do određene mjere bilo tačno, posebno u industriji opsjednutoj izgradnjom "superinteligencije" ili sveznajućih računalnih sistema. Međutim, taj pristup skaliranju također je proizveo veliku ekološku štetu koja brzo postaje politički teret dok se zajednice od Malezije do konzervativnih uporišta u SAD-u protive novim podatkovnim centrima.
No, šta ako o svemu tome razmišljamo na pogrešan način? Važnije je pitanje trebaju li većini poduzeća zapravo ti "božanski" AI sistemi i jesu li oni uopće pravi alati za zadatke koji su najbitniji.
Unatoč silnom hypeu, veliki dio praktične i komercijalne vrijednosti umjetne inteligencije proizaći će iz automatizacije specifičnih, repetitivnih zadataka, a ne iz izgradnje sveznajućeg stroja. Za takvu vrstu posla, manji, specijalizirani alati mogli bi biti najbolja opcija. Njihov pogon je jeftiniji, lakše ih je osigurati, manje opterećuju vodne i energetske resurse, a često su jednako učinkoviti. Ako želimo da umjetna inteligencija postane uistinu korisna, a ne politički i ekološki neodrživa, možda bismo fokus trebali preusmjeriti s veličine modela na njihovu primjenu.
Uzmimo za primjer AI agente, koji se već dugo reklamiraju kao sljedeći veliki iskorak u produktivnosti. Njihov potencijal je izrazito privlačan za poslovne lidere s obzirom na to da se radi o softveru koji može djelovati u ime korisnika i obavljati rutinske zadatke i ljudima omogućiti da se bave bitnijim poslom. No, mnogi od tih poslova su toliko banalni da ne zahtijevaju vrhunsku inteligenciju, kao ni energetske apetite ogromnih sistema u oblaku.
Način na koji već desetljećima razmišljamo o umjetnoj inteligenciji temelji se na principu "veće je bolje", rekla mi je Daniela Rus, direktorica MIT-jevog laboratorija za kompjuterske nauke i umjetnu inteligenciju. "Konačni rezultat", rekla je, "jeste da imamo te ogromne modele koji troše puno energije i vode, što rezultira velikim ekološkim otiskom."
Ta ju je spoznaja potaknula prema alternativama. Njeno akademsko eksperimentiranje na kraju je dovelo do LiquidAI-ja, MIT-jevog projekta koji gradi male, specifične modele za poduzeća i istraživače koji se mogu pokretati na uređajima. Kompanija je to postigla koristeći samo 1000 GPU-ova, odnosno naprednih AI procesora. OpenAI je, nasuprot tome, prošlog jula izjavio da očekuje da će do kraja godine upogoniti više od milion GPU-ova.
Čak i jednostavna pristojnost razotkriva neučinkovitost trenutne paradigme. Upotreba riječi "molim" i "hvala" na ChatGPT-ju navodno košta OpenAI desetke miliona dolara u troškovima energije. Za Ramina Hasanija, bivšeg studenta Daniele Rus i suosnivača LiquidAI-a, to je dokaz koliko se otpada ugrađuje u današnje sisteme. On tvrdi da manja, specijalizirana umjetna inteligencija može parirati većim sistemima u oblaku u specifičnim zadacima, pritom trošeći znatno manje energije.
Rus i Hasani nisu jedini. Istraživači iz Nvidije i Tehnološkog instituta Georgia prošle su godine u radu tvrdili da insistiranje na velikim modelima za agentske zadatke "odražava pogrešnu raspodjelu računalnih resursa" koja je "ekonomski neučinkovita i ekološki neodrživa u velikim razmjerima". Prema njihovom mišljenju, prebacivanje takvog radnog opterećenja na manje modele nije samo tehničko usavršavanje, već "moralna" obaveza.
Zašto onda kompanije još uvijek ulažu toliko novca u korištenje divovskih sistema za rutinske poslove? Jedan od odgovora je inercija. Istraživači iz Nvidije ukazuju na ogroman kapital koji je već uložen u postojeći, centralizirani sistem (procjenjuje se da će američki tehnološki divovi zajedno uložiti oko 650 milijardi dolara u AI infrastrukturu samo ove godine). Kada je toliko novca u igri, postaje teže propitivati ima li temeljni pristup i dalje smisla.
Tu je i hype. Mali modeli ne privlače istu marketinšku pompu ili medijsku pozornost, navodi se u radu, čak i kada su prikladniji za mnoge poslovne namjene. Lakše je prodati fantaziju o umjetnoj inteligenciji koja sve zna nego o onoj koja tiho obrađuje dokumente ili obavlja poslove u pozadini jeftinije i sigurnije.
Sve je to posebno važno u Aziji, gdje mnoge kompanije srednje veličine razmišljaju o tome kako održati korak u utrci umjetne inteligencije bez kapitala za izgradnju golemih podatkovnih centara ili energije potrebne za njihovo napajanje. Ako budućnost umjetne inteligencije u potpunosti ovisi o masivnoj infrastrukturi, većina zemalja ostat će osuđena na kupovinu pristupa tuđim sistemima. No, pravi utjecaj mogao bi biti manje povezan sa superinteligencijom, a više sa skromnim sistemima koji kvalitetno obavljaju određene poslove.
To čini sadašnji trenutak idealnim za preispitivanje. Godina 2025. je trebala biti godina AI agenata. To se izjalovilo. Cijena je bila previsoka, a rizici za kibernetičku sigurnost su bili preveliki. Manji modeli, poput onih koji se mogu u potpunosti pokretati na jednom uređaju, mogli bi promijeniti tu računicu. Oni obećavaju niže troškove, bolju sigurnost i znatno manji utjecaj na okoliš.
Umjetna inteligencija nije inherentno neodrživa. Međutim, put prema drugačijoj budućnosti zahtijevat će veći pluralizam u istraživanju, veću spremnost na propitivanje motiva velikih tehnoloških kompanija i manju koncentraciju tehnološke moći.
Najpametnija stvar koju kreatori politika i poslovni lideri sada mogu učiniti jeste smanjiti ambicije. Da bi se tehnološka revolucija proširila, prvo se mora suziti.