Nakon pojavljivanja ChatGPT-ja u novembru 2022. godine, 2023. je označila prekretnicu u umjetnoj inteligenciji (engl. Artificial Intelligence, skraćeno AI). Prošlogodišnji razvoj od živahnog krajolika otvorenog koda do sofisticiranih multimodalnih modela postavio je temelje za značajan napredak u umjetnoj inteligenciji.
Iako generativna umjetna inteligencija nastavlja osvajati svijet tehnologije, stavovi postaju sve nijansiraniji i zreliji kako organizacije prebacuju fokus s eksperimentiranja na inicijative i primjene u stvarnom svijetu i na realnim problemima. Ovogodišnji trendovi odražavaju sve veću sofisticiranost i oprez u strategijama razvoja i implementacije umjetne inteligencije, s osvrtom na etiku, sigurnost i razvoj regulatornog krajolika.
U nastavku su navedeni neki od najvažnijih trendova umjetne inteligencije i mašinskog učenja (engl. Machine Learning, skraćeno ML) na koje bi se trebao staviti poseban fokus u narednom periodu.
1. Multimodalni AI (engl. Multimodal AI)
Multimodalna umjetna inteligencija nadilazi tradicionalnu obradu podataka u jednom načinu rada kako bi obuhvatila više vrsta unosa, kao što su tekst, slike i zvuk - što je korak prema oponašanju ljudske sposobnosti obrade različitih osjetilnih informacija.
"Okruženje u svijetu u kojem živimo u potpunosti je multimodalno", rekao je Mark Chen, voditelj odjela za istraživanja u OpenAI-u, tokom svoje prezentacije na konferenciji u novembru 2023. "Želimo da naši modeli vide ono što mi (ljudi) vidimo i čuju ono što mi čujemo, a želimo i da generiraju sadržaj koji privlači više od jednog našeg osjetila", dodao je.
Multimodalne mogućnosti u OpenAI GPT-4 modelu omogućavaju softveru da odgovori na vizualni i audio unos. U svom govoru Chen je dao primjer fotografiranja unutrašnjosti hladnjaka i traženja od ChatGPT-ja da predloži recept na temelju sastojaka na fotografiji. Interakcija bi čak mogla obuhvatiti i audio elemente ako se koristi ChatGPT-jev glasovni način za postavljanje dodatnih zahtjeva.
Iako je većina generativnih inicijativa umjetne inteligencije danas temeljena na tekstu, "stvarna moć ovih mogućnosti će se u punom kapacitetu dogoditi kada budete mogli spojiti tekst i razgovor sa slikama i videom, te sve to zajedno primijenite na razne oblike i sfere poslovanja", rekao je Matt Barrington, voditelj tehnologija za razvoj u američkom ogranku kompanije EY.
Primjene multimodalne umjetne inteligencije u stvarnom svijetu zaista su raznolike i kontinuirano rastu. U zdravstvu, na primjer, multimodalnim modelima mogu se analizirati medicinske slike u svjetlu historije podataka pacijenta i relevantnih genetskih informacija kako bi se poboljšala tačnost dijagnostike. Na razini funkcije posla, multimodalni modeli mogu proširiti ono što različiti zaposlenici mogu učiniti proširujući osnovne mogućnosti dizajna i kodiranja na pojedince bez formalne pozadine u tim područjima.
Štoviše, uvođenje multimodalnih mogućnosti moglo bi ojačati modele nudeći im nove podatke iz kojih mogu učiti. "Kako naši modeli postaju sve bolji i bolji u modeliranju jezika i počinju dosezati granice onoga što mogu naučiti iz jezika, želimo modelima pružiti sirove unose iz svijeta kako bi mogli sami percipirati svijet i donositi svoje vlastite zaključke iz stvari kao što su video ili audio podaci", rekao je Chen.
2. AI baziran na agentima (engl. Agentic AI)
Agentni AI predstavlja značajan pomak od reaktivne prema proaktivnoj AI. AI agenti su napredni sistemi koji pokazuju autonomiju, proaktivnost i sposobnost samostalnog djelovanja. Za razliku od tradicionalnih AI sistema, koji uglavnom odgovaraju na korisničke unose i slijede unaprijed određeno programiranje, AI agenti su dizajnirani da razumiju svoje okruženje, postavljaju ciljeve i djeluju kako bi postigli te ciljeve bez izravne ljudske intervencije.
Naprimjer, u nadzoru okoliša, agent umjetne inteligencije mogao bi biti obučen za prikupljanje podataka, analizu uzoraka i pokretanje preventivnih radnji kao odgovor na opasnosti kao što su rani znakovi šumskog požara. Isto tako, financijski AI agent mogao bi aktivno upravljati investicijskim portfolijom koristeći prilagodljive strategije koje reagiraju na promjenjive tržišne uvjete u realnom vremenu.
"Godina 2023. je bila godina mogućnosti razgovora s umjetnom inteligencijom", napisao je naučnik Peter Norvig, saradnik na Stanfordovom Human-Centered AI institutu, u nedavnoj objavi na svom blogu. "U 2024. ćemo vidjeti mogućnost da agenti obavljaju stvari za vas. Napravite rezervacije, planirajte putovanje, povežite se s drugim uslugama, vjerujem da će sve to biti moguće", dodao je.
Osim toga, kombiniranje agentne i multimodalne umjetne inteligencije moglo bi otvoriti nove mogućnosti. U spomenutoj prezentaciji Chen je dao primjer aplikacije dizajnirane za prepoznavanje sadržaja učitane slike. Prethodno bi neko ko želi izraditi takvu aplikaciju trebao uvježbati vlastiti model prepoznavanja slike i zatim osmisliti najbolji način implementacije. S multimodalnim i agentskim modelima sve bi se to moglo postići putem prirodnog jezika, što predstavlja dodatnu dimenziju i revoluciju u IT svijetu, prvenstveno programiranju.
3. AI otvorenog koda (engl. Open source AI)
Izgradnja velikih jezičnih modela i drugih snažnih generativnih AI sistema skup je proces koji zahtijeva ogromne količine računara i podataka. Međutim, korištenje modela otvorenog koda omogućava razvojnim programerima nadogradnju na "tuđe" radove, smanjujući troškove i proširujući pristup umjetnoj inteligenciji. Umjetna inteligencija otvorenog koda javno je dostupna, obično besplatna, što omogućava organizacijama i istraživačima da doprinesu postojećem kodu i nadograđuju ga.
Podaci GitHuba iz prošle godine pokazuju značajan porast uključenosti programera u AI, posebno generativni AI. Godine 2023. generativni AI projekti prvi su put ušli među 10 najpopularnijih projekata na ovoj platformi za hosting koda, s projektima kao što su Stable Diffusion i AutoGPT koji su privukli desetine hiljada novih saradnika i pratilaca.
Početkom godine broj generativnih modela otvorenog koda bio je ograničen, a njihova izvedba često je zaostajala za opcijama kao što je ChatGPT. No, krajolik se značajno proširio tokom 2023. uključivši moćne konkurente otvorenog koda kao što su Meta Llama 2 i Mistral AI Mixtral modeli. To bi moglo promijeniti dinamiku AI krajolika u narednom periodu pružajući manjim subjektima s manje resursa pristup sofisticiranim modelima i alatima AI koji su prije bili nedostupni.
"Ovakvi pristupi svima daju jednostavan, prilično demokratiziran pristup i odlični su za eksperimentiranje i istraživanje", rekao je Barrington.
Pristupi otvorenog koda također mogu potaknuti transparentnost i etički razvoj, budući da više pozornosti na kod znači veću vjerovatnost prepoznavanja pristrasnosti, grešaka i sigurnosnih ranjivosti. Ipak, stručnjaci su izrazili zabrinutost zbog zlouporabe umjetne inteligencije otvorenog koda za stvaranje dezinformacija i drugog štetnog sadržaja. Osim toga, izgradnja i održavanje otvorenog koda teški su čak i za tradicionalni softver, a kamoli za složene i resursno veoma intenzivne AI modele.
4. Generiranje prošireno dohvaćanjem (engl. Retrieval-augmented generation)
Iako su generativni AI alati naširoko prihvaćeni 2023., i dalje ih "muči" problem halucinacija: odgovori koji zvuče uvjerljivo, ali su netačni na upite korisnika. Ovo je ograničenje predstavljalo prepreku usvajanju u većem broju kompanija, gdje bi halucinacije u kritičnim poslovnim scenarijima ili scenarijima okrenutim prema klijentima mogle biti katastrofalne. Retrieval-augmented Generation (RAG) pojavila se kao tehnika za smanjenje halucinacija, s potencijalno dubokim implikacijama za usvajanje umjetne inteligencije u kompanijama.
RAG spaja generiranje teksta s pronalaženjem informacija kako bi se poboljšale tačnost i relevantnost sadržaja generiranog umjetnom inteligencijom. Istovremeno omogućava LLM (engl. Large Language Model) pristup vanjskim informacijama, pomažući im da proizvedu tačnije i kontekstualno svjesnije odgovore. Zaobilaženje potrebe za pohranjivanjem svog znanja izravno u LLM također smanjuje veličinu modela, što povećava brzinu i smanjuje troškove.
"Možete upotrijebiti RAG da prikupite izuzetno velike količine nestrukturiranih informacija, dokumenata i sl. i sve to unesete u model bez potrebe za finim podešavanjem ili prilagođavanjem modela", rekao je Barrington.
Ove prednosti posebno su primamljive za poslovne aplikacije gdje je najnovije činjenično znanje ključno. Naprimjer, kompanije mogu koristiti RAG s temeljnim modelima za stvaranje učinkovitijih i informativnijih chatbotova i virtualnih pomoćnika.
5. Prilagođeni generativni AI modeli
Masivni alati opće namjene kao što su Midjourney i ChatGPT privukli su najviše pažnje među potrošačima koji istražuju generativnu umjetnu inteligenciju. Ali, za slučajeve poslovne upotrebe manji modeli uske namjene mogli bi se pokazati kao najizdržljiviji, potaknuti sve većom potražnjom za AI sistemima koji mogu zadovoljiti i najspecifičnije zahtjeve.
Iako je stvaranje novog modela od nule uvijek jedna od mogućnosti, to je prijedlog koji zahtijeva mnogo resursa i neće biti dostupan mnogim organizacijama. Da bi izgradile prilagođenu generativnu umjetnu inteligenciju, većina organizacija umjesto toga modificira postojeće modele umjetne inteligencije - na primjer, prilagođavanje njihove arhitekture ili fino podešavanje skupa podataka specifičnih za domenu. To može biti jeftinije od izgradnje novog modela iz temelja ili oslanjanja na API (engl. Application Programming Interface) pozive javnom LLM-u.
"Pozivi prema GPT-4 kao API-ju, samo kao primjer, vrlo su skupi, i u smislu cijene i u smislu latencije - koliko dugo zapravo može trajati da se vrati rezultat", rekao je Shane Luke, potpredsjednik za AI i mašinsko učenje u kompaniji Workday. "Puno radimo na optimizaciji kako bismo imali iste mogućnosti, koje su vrlo ciljane i specifične. U tom slučaju to može biti mnogo manji model kojim se lakše može upravljati", zaključio je Luke.
Ključna prednost prilagođenih generativnih AI modela je njihova sposobnost da zadovolje tržišne niše i potrebe korisnika. Prilagođeni generativni AI alati mogu se izraditi za gotovo svaki scenarij, od korisničke podrške do upravljanja opskrbnim lancem ili pregleda dokumenata. Ovo je posebno važno za sektore s visoko specijaliziranom terminologijom i praksom, kao što su zdravstvo, finansije i pravo.
"Iako bi ChatGPT mogao biti vrhunac za chatbot namijenjen potrošačima koji je dizajniran za obradu bilo kojeg upita, to nije vrhunac za aplikacije manjih kompanija", rekao je Luke.
Izrada prilagođenog modela umjesto korištenja gotovih javnih alata često također poboljšava privatnost i sigurnost jer organizacijama daje veću kontrolu nad njihovim podacima. Luke je dao primjer izgradnje modela za radne zadatke koji uključuju rukovanje osjetljivim osobnim podacima, kao što su status invaliditeta i historija zdravlja. "To nisu stvari koje bismo željeli poslati trećoj strani", rekao je. "Našim kupcima to općenito ne bi bilo ugodno."
U svjetlu ovih pogodnosti u vezi s privatnošću i sigurnošću, stroža regulacija umjetne inteligencije u predstojećim godinama mogla bi potaknuti organizacije da usmjere svoju energiju na vlastite modele, objasnila je Gillian Crossan, voditeljica savjetovanja za rizike i voditeljica globalnog tehnološkog sektora u kompaniji Deloitte.
"To će potaknuti kompanije da se više usredotoče na privatne modele koji su zapravo njihovi vlastiti, koji su specifični za domenu, umjesto da se fokusiraju na dostupne velike jezične modele koji su uvježbani podacima s cijelog interneta i svime što to nosi sa sobom", rekla je.
Dodatni trendovi koji će svakako biti od velikog interesa u narednom periodu su i:
Izrazita potreba za AI i ML talentima i ekspertima
"AI iz sjene" (engl. Shadow AI)
Generičke AI aplikacije u realnim primjenama
Povećana pozornost na etiku umjetne inteligencije i sigurnosne rizike
Razvoj AI regulative
I ove teme zajedno s njihovim konsekvencama svakako zaslužuju posebnu i detaljnu analizu.
Zaključio bih jednim interesantnim razmišljanjem, a to je da su se ljudi početkom XX stoljeća često pitali sta će u budućnosti raditi, jer su se tada jedino i isključivo bavili poljoprivredom. Napretkom tehnologija i raznim dostignućima došlo je do stvaranja novih kategorija poslova. Kontinuiranim inovacijama danas mnogo bolje živimo nego u tom periodu. Vjerujem i nadam se da će i sa AI biti identična situacija, da ćemo u narednom periodu zapravo uvidjeti i koristiti sve pozitivne benefite od AI revolucije. Potencijal je zaista ogroman. Za kraj bih citirao jednog poznatog svjetskog profesora i naučnika: "AI će biti 'ili najbolja ili najgora stvar' za čovječanstvo". Na to bih dodao: Sve zavisi od načina i područja primjene.
Dr. Emir Žunić je docent i Al ekspert.
Sadržaj, stavovi i mišljenja izneseni u komentarima objavljenim na Bloomberg Adriji pripadaju autoru i ne predstavljaju nužno stavove uredništva Bloomberg Adrije.