OpenAI se priprema za lansiranje novog agenta vještačke inteligencije (AI) pod nazivom "Operator", koji može da koristi računar za izvršavanje zadataka u ime korisnika, poput pisanja računarskog koda ili čak rezervacije putovanja, pisao je nedavno Bloomberg.
OpenAI je dio širih nastojanja razvojnih kompanija u oblasti vještačke inteligencije da stvore agente ili softver s vještačkom inteligencijom koji može da izvršava višestepene zadatke za korisnike uz minimalan nadzor. Anthropic je predstavio sličnog agenta koji može u realnom vremenu da obrađuje aktivnosti na korisnikovom računaru i radi u njegovo ime. Microsoft, koji podržava OpenAI, takođe je nedavno lansirao set agenata namijenjenih slanju mailova i upravljanju arhivskim datotekama, navodi Bloomberg.
OpenAI je, prema više izvora, radio na nekoliko istraživačkih projekata povezanih s agentima. Onaj koji je najbliži završetku izvršava zadatke u pretraživaču, najvjerovatnije preko OpenAI platforme, i već je skoro spreman za testiranje. O tome je vjerovatno govorio i Sam Altman, koji je za kraj januara najavio novine.
Programer našao znakove da je skoro spreman
Kyle Wiggers prenio je tvrdnje Tibora Blahe, programera poznatog po tome što otkriva nove informacije o razvoju različitih platformi. Ovog puta tvrdi da je u pozadini web-stranice našao znakove koji ukazuju na to da je Operator već skoro spreman.
ChatGPT OpenAI za macOS dobio je opcije, koje su za sada skrivene, za definisanje prečica za aktivaciju ili deaktivaciju (Toggle Operator) i prinudno zaustavljanje Operatora (Force Quit Operator), rekao je Blaho, dok je OpenAI na svojoj web-stranici dodao reference za Operatora koje još uvijek nisu javno vidljive.
Skrivena tabela
Prema Blahovim riječima, web-stranica OpenAI sadrži i tabele koje nisu javne i koje ocjenjuju efikasnost Operatora u poređenju s drugim sistemima vještačke inteligencije namijenjenim upravljanju računarima. Ako su podaci vjerodostojni, pokazuju da Operator nije potpuno pouzdan, jer njegova uspješnost znatno varira u zavisnosti od zadatka.
Na testu OSWorld, koji simulira realno računarsko okruženje, "OpenAI Computer Use Agent (CUA)" - najvjerovatnije AI model koji stoji iza Operatora - postigao je 38,1 odsto. To je više od Anthropicovog modela za upravljanje računarima, ali znatno manje od 72,4 odsto, koliko postižu ljudi. Ipak, OpenAI CUA na testu WebVoyager, koji ocjenjuje navigacione sposobnosti vještačke inteligencije, prevazilazi ljudske mogućnosti. Međutim, na drugom web-testu, WebArena, zaostaje za rezultatima ljudi, prenosi TechCrunch.
Ako su podaci tačni, ni Operator ne uspijeva da izvrši zadatke koje ljudi obično obavljaju bez problema. Na testu gdje je trebalo kreirati nalog kod provajdera cloud usluga i pokrenuti virtuelnu mašinu, bio je uspješan u samo 60 odsto slučajeva. Još lošije se pokazao pri kreiranju bitcoin novčanika, gdje je njegova uspješnost iznosila svega deset odsto.