AI još nije spreman zamijeniti vašeg menadžera fonda – a javni eksperimenti koji ga testiraju pokazuju i zašto.
Kroz niz novih natjecanja u trgovanju između vodećih svjetskih AI modela, dosadašnja presuda je nepovoljna. Većina sistema gubi novac. Trguju previše. Donose drastično različite odluke kada dobiju identične upute. I još niko ne zna hoće li ti nedostaci nestati s moćnijim iteracijama – ili otkrivaju nešto temeljno o jazu između velikih jezičnih modela i načina na koji tržišta zapravo funkcioniraju.
Uzmimo za primjer Alpha Arenu, koju vodi tehnološki startup Nof1. Suočili su osam glavnih naprednih AI sistema – uključujući Anthropicov Claude, Googleov Gemini, OpenAI-jev ChatGPT i Grok Elona Muska – jedne protiv drugih u četiri odvojena natjecanja. Svakom je dodijeljeno 10.000 dolara po natjecanju prije nego što su pušteni na američke tehnološke dionice tokom dvije sedmice. Izazovi su uključivali trgovanje na temelju različitih signala, defanzivno djelovanje, reagiranje na konkurenciju i korištenje visoke poluge.
Portfelj je u cjelini izgubio oko trećinu svog kapitala. U svih 32 rezultata, model je završio u dobiti samo šest puta. Grok 4.20 ostvario je najbolji učinak tokom izazova u kojem je bio svjestan rezultata svojih rivala. Izvršio je samo 158 trgovanja; pod istim uputama, Alibabin Qwen trgovao je 1.418 puta.
Alpha Arena jedan je od sve većeg broja eksperimenata koji testiraju mogu li veliki jezični modeli (LLM) obavljati najteži posao u finansijama: pobijediti tržište. Iako ta natjecanja nisu akademski stroga, ona su dosad najjavnija demonstracija onoga što se događa kada sistemi pokušaju preuzeti neke od najprofitabilnijih poslova s visokim ulozima na Wall Streetu.
Rani rezultati su važni jer je trgovanje jedan od poslova koji je finansijska industrija oprezno prepuštala umjetnoj inteligenciji. Tokom posljednjih nekoliko godina, teškaši od JPMorgan Chase & Co. do Balyasny Asset Managementa uposlili su tehnologiju gotovo svugdje drugdje. Veliki jezični modeli sada analiziraju vijesti u kvantitativnim kompanijama, sastavljaju dopise u hedge fondovima i otkrivaju prevare u velikim bankama, uz ostale zadatke. No "čovjek u krugu" (human in the loop) ostaje moto kada je riječ o trgovanju stvarnim novcem. Možda s dobrim razlogom.
"LLM-ovi ne mogu uistinu sami zarađivati novac", rekao je Jay Azhang, osnivač kompanije Nof1. "U osnovi vam je potreban vrlo sofisticiran sistem upravljanja, potporna struktura i podatkovna platforma kako biste im uopće dali priliku."
LLM-ovi su dobri u istraživanju te pronalaženju i primjeni ispravnih alata za određene zadatke, rekao je. No oni još uvijek ne znaju koliko je zapravo važna svaka od brojnih varijabli koje utječu na dionice – uključujući stvari poput ocjena analitičara, transakcija upućenih osoba i promjena u tržišnom raspoloženju. Skloni su lošoj procjeni vremena za trgovanje, nepravilnom određivanju veličine pozicija te prečestoj kupovini i prodaji.
AI blog Flat Circle pratio je 11 tržišnih arena i u svima je postojao barem jedan model koji je zarađivao novac. No medijalni model bio je profitabilan u samo dvije arene, što pokazuje kako se većina njih mučila da nadmaši tržište.
Taj ishod odražava ljudski učinak, budući da većina aktivno upravljanih fondova, kao što je poznato, također zaostaje za širim tržištem. I baš poput ljudi, modeli mogu biti skloni očitim pristranostima. Arene pokazuju da AI sistemi donose vrlo različite odluke uz identične upute, što ima velike implikacije za bilo koju kompaniju koja ih primjenjuje. Naprimjer, Azhang je rekao da je u posljednjem krugu Alpha Arene Claude uglavnom želio ići na duge pozicije, Gemini nije imao problema s kratkim pozicijama, dok je Qwen bio spreman preuzeti rizik uz veliku polugu.
"Oni imaju osobnosti kojima morate upravljati gotovo kao ljudskim analitičarima", rekao je Doug Clinton, voditelj kompanije Intelligent Alpha, koja upravlja fondom vođenim LLM-om i objavljuje vlastiti mjeritelj (benchmark) uspješnosti AI-ja u predviđanju korporativnih prihoda. Rezultati se mogu poboljšati ako se modelu da do znanja da pokazuje određenu pristranost, dodao je.
Mjeritelj kompanije Intelligent Alpha omogućuje desetim AI modelima pristup finansijskim izvješćima, prognozama analitičara, transkriptima prihoda, makroekonomskim podacima i do 10 pretraživanja weba. Uz taj uži fokus, rezultati su pozitivniji za LLM-ove. U četvrtom tromjesečju 2025. godine, OpenAI-jev ChatGPT tačno je predvidio smjer procjena prihoda u 68 posto slučajeva – što su dosad najbolji rezultati. A modeli se, kaže Clinton, poboljšavaju sa svakim novim izdanjem.
Tajne hedge fondova
Procjena bilo čega od ovoga je teška. Dizajnerski odabiri u svemu, od toga koliko često modeli rade do toga kojom imovinom trguju, čine veliku razliku. A standardni test za strategiju trgovanja – njeno testiranje unatrag kroz povijest kako bi se vidjelo kako bi funkcionirala (backtesting) – zapravo ne radi kod AI-ja.
Model koji u 2026. godini dobije pitanje kako bi trgovao u martu 2020. već zna kako je mart 2020. izgledao. Ta kontaminacija, poznata kao pristranost predviđanja (lookahead bias), desetljećima predstavlja izazov okvirima koji leže u temelju akademskih i kvantitativnih finansija. LLM-ovi se umjesto toga moraju procjenjivati na tržištima uživo, otuda i toliki porast mjeritelja i arena.
Možda zato što uglavnom gube novac, AI arene za trgovanje obično traju samo kratko vrijeme. Uz niske prepreke za ulazak, mnoge od njih postavljaju pojedinci ili startupi koji te platforme koriste kao odskočnu dasku za druge proizvode.
Nof1 priprema drugu sezonu Alpha Arene, koja će svakom AI modelu dati mogućnost pretraživanja weba, dužeg razmišljanja, pristupa većem broju izvora podataka i poduzimanja više koraka. No u konačnici, poslovanje te kompanije je sistem koji omogućava malim trgovcima da izgrade vlastite AI agente za trgovanje za svoje strategije.
"Dati novac LLM-u upravo sada i pustiti ga da sam radi – to još uvijek nije realnost", rekao je Azhang.