OpenAI se priprema za lansiranje novog agenta veštačke inteligencije (AI) pod nazivom "Operator", koji može da koristi računar za izvršavanje zadataka u ime korisnika, poput pisanja računarskog koda ili čak rezervacije putovanja, pisao je nedavno Bloomberg.
OpenAI je deo širih nastojanja razvojnih kompanija u oblasti veštačke inteligencije da stvore agente ili softver sa veštačkom inteligencijom koji može da izvršava višestepene zadatke za korisnike uz minimalan nadzor. Anthropic je predstavio sličnog agenta koji može u realnom vremenu da obrađuje aktivnosti na korisnikovom računaru i radi u njegovo ime. Microsoft, koji podržava OpenAI, takođe je nedavno lansirao set agenata namenjenih slanju mejlova i upravljanju arhivskim datotekama, navodi Bloomberg.
OpenAI je, prema više izvora, radio na nekoliko istraživačkih projekata povezanih s agentima. Onaj koji je najbliži završetku izvršava zadatke u pretraživaču, najverovatnije preko OpenAI platforme, i već je skoro spreman za testiranje. O tome je verovatno govorio i Sam Altman, koji je za kraj januara najavio novine.
Programer našao znakove da je skoro spreman
Kyle Wiggers preneo je tvrdnje Tibora Blahe, programera poznatog po tome što otkriva nove informacije o razvoju različitih platformi. Ovog puta tvrdi da je u pozadini veb-sajta našao znakove koji ukazuju na to da je Operator već skoro spreman.
ChatGPT OpenAI za macOS dobio je opcije, koje su za sada skrivene, za definisanje prečica za aktivaciju ili deaktivaciju (Toggle Operator) i prinudno zaustavljanje Operatora (Force Quit Operator), rekao je Blaho, dok je OpenAI na svom veb-sajtu dodao reference za Operatora koje još uvek nisu javno vidljive.
Skrivena tabela
Prema Blahovim rečima, veb-sajt OpenAI sadrži i tabele koje nisu javne i koje ocenjuju efikasnost Operatora u poređenju s drugim sistemima veštačke inteligencije namenjenim upravljanju računarima. Ako su podaci verodostojni, pokazuju da Operator nije potpuno pouzdan, jer njegova uspešnost znatno varira u zavisnosti od zadatka.
Na testu OSWorld, koji simulira realno računarsko okruženje, "OpenAI Computer Use Agent (CUA)" - najverovatnije AI model koji stoji iza Operatora - postigao je 38,1 odsto. To je više od Anthropicovog modela za upravljanje računarima, ali znatno manje od 72,4 odsto, koliko postižu ljudi. Ipak, OpenAI CUA na testu WebVoyager, koji ocenjuje navigacione sposobnosti veštačke inteligencije, prevazilazi ljudske mogućnosti. Međutim, na drugom veb-testu, WebArena, zaostaje za rezultatima ljudi, prenosi TechCrunch.
Ako su podaci tačni, ni Operator ne uspeva da izvrši zadatke koje ljudi obično obavljaju bez problema. Na testu gde je trebalo kreirati nalog kod provajdera klaud usluga i pokrenuti virtuelnu mašinu, bio je uspešan u samo 60 odsto slučajeva. Još lošije se pokazao pri kreiranju bitcoin novčanika, gde je njegova uspešnost iznosila svega deset odsto.