OpenAI unapredio generisanje slika sa boljim razumevanjem japanskog, kineskog i drugih jezika, kao i podrškom za širi format i višom rezolucijom
OpenAI je lansirao novu verziju svog modela za generisanje slika, ChatGPT Images 2.0, koji je od danas dostupan svim korisnicima ChatGPT platforme, uključujući besplatni i Go nivo. Kompanija ističe da ovaj model predstavlja značajan napredak u odnosu na prethodne verzije, posebno u načinu na koji sistem prati instrukcije korisnika, prikazuje složen tekst i precizno raspoređuje objekte u jednoj sceni. Images 2.0 je prvi model ove vrste iz OpenAI portfolija koji uključuje i osnovne mogućnosti rezonovanja, što omogućava funkcije kao što su pretraga interneta i verifikacija rezultata generisanih slika, sa ciljem povećanja pouzdanosti i konzistentnosti kada je to najvažnije.
Poseban fokus u novoj verziji stavljen je na podršku za nelatinična pisma, uz značajna poboljšanja u prikazivanju japanskog, korejskog, kineskog, hindi i bengalskog jezika. OpenAI navodi da model sada bolje rekreira karakteristike različitih vizuelnih jezika, što ga čini korisnijim za prototipiranje igara, izradu storyboard-ova i slične kreativne zadatke. Novi model takođe omogućava generisanje slika u širem spektru aspekata – od formata 3:1 do 1:3 – i može praviti slike u rezoluciji do 2K, kao i do osam različitih varijacija u jednom zahtevu.
Tokom testiranja, ChatGPT Images 2.0 uspešno je generisao slike u stilu pixel art-a karakterističnog za treću generaciju Pokémon igara, kao i transparentne PNG fajlove, što je zadatak s kojim se mnogi AI modeli često muče. Takođe, model je generisao četvorostrani manga strip, demonstrirajući napredak u razumevanju i reprodukciji kompleksnih scena i narativa. Ipak, primećene su male razlike između verzija generisanih slika na istu temu, što ukazuje na prostor za dalja poboljšanja u doslednosti vizuelnih elemenata.
Images 2.0 je dostupan i putem OpenAI API servisa, kao i u Codex aplikaciji za kodiranje, koja je nedavno dobila podršku za generisanje slika. Naprednije opcije, uključujući veći broj izlaza i dodatne funkcionalnosti, dostupne su Plus i Pro pretplatnicima. Ova verzija stiže svega nekoliko dana nakon što je konkurentska kompanija Anthropic predstavila sopstveni AI alat za vizuelni dizajn, čime se tržišna utakmica na polju generativnih AI alata dodatno zaoštrava.
Dalje poređenje sa konkurentskim modelima, poput Google-ovog Nano Banana 2, pokazaće u kojoj meri OpenAI Images 2.0 odgovara na zahteve profesionalaca i šireg tržišta. Prvi utisci pokazuju da su ključna poboljšanja u preciznosti, fleksibilnosti i podršci za različite jezike, što bi moglo značajno uticati na kreativne industrije i digitalni dizajn.