IT

ChatGPT Images 2.0 donosi preciznije prikazivanje nelatiničnih pisama i napredne AI mogućnosti

OpenAI unapredio generisanje slika sa boljim razumevanjem japanskog, kineskog i drugih jezika, kao i podrškom za širi format i višom rezolucijom

Published

on

g223133dcb4a5c123d96c9a210736687235f18ed41dbff0fb05c1722f02c6dcb45ae169437585606ab9d3efb86b1835ae27d3ba4768b9bc46bca5bb9c99cb15d2_1280

OpenAI unapredio generisanje slika sa boljim razumevanjem japanskog, kineskog i drugih jezika, kao i podrškom za širi format i višom rezolucijom

OpenAI je lansirao novu verziju svog modela za generisanje slika, ChatGPT Images 2.0, koji je od danas dostupan svim korisnicima ChatGPT platforme, uključujući besplatni i Go nivo. Kompanija ističe da ovaj model predstavlja značajan napredak u odnosu na prethodne verzije, posebno u načinu na koji sistem prati instrukcije korisnika, prikazuje složen tekst i precizno raspoređuje objekte u jednoj sceni. Images 2.0 je prvi model ove vrste iz OpenAI portfolija koji uključuje i osnovne mogućnosti rezonovanja, što omogućava funkcije kao što su pretraga interneta i verifikacija rezultata generisanih slika, sa ciljem povećanja pouzdanosti i konzistentnosti kada je to najvažnije.

Poseban fokus u novoj verziji stavljen je na podršku za nelatinična pisma, uz značajna poboljšanja u prikazivanju japanskog, korejskog, kineskog, hindi i bengalskog jezika. OpenAI navodi da model sada bolje rekreira karakteristike različitih vizuelnih jezika, što ga čini korisnijim za prototipiranje igara, izradu storyboard-ova i slične kreativne zadatke. Novi model takođe omogućava generisanje slika u širem spektru aspekata – od formata 3:1 do 1:3 – i može praviti slike u rezoluciji do 2K, kao i do osam različitih varijacija u jednom zahtevu.

Tokom testiranja, ChatGPT Images 2.0 uspešno je generisao slike u stilu pixel art-a karakterističnog za treću generaciju Pokémon igara, kao i transparentne PNG fajlove, što je zadatak s kojim se mnogi AI modeli često muče. Takođe, model je generisao četvorostrani manga strip, demonstrirajući napredak u razumevanju i reprodukciji kompleksnih scena i narativa. Ipak, primećene su male razlike između verzija generisanih slika na istu temu, što ukazuje na prostor za dalja poboljšanja u doslednosti vizuelnih elemenata.

Images 2.0 je dostupan i putem OpenAI API servisa, kao i u Codex aplikaciji za kodiranje, koja je nedavno dobila podršku za generisanje slika. Naprednije opcije, uključujući veći broj izlaza i dodatne funkcionalnosti, dostupne su Plus i Pro pretplatnicima. Ova verzija stiže svega nekoliko dana nakon što je konkurentska kompanija Anthropic predstavila sopstveni AI alat za vizuelni dizajn, čime se tržišna utakmica na polju generativnih AI alata dodatno zaoštrava.

Dalje poređenje sa konkurentskim modelima, poput Google-ovog Nano Banana 2, pokazaće u kojoj meri OpenAI Images 2.0 odgovara na zahteve profesionalaca i šireg tržišta. Prvi utisci pokazuju da su ključna poboljšanja u preciznosti, fleksibilnosti i podršci za različite jezike, što bi moglo značajno uticati na kreativne industrije i digitalni dizajn.

Leave a Reply

Your email address will not be published. Required fields are marked *

U Trendu

Exit mobile version