DALL-E 3 debituje u oktobru: Prompt engineering neće više biti potreban 

OpenAI ima uzbudljive vesti: u oktobru stiže DALL-E 3, sa obećanjem da će iz korena promeniti generisanje teksta u sliku. Ova nova verzija će precizno tumačiti tekstualne upite koje daje korisnik bez potrebe za komplikovanim prompt engineeringom.

Kompanija OpenAI je otkrila ovu novost u sredu, 20. septembra, naglašavaju poboljšanu sposobnost sistema da uhvati složene detalje i nijanse.

Vreme Čitanja: 2 min

dall-e 3

Ilustracija: Lenka T.

Tradicionalni modeli za pretvaranje teksta u sliku često su imali problem sa ignorisanjem određenih reči ili opisa, pa su korisnicima morali da se bakću sa prompt engineerigom. DALL-E 3 predstavlja značajan pomak, osiguravajući da se generisane slike precizno usklade sa datim tekstualnim upitima, kao što je objašnjeno na blogu kompanije OpenAI. 

Značajan napredak u generisanju slike iz teksta

DALL-E 3 i ChatGPT su skoro savršeno integrisani, što omogućava korisnicima da koriste ChatGPT kao partnera za brainstorming i poboljšavanje upita. Bilo da vam je potrebna jednostavna rečenica ili detaljan pasus, ChatGPT je tu da vam pomogne.  

Izvršni direktor OpenAI Sem Altman izrazio je entuzijazam na platformi X, tako što je napisao da je video napravljen korišćenjem novog AI modela „PRESLADAK“. 

DALL-E 3 dolazi sa jedinstvenim obrtom: odbija da replicira stil savremenih umetnika. OpenAI-jev blog je razjasnio ovaj stav i primetio da kreatori sada mogu da odustanu od korišćenja njihovih slika u obuci budućih modela za generisanje slika. 

Prvi AI model

DALL-E, prvi put predstavljen u januaru 2021. kao deo GPT-3.5 porodice proizvoda, kombinuje suštinu „Dalija“, osnosno nadrealističkog umetnika Salvadora Dalija, i „WALL-E“, animiranog robota iz Pixarovih filmova. Njegova revolucionarna sposobnost da transformiše tekstualne opise u vizuelnu umetnost privukla je globalnu pažnju. 

Sposobnost modela da razlikuje deskriptivni tekst od vizuelnih informacija proizilazi iz ogromnog skupa podataka i parova tekst-slika. Ova fuzija obrade prirodnog jezika i tehnika kompjuterskog vida izdvaja DALL-E od drugih modela. 

Etička razmatranja  

Iako su sposobnosti modela DALL-E izvanredne, one takođe izazivaju etičku zabrinutost, uobičajenu temu u oblasti veštačke inteligencije. Zabrinutost uključuje potencijalnu zloupotrebu, stvaranje neprikladnog ili opasnog sadržaja i pitanja intelektualne svojine. 

DALL-E 3 uvodi funkciju koja može da odbije zahtev za traženje slika koje liče na dela živih umetnika, čime doprinosi rešavanju nekih od tekućih etičkih izazova. 

OpenAI nastavlja da unapređuje i usavršava DALL-E i pažljivo prati njegovu odgovornu upotrebu pri različitim primenama. DALL-E 2, prethodna iteracija, donela je brojna poboljšanja i izmene. 

Uskoro će DALL-E 3 biti dostupan korisnicima ChatGPT Plus i Enterprise, nudeći garanciju da generisane slike pripadaju korisnicima i da im nije potrebna dozvola OpenAI za reprodukciju ili prodaju. 

Prijavi se na WebMind NJUZLETER, čeka te izbor konkretnih priča i uvida.

"Pokušao si. Propao. Nema veze. Pokušaj opet. Propadni bolje."

Prijavi se na novosti.