DALL-E 3 debituje u oktobru: Prompt engineering neće više biti potreban

OpenAI ima uzbudljive vesti: u oktobru stiže DALL-E 3, sa obećanjem da će iz korena promeniti generisanje teksta u sliku. Ova nova verzija će precizno tumačiti tekstualne upite koje daje korisnik bez potrebe za komplikovanim prompt engineeringom.

Kompanija OpenAI je otkrila ovu novost u sredu, 20. septembra, naglašavaju poboljšanu sposobnost sistema da uhvati složene detalje i nijanse.

Nevena Živković
25/09/2023

Vreme Čitanja: 2 min

Ilustracija: Lenka T.

SADRŽAJ

Značajan napredak u generisanju slike iz teksta

Prvi AI model

Etička razmatranja

Tradicionalni modeli za pretvaranje teksta u sliku često su imali problem sa ignorisanjem određenih reči ili opisa, pa su korisnicima morali da se bakću sa prompt engineerigom. DALL-E 3 predstavlja značajan pomak, osiguravajući da se generisane slike precizno usklade sa datim tekstualnim upitima, kao što je objašnjeno na blogu kompanije OpenAI.

Značajan napredak u generisanju slike iz teksta

DALL-E 3 i ChatGPT su skoro savršeno integrisani, što omogućava korisnicima da koriste ChatGPT kao partnera za brainstorming i poboljšavanje upita. Bilo da vam je potrebna jednostavna rečenica ili detaljan pasus, ChatGPT je tu da vam pomogne.

Izvršni direktor OpenAI Sem Altman izrazio je entuzijazam na platformi X, tako što je napisao da je video napravljen korišćenjem novog AI modela „PRESLADAK“.

also, the video we made for dalle 3 is SO CUTE: pic.twitter.com/k1FOFTOsU5
— Sam Altman (@sama) September 20, 2023

DALL-E 3 dolazi sa jedinstvenim obrtom: odbija da replicira stil savremenih umetnika. OpenAI-jev blog je razjasnio ovaj stav i primetio da kreatori sada mogu da odustanu od korišćenja njihovih slika u obuci budućih modela za generisanje slika.

Prvi AI model

DALL-E, prvi put predstavljen u januaru 2021. kao deo GPT-3.5 porodice proizvoda, kombinuje suštinu „Dalija“, osnosno nadrealističkog umetnika Salvadora Dalija, i „WALL-E“, animiranog robota iz Pixarovih filmova. Njegova revolucionarna sposobnost da transformiše tekstualne opise u vizuelnu umetnost privukla je globalnu pažnju.

Sposobnost modela da razlikuje deskriptivni tekst od vizuelnih informacija proizilazi iz ogromnog skupa podataka i parova tekst-slika. Ova fuzija obrade prirodnog jezika i tehnika kompjuterskog vida izdvaja DALL-E od drugih modela.

Etička razmatranja

Iako su sposobnosti modela DALL-E izvanredne, one takođe izazivaju etičku zabrinutost, uobičajenu temu u oblasti veštačke inteligencije. Zabrinutost uključuje potencijalnu zloupotrebu, stvaranje neprikladnog ili opasnog sadržaja i pitanja intelektualne svojine.

DALL-E 3 uvodi funkciju koja može da odbije zahtev za traženje slika koje liče na dela živih umetnika, čime doprinosi rešavanju nekih od tekućih etičkih izazova.

OpenAI nastavlja da unapređuje i usavršava DALL-E i pažljivo prati njegovu odgovornu upotrebu pri različitim primenama. DALL-E 2, prethodna iteracija, donela je brojna poboljšanja i izmene.

Uskoro će DALL-E 3 biti dostupan korisnicima ChatGPT Plus i Enterprise, nudeći garanciju da generisane slike pripadaju korisnicima i da im nije potrebna dozvola OpenAI za reprodukciju ili prodaju.