OpenAI dezvăluie Dall-e 3, un generator de imagini bazat pe Chatgpt, Dall-E 3: Fusion între Chatgpt și generarea de imagini care vor agita Midjourney
DALL-E 3: Fuziunea dintre chatgpt și generarea de imagini care vor agita Midjourney
Prin integrarea Dall-E la Chatgpt, Openai își consolidează poziția de lider în lumea generativă AI. Chatgpt și Dall-e 3, împreună, promit să respingă granițele AI.
OpenAI dezvăluie Dall-e 3, un generator de imagini bazat pe chatgpt
Cea mai recentă versiune a modelului se bazează pe GPT pentru a facilita crearea de imagini complexe și coerente.
OpenAI, compania din spatele GPT esențial, tocmai a dezvăluit cel mai recent model generativ până în prezent. Și de data aceasta, este din nou imaginea care este în centrul atenției; Trupele lui Sam Altman au dezvăluit a treia versiune a generatorului de imagini din Dall-E. El promite Mai multe nuanțe, detalii și complexitate.
Primul punct evidențiat de OpenAI este exactitatea prompt. Chiar și cei mai buni generatori ai momentului, cum ar fi Midjourney sau Dreamstudio, suferă de o problemă comună: au tendința de a ignora anumite cuvinte ale cererii textuale.
Pentru a obține cele mai bune rezultate, este necesar Învață empiric să comunici cu algoritmul. Acest lucru implică a face o mulțime de teste pe vocabular și se întoarce pentru a -i găsi pe cei care sunt cel mai probabil să fie interpretați corect. Acesta este un exercițiu care poate fi delicat atunci când utilizatorul așteaptă un rezultat foarte specific, de unde și termenul ” Inginerie promptă »».
Chatgpt mobilizat pentru compoziția de prompt
Cu Dall-e 3, Openai vrea să pună capăt acestei stări de lucruri. “” Sistemele moderne de text la imagine tind să ignore cuvintele sau descrierile, care formează utilizatorul să învețe promptul important. DALL-E 3 reprezintă un mare pas înainte în capacitatea noastră de a genera imagini care respectă exact textul furnizat „Indică compania.
Și pentru a face acest lucru, compania are deja instrumentul perfect: Chatgpt. Noua versiune a modelului difuziei 3 este ” Construit nativ »În jurul chatbotului. Acum servește ca intermediar pentru Interpretați fiecare detaliu al cererii. Modelul de limbă poate ajuta, de asemenea, utilizatorul să genereze prompt extrem de detaliat, astfel încât Dall-E să înțeleagă exact ceea ce se așteaptă de la el fără a folosi tehnici de Inginerie promptă avansat.
Și dacă rezultatul inițial nu este potrivit, că nu. Este suficient să mergi din nou prin chatgpt pentru a revendica schimbări precise în ceea ce privește culoarea, forma, stilul, un anumit detaliu … Cu alte cuvinte, Openai a pus micile feluri de mâncare în cele mari pentru a oferi un grad de control maxim cu Un minim de efort și expertiză tehnică.
Pe exemplele propuse de OpenAI, rețineți că Dall-E 3 este capabil să genereze texte coerente. Acesta este un lucru pe care generatoarele de imagini au avut multe probleme să facă până acum. De exemplu, cea mai recentă versiune a Midjourney produce întotdeauna suficient … Rezultate exotice atunci când i s -a cerut să se implice în acest exercițiu.
Protejați -i pe cele publice
Compania a impus încă o serie de limite la această a treia versiune. De exemplu, inginerii au consolidat garanțiile deja prezente pe Dall-E și Dall-E 2, care împiedică utilizatorul să genereze conținut ” violent, adult sau urât »».
În plus, Dall-E 3 este conceput pentru a refuza solicitările care menționează în mod explicit o cifră publică. Scopul este de a împiedica utilizarea acestuia în scopuri de propagandă sau dezinformare.
Respectă proprietatea intelectuală
Celălalt punct important al acestei actualizări este faptul că Optai pare să fi luat notă de numeroasele critici care au fost adresate diferitelor generatoare de imagini despre proprietatea intelectuală. Dall-e merge refuză cererile care îi cer să imite stilul unui artist viu. Acest lucru ar trebui să închidă ușa la numeroase încercări contrafăcute.
Pe de altă parte, acest sistem de protecție va fi cu siguranță imperfect. Precizia acestei a treia versiuni este o sabie dublă. În teorie, un utilizator suficient de perceptiv poate obține întotdeauna un rezultat destul de apropiat. Va trebui doar să fiți capabil să descrieți stilul artistului vizat foarte precis fără a numi în mod explicit.
OpenAI oferă, de asemenea, două soluții care permit unui artist de refuză că munca lui este folosită pentru a antrena Dall-e. Primul este să completați formularul la această adresă. Dar dacă doriți să protejați un număr mare, precum cele pe care le păstrați în portofoliul online, idealul este să interziceți accesul la GPTBOT Crawler. Pentru a face acest lucru, trebuie doar să urmați instrucțiunile disponibile la această adresă.
Acest lucru va limita considerabil capacitatea Dall-E 3 de a imita lucrările în cauză. Cel puțin, dacă nu au fost deja trecuți la tambur. Și, din păcate, este imposibil de determinat în practică, deoarece datele sursă nu sunt păstrate după ce au fost integrate în model.
DALL-E3 va fi lansat oficial în octombrie viitor pentru clienții ChatGPT Plus și ChatGPT Entreprise Oferte.
DALL-E 3: Fuziunea dintre chatgpt și generarea de imagini care vor agita Midjourney
Openai, compania -mamă a mamei, nu mai trebuie să fie prezentată. După ce ne-a oferit Chatgpt, ea anunță acum capacitatea acestuia din urmă de a genera imagini precise, datorită fuziunii Dall-E și Chatgpt în Dall-E.
Frandroid, Pentru cei care urmează, folosiți un instrument de generare a imaginilor: Midjourney. Dacă acest instrument s-a dovedit a fi puternic și inovator în lumea generației de imagini, Dall-E din Openai a fost și el pe pistă, cu un curs la fel de impresionant. Și noul opus Risc Dall-E 3 bine pentru a schimba situația.
Conform demonstrațiilor împărtășite de OpenAI, este clar că Dall-E 3 se distinge de predecesorii și concurenții săi. În cazul în care Midjourney excelează în restituirea fotorealistă, dar necesită totuși multe manipulări, Dall-E 3 promite o generare de imagini mult mai eficientă și mai puțin eronată. Un lucru notabil, mai ales având în vedere faptul că acesta este un avans major în comparație cu Dall-E.
În plus, acest nou instrument pare să fi dezvoltat o competență specifică pentru a gestiona textul în imagini, depășind capacitățile unora dintre concurenții săi, cum ar fi difuzia stabilă XL și Deepfloyd. În special, Openai își evidențiază capacitatea de a produce imagini convingătoare cu litere, figuri și chiar mâini umane (o adevărată dificultate pentru aceste instrumente).
DALL-E 3 // Sursa: Openai
DALL-E 3 // Sursa: Openai
DALL-E 3 // Sursa: Openai
DALL-E 3 // Sursa: Openai
DALL-E 3 // Sursa: Openai
DALL-E 3 // Sursa: Openai
DALL-E 3 // Sursa: Openai
DALL-E 3 // Sursa: Openai
Prin integrarea Dall-E la Chatgpt, Openai își consolidează poziția de lider în lumea generativă AI. Chatgpt și Dall-e 3, împreună, promit să respingă granițele AI.
Chatbots nu vor putea doar să converseze într -un mod aproape uman, ci și să -și imagineze și să creeze imagini din descrieri simple. Abia așteptăm să testăm.
Dacă doriți să testați DALL-E 3, acesta va fi disponibil pentru utilizatorii ChatGPT Plus și Enterprise. Ceea ce este mult mai ușor de utilizat decât Midjourney … unde ai nevoie de un client Discord.
Cui i -au generat imaginile ?
Întrebarea dreptului de autor legată de imaginile generate de AI este în prezent un subiect fierbinte. Reglementările actuale sugerează că imaginile IA intră în domeniul public. Cu toate acestea, Openai declară clar că proprietatea imaginilor produse de Dall-E 3 se întoarce la creatorii lor. Și aceasta este o altă dezbatere în sector.
Bing Cat are dreptul și la Dall-E 3
Joi, 21 septembrie, Microsoft a organizat o conferință pentru a anunța următoarea sosire a Copilotului, dar și noua gamă de suprafață. În paralel, compania a comunicat la sosirea modelului Dall-E 3 în Bing Image Creator. Ca amintire, acesta este instrumentul de creare a imaginilor de chat Bing. Potrivit Microsoft, Bing Image Creator ” Înțelegeți, de asemenea, ce cereți, ceea ce vă permite să obțineți imagini mai precise. »»
De asemenea, Microsoft spune că mergeți mai departe adăugând ” Un filigran digital invizibil pentru toate imaginile generate de AI în Bing, inclusiv ora și data creării lor. „Dificil de știut cât de puternic va fi acest filigran și nici cum îi putem verifica sau nu prezența, dar acesta este un prim pas.
Pentru a ne urmări, vă invităm să descărcați aplicația noastră Android și iOS. Puteți citi articolele, fișierele noastre și puteți urmări cele mai recente videoclipuri YouTube.