OpenAI revela Dall-e 3, um gerador de imagens baseado no chatgpt, Dall-e 3: Fusion entre ChatGPT e a geração de imagens que irão agitar-se no meio do MidJourney
Dall-e 3: A fusão entre ChatGPT e a geração de imagens que irão agitar o Midjourney
Ao integrar o Dall-e no ChatGPT, o OpenAI fortalece sua posição como líder no mundo generativo da IA. Chatgpt e Dall-e 3, juntos, prometem repelir as fronteiras da AI.
OpenAI revela Dall-e 3, um gerador de imagem baseado no chatgpt
A versão mais recente do modelo é baseada no GPT para facilitar a criação de imagens complexas e coerentes.
Openai, a empresa por trás do GPT essencial, acaba de revelar seu mais recente modelo generativo até o momento. E desta vez, é novamente a imagem que está no centro das atenções; As tropas de Sam Altman revelaram a terceira versão do gerador de imagens Dall-E. Ele promete Mais tons, detalhes e complexidade.
O primeiro ponto destacado pelo OpenAI é a precisão de incitar. Até os melhores geradores do momento, como Midjourney ou DreamStudio, sofrem de um problema comum: eles têm tendência a ignorar certas palavras da solicitação textual.
Para obter os melhores resultados, é necessário Aprenda empiricamente a se comunicar com o algoritmo. Isso implica fazer muitos testes no vocabulário e se virar para encontrar aqueles que têm maior probabilidade de serem interpretados corretamente. Este é um exercício que pode ser delicado quando o usuário aguarda um resultado muito específico, daí o termo ” Engenharia rápida »».
Chatgpt mobilizado para a composição de incitar
Com Dall-e 3, o Openai quer acabar com esse estado de coisas. “” Os sistemas modernos de texto para imagem tendem a ignorar palavras ou descrições, que formam o usuário a aprender o prompt de promidório. Dall-e 3 representa um grande passo à frente em nossa capacidade de gerar imagens que aderem exatamente ao texto fornecido “Indica a empresa.
E para fazer isso, a empresa já possui a ferramenta perfeita: Chatgpt. A nova versão do modelo Diffusion 3 é ” Nativamente construído »Ao redor do chatbot. Agora serve como intermediário para Interprete todos os detalhes do pedido. O modelo de idioma também pode ajudar o usuário a gerar incitar extremamente detalhado para que Dall-e entenda exatamente o que se espera dele sem usar técnicas de Engenharia rápida Avançado.
E se o resultado inicial não for adequado, que não. Basta ir novamente por chatgpt para reivindicar mudanças precisas em termos de cor, forma, estilo, um detalhe particular … em outras palavras, o OpenAI colocou os pequenos pratos nos grandes para oferecer um grau de controle máximo com Um mínimo de esforço e conhecimento técnico.
Nos exemplos propostos pelo OpenAI, observe também que o Dall-e 3 é capaz de gerar textos coerentes. Isso é algo que os geradores de imagens tiveram muitos problemas para fazer até agora. Por exemplo, a versão mais recente do Midjourney sempre produz o suficiente … resultados exóticos quando solicitados a se envolver neste exercício.
Proteger figuras públicas
A empresa ainda impôs vários limites nesta terceira versão. Por exemplo, os engenheiros consolidaram as salvaguardas já presentes em Dall-E e Dall-e 2, que impedem o usuário de gerar conteúdo ” Violento, adulto ou odioso »».
Além disso, o Dall-E 3 foi projetado para recusar solicitações que mencionam explicitamente uma figura pública. O objetivo é impedir que ele seja usado para fins de propaganda ou desinformação.
Respeite Propriedade Intelectual
O outro ponto importante desta atualização é que o Optai parece ter tomado nota das muitas críticas que foram endereçadas aos vários geradores de imagens sobre propriedade intelectual. Dall-e vai Recuse os pedidos que pedem que ele imite o estilo de um artista vivo. Isso deve fechar a porta para inúmeras tentativas falsificadas.
Por outro lado, esse sistema de proteção certamente será imperfeito. A precisão desta terceira versão é uma espada de dois gumes. Em teoria, um usuário suficientemente perceptivo sempre pode obter um resultado bastante próximo. Você só terá que ser capaz de descrever o estilo do artista alvo com muita precisão sem nome explicitamente.
O OpenAI também oferece duas soluções que permitem um artista de Recuse que seu trabalho é usado para treinar Dall-e. O primeiro é preencher o formulário neste endereço. Mas se você deseja proteger um número grande, como os que você mantém em seu portfólio on -line, o ideal é proibir o acesso ao rastreador GPTBOT. Para fazer isso, basta seguir as instruções disponíveis neste endereço.
Isso limitará consideravelmente a capacidade de Dall-e 3 de imitar os trabalhos em questão. Pelo menos, se eles ainda não foram passados para o carretel. E infelizmente é impossível determinar na prática, uma vez que os dados de origem não são mantidos após serem integrados ao modelo.
O Dall-E3 será lançado oficialmente em outubro para clientes do ChatGPT Plus e ChatGPT Entreprise Offers.
Dall-e 3: A fusão entre ChatGPT e a geração de imagens que irão agitar o Midjourney
Openai, a empresa -mãe da mãe, não deve mais ser apresentada. Depois de nos oferecer chatgpt, ela agora anuncia a capacidade deste último de gerar imagens precisas, graças à fusão de Dall-e e Chatgpt em Dall-e.
Frandroid, Para quem segue, use uma ferramenta de geração de imagem: Midjourney. Se esse instrumento acabou sendo poderoso e inovador no mundo da geração de imagens, Dall-e Of Openai também estava na pista, com um curso igualmente impressionante. E a nova obra Dall-e 3 Risco Bem, para mudar a situação.
De acordo com as manifestações compartilhadas pelo OpenAI, fica claro que o Dall-e 3 é distinguido de seus antecessores e concorrentes. Onde Midjourney se destaca na restituição fotorrealista, mas ainda requer muitas manipulações, Dall-e 3 promete uma geração de imagem muito mais eficiente e menos errônea. Um feito notável, especialmente considerando o fato de que este é um grande avanço em comparação com o Dall-e.
Além disso, essa nova ferramenta parece ter desenvolvido uma competência específica para gerenciar o texto nas imagens, superando as capacidades de alguns de seus concorrentes, como a Difusão estável XL e Deepfloyd. Em particular, o Openai destaca sua capacidade de produzir imagens convincentes de letras, figuras e até mãos humanas (uma verdadeira dificuldade para essas ferramentas).
Dall-e 3 // Fonte: OpenAi
Dall-e 3 // Fonte: OpenAi
Dall-e 3 // Fonte: OpenAi
Dall-e 3 // Fonte: OpenAi
Dall-e 3 // Fonte: OpenAi
Dall-e 3 // Fonte: OpenAi
Dall-e 3 // Fonte: OpenAi
Dall-e 3 // Fonte: OpenAi
Ao integrar o Dall-e no ChatGPT, o OpenAI fortalece sua posição como líder no mundo generativo da IA. Chatgpt e Dall-e 3, juntos, prometem repelir as fronteiras da AI.
Os chatbots não só poderão conversar de uma maneira quase humana, mas também para imaginar e criar imagens a partir de descrições simples. Mal podemos esperar para testar.
Se você quiser testar o Dall-E 3, ele estará disponível para usuários de ChatGPT Plus e Enterprise. O que é muito mais fácil de usar do que o Midjourney … onde você precisa de um cliente Discord.
Para quem as imagens geradas ?
A questão dos direitos autorais ligados às imagens geradas pela IA é atualmente um tópico quente. Os regulamentos atuais sugerem que as imagens da IA estão entrando no domínio público. No entanto, o Openai declara claramente que a propriedade das imagens produzidas por Dall-e 3 retorna para seus criadores. E esse é outro debate no setor.
Bing Cat também tem direito a Dall-e 3
Nesta quinta -feira, 21 de setembro, a Microsoft realizou uma conferência para anunciar a próxima chegada do Copilot, mas também a nova linha de superfície. Paralelamente, a empresa se comunicou na chegada do modelo Dall-e 3 no Bing Image Creator. Como lembrete, esta é a ferramenta de criação de imagens de bate -papo bing. De acordo com a Microsoft, Bing Image Creator ” Também entende o que você está pedindo, o que permite que você obtenha imagens mais precisas. »»
A Microsoft também diz que vá além ao adicionar ” Uma marca d’água digital invisível para todas as imagens geradas pela IA em Bing, incluindo a hora e a data de sua criação. “Difícil saber quão poderoso será essa marca d’água, nem como podemos verificar sua presença ou não, mas este é um primeiro passo.
Para nos seguir, convidamos você a baixar nosso aplicativo Android e iOS. Você pode ler nossos artigos, arquivos e assistir aos nossos últimos vídeos do YouTube.