Os geradores de arte de IA receberam muita atenção este ano, seja por suas realizações espetaculares ou aplicações questionáveis. Um dos maiores players desse setor é o Dall-E da OpenAI. Agora está disponível para o público em geral e para desenvolvedores e em breve será integrado ao software da Microsoft e ao mecanismo de busca Bing.
A Shutterstock também integrará a ferramenta e pagará cópias aos artistas para retribuir e, com sorte, evitar dificuldades éticas. Afinal, as imagens da Shutterstock foram utilizadas para treinar o Dall-E AI. Mas com que precisão você colabora com Dall-E? É tão simples quanto inserir uma descrição chamada prompt e receber uma imagem? Para ser honesto, acreditamos que sim. Mas há muito mais a considerar se você quiser chegar perto de alcançar a perfeição. Vamos discuti-lo através deste guia abrangente sobre como usar DALL-E.
Índice
O DALL-E é um gerador de imagens que utiliza técnicas de aprendizado profundo e inteligência artificial (IA) para converter descrições textuais em imagens visuais correspondentes. Desenvolvido pela OpenAI, o DALL-E demonstra o poder dos modelos generativos na transformação de conceitos e ideias abstratos em representações visuais tangíveis. O processo de geração de imagens do DALL-E envolve uma rede complexa de redes neurais e algoritmos que aprendem a associar palavras e frases específicas com recursos visuais correspondentes. Por meio do treinamento, o DALL-E adquiriu a capacidade de gerar várias imagens, incluindo objetos do cotidiano, animais, cenas e até mesmo conceitos abstratos que podem não estar presentes diretamente nos dados do treinamento.
Como gerador de imagens, o DALL-E fornece aos usuários uma ferramenta poderosa para explorar e expressar sua criatividade. Ao traduzir descrições textuais em resultados visuais vívidos, abre novas possibilidades para artistas, designers e criadores visualizarem suas ideias, experimentarem diferentes conceitos e gerarem composições visualmente impressionantes.
Nesta parte, forneceremos orientações passo a passo sobre como usar o incrível DALL-E AI Art Generator. No entanto, antes de se aprofundar, é importante usar o Download DALL-E no seu computador. Outra opção é acessar o DALL-E Online em seu navegador da web. Depois disso, podemos prosseguir com as etapas a seguir.
Criar uma conta DALL-E
O primeiro passo é se cadastrar no labs.openai.com. Isso será possível se abrirmos em uma nova janela. Criar uma Login DALL-E com um Endereço de email e um Senha forte, ou use um Google ou Conta Microsoft. Não há opção para autenticação multifator.
Solicitando imagens
Depois de se inscrever, você será presenteado com um formulário para o seu Incitar. Quando você clicar no Surpreenda-me botão, prompts aleatórios adicionais serão colocados na caixa de texto; estes não contarão contra seus créditos até que você clique Gerar. Você também pode fazer upload de sua imagem e utilizar o Dall-E para editá-la e adicionar novas informações geradas por IA ou para criar novas variantes totalmente novas do original.
Variante de imagem
Para qualquer imagem que você criar no Dall-E ou qualquer imagem que você enviar para o Dall-E, é certo que você possui os direitos autorais. A partir daí, você pode ter uma variante instantânea. As fotos enviadas devem ser cortadas em uma imagem quadrada de proporção 1:1.
Editar: Apagar imagem DALL-E
Suponha que você tenha feito uma imagem com Dall-E que você goste. Majoritariamente. Mas algo não está certo. Selecione Editar e usar o Apagador ferramenta para eliminar a parte que você não gosta e, em seguida, reescrever parte do prompt para abordar essa seção.
Editar: Ampliar imagem DALL-E
Outra opção em Editar é construir quadros de geração. Clique no Adicionar quadro de geração no canto superior esquerdo, que se parece com uma caixa com um sinal de mais, e você terá uma caixa flutuante que pode ser posicionada em qualquer lugar além do limite da imagem.
Como você escreve um prompt eficaz para DALLE quando obtém o que coloca nele? Resumindo, suponha que sua fotografia já exista em algum tipo de galeria da Internet e, em seguida, escreva o tipo de texto curto que você pode ver ao lado dela.
Torne-o específico
Se você inserir uma única palavra, como corredor, você pode obter de tudo, desde uma foto de um atleta de elite terminando uma maratona até um lindo desenho a lápis de uma criança correndo por um prado ou, como visto no exemplo acima, até mesmo uma criatura inventada! Em vez de apenas uma palavra, use uma frase para expressar seu desejo.
Detalhes da diretiva
Em vez de apenas mencionar pintura a óleo, você poderia dizer óleo sobre tela, Obra-prima de Caravaggio de 1599, ou fotografia HD, câmera Canon, iluminação de estúdio, retrato de grande formato em filme Kodak ColorPlus 200. A incorporação dessas diferentes características à sua imagem faz com que a tecnologia de IA determine o tipo de imagem que você deseja, mesmo que nem sempre seja exatamente o correto.
Evite erros
Como a geração de IA tem limitações inerentes, é menos provável que alguns prompts de imagem tenham o impacto desejado.
DALL-E e seu sucessor, DALL-E 2, são modelos generativos inovadores desenvolvidos pela OpenAI que revolucionaram o campo da inteligência artificial e da criatividade. Esses modelos utilizam técnicas de aprendizado profundo para gerar imagens a partir de descrições textuais, permitindo que a IA exiba grandes capacidades artísticas. Esta revisão abrangente se aprofundará nos avanços e melhorias oferecidos pelo DALL-E 2 em comparação com seu antecessor.
Um dos aprimoramentos notáveis no DALL-E 2 é sua qualidade e resolução de imagem aprimoradas. Embora o DALL-E já pudesse gerar visuais impressionantes, o DALL-E 2 vai além, produzindo imagens mais detalhadas e realistas. A resolução mais alta permite texturas mais finas, bordas mais nítidas e fidelidade visual geral. As imagens de saída do DALL-E 2 apresentam um apelo visual perceptível e melhoria na clareza.
O DALL-E 2 apresenta vários recursos importantes que oferecem aos usuários maior controle e flexibilidade sobre as imagens geradas. O modelo permite que os usuários influenciem o processo de geração de imagens por meio de prompts interativos, onde edições específicas podem ser feitas para orientar a saída nas direções desejadas. Esse nível de controle permite que os usuários ajustem e iterem em sua visão criativa, resultando em resultados mais personalizados e adaptados.
O DALL-E 2 melhora significativamente sua compreensão de descrições textuais complexas, oferecendo um vocabulário mais amplo e uma compreensão mais profunda dos conceitos. Essa base de conhecimento expandida permite que o modelo interprete melhor as instruções diferenciadas, resultando em uma geração de imagem mais precisa e contextualmente apropriada. Os usuários agora podem descrever cenas complexas, conceitos abstratos e detalhes visuais intrincados, e o DALL-E 2 produzirá imagens que se alinham com o significado pretendido de forma mais eficaz.
DAL-E | DAL-E 2 | |
Preço | $2 | $15. |
Data de lançamento | 05 de janeiro de 2021 | 22 de setembro de 2022 |
Resoluções | 2024 x 1024 pixels, 512 x 512 pixels e 256 x 256 | 2024 x 1024 pixels, 512 x 512 pixels e 256 x 256 |
Padrão | Proteção contra Bugs | Padrão menos defeituoso. |
Qualidade | ||
Credibilidade | ||
Criatividade |
Qualidade:9.0
Flexibilidade:9.0
Vocabulário:8.5
Qualidade:9.5
Flexibilidade:9.0
Vocabulário:8.5
Dall-E não é totalmente gratuito. O serviço é baseado em Créditos (abre em nova janela). Você recebe 50 créditos gratuitos na inscrição e 15 créditos gratuitos todos os meses depois disso, mas eles não acumulam. Os créditos pagos são acumulados mensalmente por até 12 meses; obtenha 115 créditos para $2 para $15. Um crédito permite que você execute uma geração de arte AI (quatro novas imagens por geração normal). Isso pode começar com um prompt, mas também pode ser um crédito por fazer uma versão do trabalho já gerado. Você pode desperdiçar muitos créditos tentando encontrar a imagem correta gerada por IA.
Como podemos inserir uma descrição textual para gerar imagens com DALL-E?
Você deve fornecer um prompt ou descrição textual para usar o gerador de imagens do DALL-E. Basta digitar a descrição desejada ou especificar o conceito, os atributos ou a cena que deseja que a imagem gerada represente. O DALL-E interpretará sua entrada e gerará uma imagem com base nessa descrição.
Podemos controlar a saída do DALL-E para corresponder às nossas preferências?
Sim, o DALL-E oferece um certo nível de controle sobre as imagens geradas. Você pode experimentar diferentes prompts, modificar detalhes ou atributos específicos dentro do prompt ou fornecer instruções adicionais para orientar o processo de geração da imagem. Isso permite ajustar a saída e alinhá-la mais de perto com sua visão criativa
O uso do DALL-E 2 é gratuito?
O DALL-E 2 finalmente terminou sua lista de espera e abriu a plataforma ao público em setembro de 2022. Os usuários começam com 50 créditos gratuitos para converter pesquisas em obras de arte totalmente desenvolvidas, seguidos de 15 créditos gratuitos a cada mês. Você também pode comprar mais créditos no site.
Quais são as limitações ou restrições ao usar o DALL-E?
Embora o DALL-E seja uma ferramenta impressionante, ele tem algumas limitações. O DALL-E nem sempre produz a imagem exata que você tem em mente, pois a interpretação do modelo pode ser subjetiva. Em seguida, a saída do DALL-E é influenciada pelos dados de treinamento aos quais foi exposto, o que significa que pode não gerar conceitos completamente novos ou originais. Além disso, gerar imagens com atributos altamente específicos ou raros pode ser um desafio, pois os dados de treinamento do modelo podem não abranger todas as variações possíveis.
Existem considerações éticas ao usar o gerador de imagens do DALL-E?
Como acontece com qualquer ferramenta de IA, há considerações éticas ao usar o gerador de imagens do DALL-E. Garantir que as imagens geradas estejam alinhadas com as normas sociais e diretrizes éticas é importante. A OpenAI implementou mecanismos de filtragem de conteúdo para mitigar riscos e evitar uso indevido. Os usuários devem usar o DALL-E com responsabilidade para evitar a geração de conteúdo prejudicial ou inapropriado e aderir aos termos de serviço e diretrizes de uso da OpenAI.
Conclusão
Com DALL-E, os usuários podem fornecer prompts de texto e descrições para gerar imagens de alta qualidade que se alinham com sua visão criativa. Ao experimentar diferentes prompts, alavancar controles interativos e refinar instruções, os usuários podem exercer maior controle sobre a saída e adaptá-la às suas preferências. Evidentemente, com este guia, ficamos sabendo mais sobre isso. Portanto, vamos agora compartilhar com seus amigos que precisam.
Você achou isso útil?
366 Votos
SIMObrigado por nos informar!NãoObrigado por nos informar!Conversor, editor e aprimorador de vídeo tudo-em-um aprimorado com IA.