Dall-E : le gnrateur d’images IA dvelopp par OpenAI est maintenant ouvert tous, en supprimant la liste d’attente, OpenAI donne la possibilit tout le monde pour s’inscrire et l’utiliser

Le groupe de recherche en intelligence artificielle OpenAI a annonc qu’elle a supprim la liste d’attente pour son service de gnrateur d’images AI DALL-E. Cela signifie que tout le monde peut s’inscrire et l’utiliser. partir d’aujourd’hui, nous supprimons la liste d’attente pour la version bta de DALL-E afin que les utilisateurs puissent s’inscrire et commencer l’utiliser immdiatement. Plus de 1,5 million d’utilisateurs crent aujourd’hui activement plus de 2 millions d’images par jour avec DALL-E – des artistes et directeurs de la cration aux auteurs et architectes – et plus de 100 000 utilisateurs partagent leurs crations et leurs commentaires dans notre communaut Discord , a crit OpenAI dans un post publi le 28 septembre.

DALL-E est un modle de synthse d’images par apprentissage profond qui a t entran sur des centaines de millions d’images tires d’Internet. Il utilise une technique appele diffusion latente pour apprendre les associations entre les mots et les images. Ainsi, les utilisateurs de DALL-E peuvent saisir une description textuelle, appele invite, et la voir restitue visuellement sous la forme d’une image de 10241024 pixels dans presque tous les styles artistiques.

Dall E le generateur dimages IA developpe par OpenAI est

Outre la gnration d’images en texte, DALL-E comprend galement une fonction appele “Outpainting” qui permet de tlcharger une image et d’en tendre les bords grce la synthse d’image. Il est galement possible de fusionner plusieurs photos en une seule en gnrant un pont visuel entre elles, en mlangeant les styles.

En avril de cette anne, OpenAI a cr une nouvelle version de DALL-E, son programme de gnration de texte en image. DALL-E 2 est une version plus haute rsolution et plus faible latence du systme original, qui produit des images reprsentant les descriptions crites par les utilisateurs.

Nomm d’aprs l’artiste surraliste Salvador Dali et le personnage robot de Pixar, Wall-E, le prdcesseur du modle, DALL-E, a t lanc l’anne dernire. Ce logiciel est capable de crer des images dans diffrents styles artistiques lorsqu’il est guid par des entres de texte : il gnre des images partir de ce que vous lui dcrivez. Vous demandez un cur anatomiquement raliste, ou un dessin anim d’un bb radis chinois en tutu promenant un chien, et il fera de son mieux pour crer une image qui y correspond.

La nouvelle version, DALL-E 2, est cense tre plus polyvalente et capable de gnrer des images partir de lgendes des rsolutions plus leves. Elle est galement dote de nouvelles capacits. Il s’agissait d’un test limit mais fascinant de la capacit de l’IA reprsenter visuellement des concepts, qu’il s’agisse de la reprsentation banale d’un mannequin en chemise de flanelle, d’une girafe en tortue ou de l’illustration d’un radis promenant un chien.

Dall-E 2 permet dsormais d’diter des visages humains. Cette fonctionnalit tait auparavant interdite en raison de craintes d’utilisation abusive, mais, dans une lettre envoye aux millions d’utilisateurs de DALL-E, OpenAI dit qu’il ouvre l’accs aprs avoir amlior ses filtres pour supprimer les images qui contiennent des contenus sexuels, politiques et violents .

La fonctionnalit permettra aux utilisateurs de modifier des images de diffrentes manires. Ils peuvent tlcharger une photo de quelqu’un et gnrer des variations de l’image, par exemple, ou ils peuvent modifier des fonctionnalits spcifiques, comme changer les vtements ou la coiffure de quelqu’un. La fonctionnalit sera sans aucun doute utile de nombreux utilisateurs des industries cratives, des photographes aux cinastes.

Beaucoup d’entre vous nous ont dit que cela vous manquait d’utiliser DALL-E pour imaginer des tenues et des coiffures sur vous-mmes et diter les arrire-plans des photos de famille. Un chirurgien reconstructeur nous a dit qu’il utilisait DALL-E pour aider ses patients visualiser les rsultats. Et les cinastes nous ont dit qu’ils voulaient pouvoir diter des images de scnes avec des gens pour aider acclrer leurs processus cratifs Nous avons construit de nouvelles techniques de dtection et de rponse pour arrter les abus(…). Grce aux amliorations de notre systme de scurit, DALLE est dsormais prt prendre en charge ces cas d’utilisation dlicieux et importants, tout en minimisant le potentiel de dommages causs par les deepfakes , a dclar OpenAI dans sa lettre aux clients annonant la nouvelle.

Leurs commentaires ont inspir des fonctionnalits telles que Outpainting, qui permet aux utilisateurs de poursuivre une image au-del de ses limites d’origine et de crer des images plus grandes de n’importe quelle taille, et les collections, afin que les utilisateurs puissent crer de toutes nouvelles faons et acclrer leurs processus cratifs.

Les enseignements tirs de l’utilisation en conditions relles ont permis OpenAI d’amliorer les systmes de scurit, ce qui rend possible une plus grande disponibilit aujourd’hui. Au cours des derniers mois, OpenAI a rendu les filtres plus robustes pour rejeter les tentatives de gnration de contenus sexuels, violents et autres qui violent la politique de contenu, et a mis au point de nouvelles techniques de dtection et de rponse pour mettre fin aux abus.

Le mois dernier, nous avons prsent Stable Diffusion de Stability AI. Les poids modles sont hbergs par Hugging Face une fois l’accs obtenu. Stability.ai voulaient construire une alternative DALL-E 2, et ils aurat fini par faire beaucoup plus. Pour certains analystes, la diffusion stable incarne les meilleures caractristiques du monde de l’art de l’IA : il s’agit sans doute du meilleur modle d’art de l’IA open source existant. C’est tout simplement du jamais vu et cela aura des consquences normes , dclare lun dentre eux.

Stable Diffusion est un modle de diffusion latente texte-image. Grce un gnreux don de calcul de Stability AI et au soutien de LAION, les chercheurs ont pu entraner un modle de diffusion latente sur des images 512×512 provenant d’un sous-ensemble de la base de donnes LAION-5B. Similaire Imagen de Google, ce modle utilise un encodeur de texte CLIP ViT-L/14 gel pour conditionner le modle des invites textuelles. Avec son UNet de 860M et son encodeur de texte de 123M, le modle est relativement lger et fonctionne sur un GPU avec au moins 10 Go de VRAM.

Contrairement DALL-E mini et Disco Diffusion, qui sont des logiciels ouverts, Stable Diffusion peut crer d’incroyables uvres d’art photoralistes et artistiques qui n’ont rien envier aux modles d’OpenAI ou de Google. Certains affirment mme qu’il s’agit du nouvel tat de l’art parmi les moteurs de recherche gnratifs .

Stability.ai serait n pour crer non pas seulement des modles de recherche qui n’arrivent jamais dans les mains de la majorit, mais des outils avec des applications du monde rel ouvertes pour les utilisateurs. C’est un changement par rapport d’autres entreprises technologiques comme OpenAI, qui garde jalousement les secrets de ses meilleurs systmes (GPT-3 et DALL-E 2), ou Google qui n’a jamais eu l’intention de publier ses propres systmes (PaLM, LaMDA, Imagen ou Parti) en tant que btas privs.

Le succs absolument viral de Craiyon, malgr sa qualit infrieure, a mis en vidence les lacunes de DALL-E en tant que bta ferme. Les gens ne veulent pas voir comment les autres crent des uvres d’art impressionnantes. Ils veulent le faire eux-mmes. Stability.ai est all encore plus loin, car cette version publique n’est pas seulement destine partager les poids et le code du modle – qui, bien qu’ils soient essentiels au progrs de la science et de la technologie, n’intressent pas la plupart des gens. La socit a galement facilit la cration d’un site Web prt l’emploi, sans code, pour ceux d’entre nous qui ne veulent pas ou ne savent pas coder.

Source : DALL-E

Et vous ?

GPT 3 peut executer du code rechercher une valeur dans une Que pensez-vous des gnrateurs d’images en gnral et de DALL-E en particulier ?

GPT 3 peut executer du code rechercher une valeur dans une Que pensez-vous du fait le gnrateur d’images IA dvelopp par OpenAI soit maintenant ouvert tous ?

GPT 3 peut executer du code rechercher une valeur dans une Voyez-vous des abus potentiels ?

GPT 3 peut executer du code rechercher une valeur dans une Que pensez-vous de la concurrence ? Stable Diffusion de Stability AI par exemple.

Voir aussi :

GPT 3 peut executer du code rechercher une valeur dans une Stable Diffusion de Stability AI serait le modle d’IA le plus important de tous les temps, contrairement GPT-3 et DALL-E 2, il apporte des applications du monde rel ouvertes pour les utilisateur

GPT 3 peut executer du code rechercher une valeur dans une Dall-E 2 : le gnrateur d’images IA dvelopp par OpenAI est disponible en bta. Il peut produire une large gamme d’images partir de quelques mots

GPT 3 peut executer du code rechercher une valeur dans une Un ingnieur porte plainte contre l’office US des brevets pour avoir refus d’accorder des brevets son IA, sous le prtexte que seules les personnes physiques en ont le droit

We wish to say thanks to the author of this post for this awesome content

Dall-E : le gnrateur d’images IA dvelopp par OpenAI est maintenant ouvert tous, en supprimant la liste d’attente, OpenAI donne la possibilit tout le monde pour s’inscrire et l’utiliser

Check out our social media accounts and also other related pageshttps://www.ai-magazine.com/related-pages/