DALL-E est un système d’Intelligence Artificielle capable de créer des images et des œuvres d’art réalistes à partir d’une description de texte. Nommé après Salvador Dali et le personnage du film éponyme Wall-E, DALL-E est dévoilé par OpenAI en janvier 2021.

 

OpenAI

À son origine, OpenAI était une association à but non lucratif fondé par ses deux présidents, Elon Musk et Sam Altman. Aujourd’hui, c’est une entreprise à « but lucratif plafonné » basé à San Francisco. Son objectif ? Faire en sorte que l’intelligence artificielle générale profite à l’ensemble de l’humanité.

Un des premiers projets d’OpenAI a été GPT-2, il s’agit d’une intelligence artificielle capable d’écrire des articles de presse et des œuvres de fiction. Ensuite, OpenAI développe GPT-3. Celui-ci est d’ailleurs beaucoup plus performant que ça version précédente. Lors de son annonce, GPT-3 est d’ailleurs, le plus grand modèle linguistique jamais mis en œuvre, avec plus de 175 milliards de paramètres. Il alors capable d’analyser et synthétiser des textes sous forme de tableaux, traduire des textes en langue étrangère, traduire des textes en d’autres courants de langage et d’avoir « des discussions rapides, complexes et cohérentes en langue naturelle dans le but de générer des idées, recommander des livres et des films, raconter des histoires interactives ». GPT-3 a tout de même ses limites, il n’est pas capable de raisonner et du fait de ça taille, il ne peut pas être exécuté sur un ordinateur personnel.

Suite au développement de GPT-3, OpenAI développe DALL-E . Ce projet dérivé de GPT-3 est capable de développer des images originales à partir d’un texte.

 

Pourquoi est-ce important ?

Le développement de système tel que DALL-E démontre notre capacité de créer des systèmes d’apprentissage automatique présentant des signes d’intelligence générales, tout en exécutant des tâches qui sont réellement utiles dans le monde réel. En effet, DALL-E est un réseau neuronal capable de non seulement créer une image à partir de texte mais aussi, générer des concepts originaux qu’ils n’auraient jamais vus à l’entrainement.

 

À quel point DALL-E est-il “intelligent” ?

DALL-E est capable, entre autres, de contrôler les différents attributs d’un objet, tels que ça forme ou ça texture, mais aussi, leurs relations spatiales. En effet, prenons par exemple la phrase « une tortue bleue avec un t-shirt rouge sur une table marron », DALL-E est capable de non seulement interpréter correctement cette phrase mais aussi d’associer correctement chaque objet (tortue, bleu), (t-shirt, rouge) et (table, marron) sans les confondre. De plus, DALL-E est capable de créer des images en jouant sur la perspective et la tridimensionnalité, inférer des détails contextuels, combiner des concepts n’ayant aucun lien ou illustrer des animaux. En plus de cela, DALL-E à des connaissances géographiques et temporelle, il est donc capable de créer une image dans son contexte géographique et temporel, « une photo d’un téléphone des années 1920 ».

 

Mais les répercussions d’une telle innovation sont-elles toujours positives ? En effet, la création de DALL-E génère beaucoup de questions sur les répercussions éthiques et commerciales qu’une telle innovation pourrait avoir. quelles seront les répercussions sur les métiers artistiques? Quand est-il de la question du droit d’auteur en France?

 

A propos de Ines Ayivi