De portraits qui s'animent soudainement? Jusqu' à présent, on ne voyait cela que dans les films d'Harry Potter, mais à l'avenir, cela pourrait devenir une réalité quotidienne. Des chercheurs du Samsung AI-center établi à Moscou en donnent un premier aperçu dans un rapport préimprimé qui paraîtra lundi sur la plate-forme électronique ArXiv. L'article n'a pas encore été publié dans une revue scientifique (et n'a donc pas été jugé par des collègues), mais les résultats semblent en tout cas impressionnants. Dans une vidéo, les chercheurs de Samsung révèlent la façon, dont ils ont réussi à faire parler les portraits de Salvador Dali, Albert Einstein, Fyodor Dostoyevsky, Marilyn Monroe, voire Mona Lisa.

Les scientifiques russes ont utilisé une technique populaire, connue sous l'appellation Generative Adversarial Networks, qui combine trois réseaux d'apprentissage profond. Ils ont d'abord appris à leur algorithme d'identifier des traits faciaux expressifs, comme la position des yeux, des sourcils, du nez, de la bouche et des mâchoires. Dans ce but, ils ont fait appel à 7.000 visages animés tirés d'une banque de données publique. Sur base de ces exemples, un premier réseau neural a été entraîné à convertir les principaux points du visage en vecteurs, qui ont ensuite été envoyés au 'réseau générateur'. Ce deuxième réseau tente alors, au départ de ces vecteurs et d'une photo, de générer un visage entièrement animé. Enfin, le 'réseau discriminateur' évalue les vidéos produites et sélectionne la plus réaliste.

via GIPHY

Précédemment déjà, il était possible de créer de fausses vidéos au moyen de l'intelligence artificielle. Après que quelqu'un ait lancé un petit outil gratuit permettant de troquer ('swapping') des visages dans des films, les premières vidéos factices profondes se sont mises à circuler sur le web l'année dernière. Il ne fallut pas longtemps, avant que des sites web pornographiques soient interdits pour avoir remplacé les visages d'actrices porno par ceux de célébrités. Pour réaliser ce genre de vidéos factices profondes ('deepfake videos), il faut disposer cependant de beaucoup de contenu vidéo de 'la victime', tandis qu'avec cette nouvelle technique de Samsung, une simple photo suffit déjà.

Les vidéos réalisées sur base d'une photo unique ne semblent pas encore parfaites. Si l'on passe à huit photos, l'on obtient des mouvements et des expressions du visage plus réalistes. Et si l'on utilise 32 photos, il n'est plus possible de faire la différence avec une vidéo bien réelle.

via GIPHY

La technique pourrait être utilisée pour créer des avatars animés, par exemple pour des applications dans l'industrie des jeux. Vous pourriez même faire renaître une ancienne photo de votre arrière grand-père...

Une technologie capable de réaliser une vidéo factice sur base d'une photo de profil sur Facebook, ouvre aussi la porte à l'abus. Récemment, un débat a été organisé au sein de la communauté AI à propos de la question de savoir si de tels résultats de recherche doivent bien être révélés.

via GIPHY

Pieter Van Nuffel, journaliste DataNews.be