La synthèse n’a pas toujours été considérée comme l’extrémité pointue de l’industrie de l’IA générative. Pendant six ans, Riparbelli et ses cofondateurs ont travaillé hors des projecteurs dans la poursuite de leur mission d’inventer un moyen de faire de la vidéo sans utiliser d’équipement de caméra. En 2017, il n’y avait pas beaucoup d’investisseurs qui pensaient que c’était très intéressant, dit Riparbelli, qui a maintenant 31 ans. Mais ensuite ChatGPT est arrivé. Et le PDG danois a été catapulté dans l’élite naissante de l’IA à Londres aux côtés des fondateurs d’entreprises comme DeepMind, détenue par Alphabet depuis 2014, qui travaille actuellement sur un concurrent de ChatGPT, et Stability AI, la startup derrière le générateur d’photographs Steady Diffusion.
En juin, Synthesia a annoncé un cycle de financement qui l’a évalué à 1 milliard de {dollars}. Ce n’est pas tout à fait le prix de 29 milliards de {dollars} qu’OpenAI a reçu en mai, mais c’est quand même une énorme augmentation de 700 hundreds of thousands de {dollars} par rapport à il y a deux ans, la dernière fois que les investisseurs se sont investis dans les affaires de Synthesia.
Je rencontre Riparbelli sur Zoom. Il rejoint l’appel depuis la maison de vacances de sa famille sur une île danoise, son lit superposé d’enfance dans le cadre derrière lui. Ayant grandi à Copenhague, Riparbelli s’est intéressé aux ordinateurs à travers les jeux et la musique électronique. Avec le recul, il pense que pouvoir faire de la techno avec seulement son ordinateur transportable, depuis le Danemark – pas un endroit connu pour ses golf equipment ou son industrie musicale – a été une grande affect pour ce qu’il fait maintenant. “Il s’agissait bien plus de savoir qui peut faire de la bonne musique et la télécharger sur SoundCloud ou YouTube que de savoir qui vit à Hollywood et a un père qui travaille dans l’industrie de la musique”, dit-il. Pour arriver au même level, il pense que la vidéo a encore beaucoup de chemin à parcourir automotive elle nécessite encore beaucoup d’équipement. “C’est intrinsèquement restrictif automotive c’est très coûteux à faire.”
Après avoir obtenu son diplôme, Riparbelli s’est lancé dans la scène des startups danoises, créant ce qu’il décrit comme des applied sciences “vanille”, comme un logiciel de comptabilité. Insatisfait, il s’installe à Londres à la recherche de quelque selected de plus science-fiction. Après s’être essayé à des projets de crypto et de réalité virtuelle, il a commencé à lire sur les deepfakes et s’est retrouvé saisi par le potentiel. En 2017, il a rejoint son compatriote danois, Steffen Tjerrild, et deux professeurs de imaginative and prescient par ordinateur, Lourdes Agapito et Matthias Niessner, et ensemble ils ont lancé Synthesia.
Au cours des six dernières années, la société a construit une bibliothèque vertigineuse d’avatars. Ils sont disponibles dans différents genres, tons de peau et uniformes. Il y a des hipsters et des travailleurs des centres d’appels. Le Père Noël est disponible dans plusieurs ethnies. Au sein de la plateforme de Synthesia, les shoppers peuvent personnaliser la langue parlée par leurs avatars, leurs accents, et même à quel second d’un script ils lèvent les sourcils. Riparbelli dit que son préféré est Alex, un avatar classiquement joli mais banal qui semble être dans la vingtaine et a les cheveux bruns mi-longs. Il existe une vraie model humaine d’Alex qui erre quelque half dans les rues. Synthesia forme ses algorithmes sur des séquences d’acteurs filmées dans ses propres studios de manufacturing.
Posséder ces données est un grand attrait pour les investisseurs. « Fondamentalement, ce dont tous leurs algorithmes ont besoin, ce sont des données 3D, automotive il s’agit de comprendre remark les humains se déplacent, remark ils parlent », explique Philippe Botteri, associé de la société de capital-risque Accel, qui a dirigé le dernier cycle de financement de Synthesia. “Et pour cela, vous avez besoin d’un ensemble très spécifique de données qui ne sont pas disponibles.”