En janvier de l’année dernière, la société de biotechnologie allemande BioNTech a acquis la startup africaine d’IA Instadeep pour plus de 550 millions de dollars, un accord finalisé en juillet de la même année. Instadeep, dont la sortie est actuellement la plus importante en Afrique, opère sous l'égide du secteur pharmaceutique allemand depuis un peu plus d'un an. C’est le bon moment pour examiner comment il s’est comporté depuis l’acquisition.
Instadeep utilise des techniques avancées d'apprentissage automatique pour intégrer l'IA dans les applications d'entreprise. Ses produits vont des informations accélérées par GPU aux systèmes de prise de décision à auto-apprentissage. Avant l'acquisition de l'année dernière, la startup d'IA d'entreprise née à Tunis et basée à Paris et à Londres a levé plus de 108 millions de dollars auprès de plusieurs investisseurs mondiaux, dont Google, Deutsche Bahn et BioNTech. Ces trois axes stratégiques figuraient également parmi les plus gros partenaires et clients de la startup.
Notamment, la startup vieille de dix ans a collaboré avec BioNTech pour développer un système d’alerte précoce capable de détecter les variantes à haut risque du COVID-19 des mois à l’avance pendant la pandémie. Instadeep a travaillé avec Google DeepMind pour créer un système de détection précoce des épidémies de criquets pèlerins en Afrique. Elle a également collaboré à un projet Moonshot visant à automatiser la planification ferroviaire pour la Deutsche Bahn, le plus grand opérateur ferroviaire d'Europe.
Bien que ces partenariats montrent diverses applications pour les solutions d'Instadeep, son acquéreur avait un cas d'utilisation clair : utiliser l'IA pour développer des traitements et des vaccins contre divers cancers et maladies infectieuses – une activité sur laquelle il double désormais sous la direction de son nouveau propriétaire.
Quinze mois après la finalisation de l'acquisition de BioNTech, le co-fondateur et PDG Karim Beguir a déclaré à TechCrunch dans une interview qu'Instadeep avait fait des progrès significatifs sur ce front, même si la société d'IA – qui continue de fonctionner de manière indépendante – fournit toujours des solutions à des clients extérieurs. biotechnologie.
“Nous sommes stratégiquement alignés avec BioNTech sur les objectifs à poursuivre en matière de capacités de biologie et de bioIA”, a déclaré le chef d'Instadeep. « Mais nous avons également une marge de manœuvre et continuons d’être une force dans l’IA en Afrique et en général tout en continuant à développer des technologies qui repoussent les frontières de l’innovation dans d’autres secteurs verticaux comme l’optimisation industrielle. »
Augmentation des capacités dans le domaine de la biotechnologie
Beguir note que l'objectif d'Instadeep au cours de l'année écoulée depuis son acquisition a été de déployer l'IA à chaque étape du pipeline de BioNTech pour améliorer les processus existants.
Il partage un exemple en histologie, qui implique l'analyse des tissus et la tâche visuelle de marquage de différents tissus, comme l'identification des cellules tumorales ou des cellules saines. Selon lui, les experts de BioNTech effectuaient traditionnellement ce travail manuellement. Cependant, la technologie d'Instadeep a contribué à accélérer le processus en déployant des systèmes d'IA visuelle et de segmentation, accélérant ainsi de 5 fois ce flux de travail d'étiquetage des tissus.
Un autre exemple est l'achèvement de son projet RiboMab, qui implique des anticorps codés par ARNm qui font désormais partie de la boîte à outils de BioNTech en tant que société d'immunothérapie pour lutter contre le cancer et d'autres maladies. InstaDeep a présenté ce projet sur sa plateforme DeepChain, qui conçoit des protéines et analyse des données biologiques, lors de leur première collaboration en 2020.
La biotechnologie implique une multitude de données sensibles sur les soins de santé. Les collecter et les analyser est une chose. Assurer leur sécurité en est une autre. Il suffit de demander à 23andMe, autrefois présenté comme un perturbateur dans le domaine de la biotechnologie avant d'être victime d'une violation massive qui a exposé les données de près de 7 millions de personnes, soit la moitié de sa clientèle.
Il est intéressant de noter que BioNTech n’est pas étrangère à de tels événements. En 2020, des pirates ont accédé illégalement à des documents liés à son vaccin contre la COVID-19, développé avec Pfizer, en s'attaquant à l'Agence européenne des médicaments (EMA), l'organisme européen de réglementation des médicaments, qui évalue les médicaments et les vaccins. Alors que Pfizer et BioNTech ont confirmé que leurs systèmes et leurs données d'essais restaient sécurisés, l'incident met en évidence à quel point les organisations, même réglementaires, peuvent être vulnérables aux cyberattaques.
Comme le dirait n'importe quel PDG, Beguir me dit qu'Instadeep et BioNTech sont très prudents avec les données de santé, d'autant plus que le partenariat utilise actuellement l'IA pour augmenter les actifs de données, leur permettant d'identifier des séquences protéiques précises et potentiellement de débloquer de nouvelles cibles pour le cancer et d'autres immunothérapies. cas d'utilisation.
Mais il existe une segmentation dans les données utilisées par les deux sociétés. BioNTech gère les données personnelles et réelles des patients, et Instadeep développe généralement des modèles et les forme sur des données accessibles au public. C’est ainsi, par exemple, qu’elle a formé son Nucleotide Transformer, une série de modèles en génomique de l’IA, qui est aujourd’hui le modèle de génomique de l’IA le plus téléchargé et le plus populaire au monde. [Thanks in part to this open-source deal.]
“Instadeep a développé et formé le modèle nucléotidique sur des données publiques”, note Beguir. «Cependant, lorsque nous avons voulu déployer le modèle sur des cas d'utilisation spécifiques et des données réelles de patients, nous l'avons fait au niveau de BioNTech, avec toutes les garanties de confidentialité qui découlent de sa position comme l'un des principaux acteurs biopharmaceutiques opérant dans des conditions strictes. réglementations et en suivant des protocoles de qualité rigoureux.
Développer de nouvelles technologies au sein de BioNTech et en dehors de la biotechnologie
Lorsqu'on lui demande quelles sont les prochaines étapes d'Instadeep au sein de BioNTech, Beguir mentionne la « dernière avancée » de la startup : les réseaux de flux bayésiens (BFN), un nouveau modèle d'IA génératif pour les protéines qui surpasse considérablement les modèles autorégressifs et de diffusion, selon l'entreprise. Le PDG de BioNTech, Ugur Sahin, le décrit dans un communiqué comme une « technologie de pointe ».
Selon Beguir, le modèle produit les protéines protéiques les plus naturelles et les plus performantes du marché en permettant aux systèmes de rechercher des propriétés spécifiques sur la chaîne lourde d'un anticorps, notamment les caractéristiques chimiques, l'hydrophobicité ou la longueur de la séquence. De tels modèles sont cruciaux pour comprendre les fonctions complexes des protéines et concevoir de nouvelles protéines thérapeutiques.
« Nous sommes enthousiasmés par le potentiel des innovations en matière d'IA comme la nôtre pour identifier des cas d'utilisation réels, collaborer étroitement avec BioNTech et créer des produits qui seront testés dans des laboratoires et des cliniques, sauvant ainsi la vie des patients », a déclaré Beguir. « Si vous considérez où nous en sommes aujourd’hui en biologie et en IA, c’est similaire à là où nous en étions avec le traitement du langage naturel en 2020 avec GPT-3. Les systèmes commençaient à fonctionner et leurs capacités étaient impressionnantes, mais il y avait encore place à l’amélioration.
Instadeep a lancé la semaine dernière le nouveau modèle d'IA aux côtés d'un nouveau supercalculateur proche de l'exascale, qui, selon les sociétés, place le partenariat dans le top 100 du calcul et de l'infrastructure et dans le top 20 des clusters GPU H100 au monde.
Les deux développements mettent en évidence les domaines dans lesquels Instadeep, sous BioNTech, déploie l’IA dans plusieurs cas d’utilisation des sciences de la vie. En revanche, elle gère de manière indépendante son autre secteur d’activité, qui concerne l’IA et l’apprentissage par renforcement profond pour l’optimisation industrielle.
Un exemple est son projet en cours depuis 12 ans visant à automatiser la planification et la répartition des chemins de fer pour la Deutsche Bahn, l'un de ses partenaires de longue date et le plus grand opérateur ferroviaire d'Europe. De même, la société d'IA basée à Tunis et à Londres a renforcé ses efforts pour développer d'autres cas d'utilisation d'optimisation industrielle, comme la collaboration avec Fraport en Allemagne pour optimiser les opérations aéroportuaires complexes avec l'IA.
« De manière générale, nous considérons également le potentiel des agents IA comme très intéressant pour l’avenir. Nous pensons que l’optimisation industrielle et les systèmes basés sur des agents, travaillant main dans la main avec des collègues humains, révolutionneront l’efficacité industrielle. C'est donc également un autre domaine dans lequel nous travaillons depuis de nombreuses années et dans lequel nous continuons à investir », a souligné Beguir.
Pendant ce temps, Instadeep a lancé plus tôt ce mois-ci la version professionnelle de son produit DeepPCB (Deep Printed Circuit Board), une conception de matériel ou de carte de circuit imprimé entièrement assistée par une IA autonome alimentée par l'apprentissage par renforcement, à San Francisco. Beguir affirme que les concurrents de l'entreprise sont de petites startups d'IA dans les domaines spécifiques où elle opère, comme Intelmatix, basée à Riyad.
Le chef d'Instadeep est fier du travail de son entreprise pour résoudre des cas d'utilisation plus complexes de l'IA – par exemple, Gen AI pour l'ADN ou la protéomique ou des flux de travail agents pour l'optimisation combinatoire – et s'éloigner des cas simples comme Gen AI pour la PNL. Il affirme qu'outre l'acquisition de BioNTech, cette ingéniosité joue un rôle considérable dans l'intérêt des clients aux États-Unis, où la société d'IA possède désormais deux bureaux, ainsi qu'en Europe : à Berlin, Paris et au Royaume-Uni, en particulier.
Même si BioNTech a dépensé 500 millions de dollars sur Instadeep pour renforcer ses capacités biotechnologiques, cela maintient la société d’IA opérationnellement indépendante pour des raisons comme celle-ci, tout en finançant ses activités pour servir des clients au-delà de l’industrie biotechnologique.
« Parce que nous apportons de la valeur en étant leaders dans le domaine de l'IA, et que les compétences en IA peuvent être améliorées dans plusieurs secteurs », a répondu Beguir lorsqu'on lui a demandé pourquoi BioNTech permet toujours à l'entreprise d'IA de travailler sur des projets non biotechnologiques. « Il s’agit de la même pile technologique, donc le temps passé à travailler sur l’IA en dehors de la biotechnologie n’est pas du tout du temps perdu. BioNTech déploie également InstaDeep sur des tâches en dehors de la R&D biotechnologique, comme l'optimisation des opérations.
Beguir explique que même si InstaDeep n'a pas été obligé de vendre, c'est la vision partagée et les projets réussis avec BioNTech depuis 2019, bien avant l'acquisition, qui ont convaincu la société d'IA d'aller de l'avant avec l'accord. Il pense que la confiance bâtie au fil des années de collaboration est la raison pour laquelle InstaDeep restera indépendant sous BioNTech. La clé pour InstaDeep est désormais de poursuivre sur sa lancée, de maintenir des résultats de haute qualité et de continuer à innover le plus longtemps possible.
Depuis l'acquisition, InstaDeep compte plus de 400 employés dans le monde. Cela inclut son équipe en Afrique, basée dans un nouveau bureau à Kigali, qui dirige les travaux de renseignement géospatial de l'entreprise.
Initialement un effort sur le terrain en partenariat avec Google pour détecter les aires de reproduction acridiennes en Afrique, Instadeep utilise désormais les données d'étiquettes antérieures et l'imagerie satellite pour déduire avec une haute qualité et une précision de 80 à 85 % où se trouveront les aires de pontage acridiennes dans le les 30 prochains jours. Beguir affirme qu'InstaGeo, le cadre de la société qui utilise l'imagerie satellitaire multispectrale de la NASA ou de l'Agence spatiale européenne (ESA), est open source et permet à d'autres sociétés de développer des solutions évolutives à travers le continent.
« Il s’agit d’un exemple concret de l’impact de la technologie et des capacités de l’IA. Plutôt que de collecter des échantillons sur le terrain ou de dépendre d'infrastructures au sol, nous pouvons fournir ces informations via des satellites à grande échelle et notifier plusieurs gouvernements et acteurs pour relever un défi croissant en matière de sécurité alimentaire, en particulier compte tenu des problèmes climatiques du continent.