ClickHouse, la startup open source de bases de données d'analyse en temps réel issue de Yandex en 2021, a annoncé mardi avoir acquis PeerDB, une société qui se concentre sur la réplication Postgres rentable et la capture de données modifiées.
Depuis son lancement, et même avant, à l'époque où il était un projet open source soutenu par Yandex, ClickHouse s'est fait un nom en tant qu'entrepôt de données en temps réel pour les grandes entreprises. Parmi ses clients figurent Deutsche Bank, eBay, Fastly, GitLab, HubSpot, Microsoft, ServiceNow et Spotify. Et si ClickHouse proposait déjà un connecteur Postgres pour aider les entreprises à déplacer leurs données de la base de données relationnelle populaire vers sa base de données d'analyse, PeerDB offre des améliorations de vitesse allant jusqu'à 10 fois ainsi qu'un certain nombre de fonctionnalités spécialisées que ClickHouse n'offrait pas auparavant.
« Nous avons commencé notre parcours en créant un outil ETL de transfert de données en nous concentrant sur Postgres. Nous avons commencé par fournir le meilleur moyen au monde de répliquer des données de Postgres vers des entrepôts de données. […] « Nous avons lancé notre connecteur ClickHouse il y a environ six mois et depuis, il n'a cessé de croître. Il est désormais le connecteur qui connaît la croissance la plus rapide, surpassant les autres entrepôts de données comme Snowflake et BigQuery », m'a expliqué Sai Srirampur, cofondateur et PDG de PeerDB. Avant de lancer PeerDB, Srirampur a travaillé sur le service PostgreSQL d'Azure après l'acquisition par Microsoft de Citus Data, où il travaillait auparavant.
Srirampur m’a confié qu’il avait toujours voulu que PeerDB se concentre sur la « qualité de la quantité », ce qui a conduit l’équipe à se concentrer sur la création d’un outil ETL spécialisé pour Postgres. Cela comprend le chargement initial de ce qui peut représenter des téraoctets de données d’une base de données Postgres vers un entrepôt comme ClickHouse, mais peut-être plus important encore, également le système de capture des données modifiées, qui garantit que la base de données d’origine et l’entrepôt de données restent synchronisés.
Il s'avère que pour la majorité des clients de PeerDB, Postgres était la principale source de données de leur entrepôt de données. Ce n'est peut-être pas une surprise, étant donné que ces clients sont plus susceptibles de choisir un service comme PeerDB, mais ClickHouse a clairement vu un marché croissant pour un outil comme celui-ci également.
« Ce que nous voyons très, très souvent, c'est [customers] « Utiliser Postgres comme back-end transactionnel pour les applications orientées client, puis déplacer ces données vers ClickHouse pour les cas d'utilisation analytiques : c'est un modèle très, très courant, et un certain nombre de clients l'utilisent », m'a expliqué Yury Izrailevsky, cofondateur de ClickHouse. « Bien sûr, Postgres est une technologie très complexe. Elle est très puissante, mais elle nécessite vraiment des connaissances approfondies, en particulier pour les cas d'utilisation de la capture des données modifiées. »
Au fil du temps, l'équipe PeerDB travaillera également à la mise en place de la capture des données modifiées pour d'autres sources de données. Les clients commerciaux existants pourront utiliser le service PeerDB Cloud jusqu'au 24 juillet 2025.
Les composants open source existants de PeerDB resteront open source, sans aucun changement de leurs licences. ClickHouse rendra également open source les cartes Helm de niveau production pour l'offre entreprise de PeerDB.
Les deux sociétés n'ont pas divulgué le prix de l'acquisition, mais il convient de noter que PeerDB a clôturé un tour de financement d'amorçage de 3,6 millions de dollars fin 2023, avec 8VC en tête du tour.
« Je pense que nous nous sommes mis d’accord sur un prix équitable qui récompense et reconnaît comme il se doit le travail effectué par l’équipe PeerDB et qui est équitable pour l’équipe et pour ses investisseurs », a déclaré Izrailevsky. « En même temps, je pense que c’est toujours une excellente opportunité pour nous, compte tenu du potentiel. »