« Databricks’ achat tabulaire de 1 milliard de dollars soulève des questions sur les guerres de format de table »

En septembre de l’année dernière, il s’agissait d’une entreprise avec environ 25 employés, tous travaillant à distance. La nuit dernière, Tabular a été rachetée par la plateforme d’analyse et d’apprentissage automatique Databricks pour un montant signalé de 1 milliard de dollars. La raison pour laquelle Databricks – lui-même toujours financé par des capitaux-risqueurs – était prêt à dépenser autant d’argent pour ce jeune vendeur, c’est que ses fondateurs étaient derrière le format de table de données populaire Apache Iceberg. Ils ont développé des logiciels pour l’accompagner, y compris un entrepôt de données sans tête pour créer une couche neutre entre les données Iceberg – qui pourraient résider sur toute une gamme de systèmes – et les moteurs d’analyse. En janvier de l’année dernière, The Register avait prédit qu’Iceberg allait changer l’économie de l’analyse de données basée sur le cloud et Databricks a offert un vote de confiance d’1 milliard de dollars dans cette thèse. Databricks – qui vaut nominalement 43 milliards de dollars après 4 milliards de dollars de financement par des capitaux-risqueurs – a son propre format de table ouverte dans Delta Lake, qui est open source et est géré par la Fondation Linux. Cependant, des critiques ont fait valoir qu’un seul vendeur – Databricks – est toujours susceptible d’avoir plus d’influence sur le format. Iceberg, quant à lui, est né d’un projet de Netflix et est perçu comme étant plus neutre vis-à-vis des vendeurs. Dans une déclaration préparée, Ali Ghodsi, PDG et cofondateur de Databricks, a déclaré que le paradigme du ‘lakehouse’ – qui associe des lacs de données désordonnés à des entrepôts de données plus réglementés – a été divisé entre les deux formats les plus populaires : Delta Lake et Iceberg.

Share the Post: