Trino fête ses 10 ans : Starburst fête les dix ans de son moteur de requête open source %

Pour renforcer encore notre engagement à fournir une couverture de pointe de la technologie des données, VentureBeat est ravi d’accueillir Andrew Brust et Tony Baer en tant que contributeurs réguliers. Surveillez leurs articles dans le pipeline de données.

Starburst, fournisseur d’offres de plate-forme d’entreprise pour l’optimisation du moteur de requête SQL distribué Trino, a récemment marqué un anniversaire marquant de la famille de codes open source d’origine dont découle le développement du moteur. Trino est un moteur de requête SQL distribué open source hautement parallèle conçu pour effectuer des analyses interactives sur de gros volumes de données. VentureBeat s’est entretenu avec le co-créateur Dain Sundstrom de la croissance du projet et de son avenir.

Lignée de projet Open Source

Il y a dix ans, la famille originale de codes open source Presto/Trino a été lancée par Sundstrom et les co-créateurs Martin Traverso, David Phillips et Eric Hwang, chez Facebook, pour résoudre le problème de l’analyse et de l’interrogation rapide sur les grands ensembles de données de Facebook. En 2018, les créateurs se sont séparés de Facebook et la famille de codes d’origine a été divisée en deux lignées, celle restant sous Facebook s’appelant PrestoDB, et celle sur laquelle se concentrent les créateurs différenciés par le nom PrestoSQL. En décembre 2020, la lignée PrestoSQL du code a été renommée Trino, sous le nom duquel cette lignée du code continue d’être développée aujourd’hui.

Améliorations continues

Le moteur a été créé à l’origine pour effectuer des requêtes à grande vitesse sur des ensembles de données massifs, et il s’est développé et considérablement affiné depuis ses débuts. Des fonctionnalités telles que la sécurité, qui existaient à peine dans les premières versions, sont désormais au cœur du projet. L’écosystème d’outils et d’intégrations pris en charge s’est élargi, tout comme le nombre de connecteurs de données. Ceux-ci incluent des connecteurs vers des sources de données relationnelles telles que PostgreSQL, Oracle et SQL Server, ainsi que des sources non traditionnelles telles qu’Elasticsearch, OpenSearch, MongoDB et Apache Kafka. Sundstrom a décrit des améliorations supplémentaires actuellement en cours, notamment la refonte du langage de fonction pour une meilleure extensibilité, l’amélioration de la prise en charge des charges de travail ETL et l’amélioration du fonctionnement de cette fonctionnalité, prête à l’emploi, pour améliorer la productivité des non-experts.

Sundstrom dit que les créateurs ont décidé d’ouvrir le projet sur la base de l’arrière-plan open source partagé entre eux. Certains défis auxquels ils ont été confrontés et surmontés comprenaient la croissance et l’extension du système – pas seulement le logiciel, qui est un problème assez difficile en soi, mais aussi la communauté : aider à ouvrir la communication entre les différents membres de la communauté pour favoriser la collaboration autour de la résolution un problème commun, plutôt que des solutions développées en parallèle pour le même problème.

Événement

MetaBeat 2022

MetaBeat réunira des leaders d’opinion pour donner des conseils sur la façon dont la technologie métaverse transformera la façon dont toutes les industries communiquent et font des affaires le 4 octobre à San Francisco, en Californie.

Inscrivez-vous ici

Cas d’utilisation Trino

Trino est utilisé par de nombreuses entreprises, dont Netflix et LinkedIn, pour l’analyse interne, et certaines de ces entreprises contribuent également au projet open source, telles que Bloomberg et Comcast. Sundstrom a expliqué comment Trino est particulièrement populaire auprès des services de répartition Internet/de type taxi et des services de livraison de nourriture en temps réel, y compris Lyft et DoorDash, car il peut effectuer des requêtes à faible latence extrêmement rapides sur de grands ensembles de données. Sundstrom a mentionné qu’il fonctionne également extrêmement bien sur les données géospatiales, qui deviennent de plus en plus courantes et peuvent être difficiles à analyser.

Vue future de Trino

En ce qui concerne l’avenir, Sundstrom a déclaré qu’il était enthousiasmé par Trino et son avenir, car le rythme de l’innovation continue de s’accélérer et les cas d’utilisation sont en mesure de couvrir des charges de travail et des types de données étendus. Il prévoit une plus grande croissance des problèmes que Trino peut aborder – par exemple, l’ajout de la capacité de traiter les données géospatiales signifie que les sociétés de cartographie, les fournisseurs de services cellulaires et les entreprises de livraison de nourriture peuvent tirer une valeur ajoutée de l’analyse des données des clients.

La communauté Trino s’est déjà montrée très capable de trouver des solutions innovantes aux problèmes de ses utilisateurs. Il est difficile d’imaginer que les plates-formes Presto/Trino ont maintenant 10 ans, mais il est facile d’imaginer que Trino deviendra applicable à davantage de cas d’utilisation et d’exigences des utilisateurs au fil du temps.

La mission de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir des connaissances sur la technologie d’entreprise transformatrice et d’effectuer des transactions. En savoir plus sur l’adhésion.

Leave a Comment