Le fondateur de Looker aide à créer un nouveau langage d’exploration de données, Malloy

(EvalCo/Shutterstock)

Lloyd Tabb s’occupe depuis que Looker a été vendu à Google en 2019. Le dernier projet open source pour l’informaticien prolifique et son équipe Google est Mloy, un nouveau langage basé sur SQL mais qui, selon Tabb, est plus accessible et plus simple à utiliser .

Malloy est décrit sur sa page GitHub comme « un langage expérimental pour décrire les relations et les transformations de données. C’est à la fois un langage de modélisation sémantique et un langage d’interrogation qui exécute des requêtes sur une base de données relationnelle.

L’une des fonctionnalités clés de Malloy, qui a été introduite à la mi-2021, est sa capacité à travailler avec des ensembles de données imbriqués, en particulier ceux pris en charge par BigQuery. Le langage génère également du SQL compatible avec Postgres.

L’équipe de développement derrière Malloy dit qu’en combinant le langage de modélisation et de requête, Malloy simplifie une grande partie du travail de données qui est actuellement effectué en SQL, rendant les calculs modulaires, composables, réutilisables et extensibles “de manière cohérente avec les paradigmes de programmation modernes. ”

“SQL est complet mais moche”, écrivent les contributeurs de Malloy sur le fichier readme de GitHub. « Tout est exprimable, mais rien n’est réutilisable ; les idées simples sont complexes à exprimer ; le langage est verbeux et manque de valeurs par défaut intelligentes. Malloy est immédiatement compréhensible par les utilisateurs de SQL, et beaucoup plus facile à utiliser et à apprendre. »

La même requête écrite dans la syntaxe Malloy (en haut) par rapport à la syntaxe SQL (en bas)

Malloy est conçu pour être un langage pour tous ceux qui travaillent avec SQL, y compris les analystes de données, les scientifiques de données, les ingénieurs de données ou toute autre personne construisant une application de données, écrivent les bailleurs de fonds du projet.

“Si vous connaissez SQL, Malloy vous semblera familier, tout en étant plus puissant et efficace”, écrivent-ils. “Maloy vous permet de modéliser au fur et à mesure, il n’y a donc pas de travail initial lourd avant de pouvoir commencer à répondre à des questions complexes, et vous n’êtes jamais retenu ou limité par le modèle.”

Le commit GitHub initial pour Malloy a été effectué en août 2021 par Tabb et son équipe chez Google Cloud. L’équipe a précédemment créé une extension Visual Studio Code appelée Malloy Workspace qui permet aux utilisateurs de créer des modèles, des requêtes, des métriques et des tableaux de bord dans Malloy.

La démo Malloy Workspace montre comment un utilisateur peut créer un modèle de données à la volée lorsqu’il explore des données et écrit des requêtes. La démo, qui est basée sur un échantillon de données d’aéroport, montre comment Malloy permet à l’utilisateur de créer un nouveau modèle de données ou d’en façonner un existant lorsqu’il définit des relations de données, écrit des requêtes, et agrège et joint des données.

Les données imbriquées, en particulier, sont plus faciles à utiliser dans Malloy que dans les outils SQL standard, affirment les bailleurs de fonds du projet. Un utilisateur peut créer des ensembles de données imbriqués, que Malloy exécutera ensemble dans une seule requête sur la base de données. “Les pièges des ventilateurs et des gouffres sont résolus, ce qui permet d’agréger n’importe quoi dans une requête et réduit le besoin de tables de faits et de SQL trop complexe”, indique le projet dans le fichier readme de Malloy.

Lle dernier projet de loyd Tabb est le nouveau langage Malloy

Cette semaine, Tabb, qui répertorie son titre comme “trucs @ Google”, tweeté à propos du lancement de Malloy Composer, qui est une nouvelle application conçue pour Malloy. Une démo est disponible qui montre comment Mallow Composer (qui semble avoir davantage l’apparence d’une interface utilisateur Google) peut être utilisé pour explorer des données et créer des requêtes avec un tableau de dimensions, de filtres et de données imbriquées.

À certains égards, Malloy semble avoir une certaine similitude avec LookML, le langage de modélisation développé par Looker en tant que composant central de la plate-forme Looker. LookML a permis aux utilisateurs de créer des relations de données en dehors de SQL et de les réutiliser d’une manière qui n’était pas prise en charge directement par SQL. Les clients qui prenaient le temps de définir leurs modèles de données à l’aide de LookML bénéficiaient de plusieurs avantages, notamment une plus grande cohérence dans leurs analyses et la possibilité de générer rapidement de nouveaux produits de données sur la plate-forme Looker.

Cependant, Tabb dit que Malloy est différent de LoookML car il est entièrement basé sur le langage. “[O]Notre objectif est d’utiliser Malloy à tous les endroits où vous écririez un SQL SELECT », a-t-il écrit sur Twitter.

Tabb, qui travaillait auparavant chez Borland et Netscape, a fondé Looker en 2011. La société de Santa Cruz, en Californie, s’est rapidement développée en tant qu’outil d’analyse de données de nouvelle génération. Google a acquis Looker pour 2,6 milliards de dollars en 2019. Tabb était un Nom de données Personne à surveiller pour 2018.

Malloy n’est pas un produit officiel et il n’y a aucun support de Google ou de qui que ce soit d’autre. L’extension Malloy VSCode peut être téléchargée sur le marché VSCode. Plus d’informations sont disponibles dans le référentiel Looker GitHub à l’adresse https://github.com/looker-open-source/malloy.

Articles connexes:

Les data nerds ont gagné

Audacious Moonshot de Looker pour dépasser Oracle

Comment SQL++ rend JSON plus interrogeable

Leave a Comment