Vous n’avez pas pu assister à Transform 2022 ? Découvrez dès maintenant toutes les sessions du sommet dans notre bibliothèque à la demande ! Regardez ici.
La société californienne Arcion (anciennement Blitzz), qui propose une plate-forme entièrement gérée pour répliquer en temps réel les données transactionnelles sur des plates-formes de données basées sur le cloud, accélère l’extraction des données des bases de données Oracle grâce à un nouveau lecteur de journal natif.
La capacité, qui fait partie de la dernière version d’Arcion, permet aux entreprises de lire les journaux de leur instance Oracle directement pendant la réplication, éliminant ainsi le besoin d’utiliser Logminer ou d’autres sources moins efficaces ou efficientes. Selon la société, cela, combiné à sa conception architecturale distribuée et parallèle, garantit une évolutivité illimitée et une extraction de données 10 fois plus rapide vers des plates-formes cibles telles que Databricks, Snowflake, MySQL, PostgreSQL, SingleStore et Yugabyte.
“Arcion est le seul CDC multithread de bout en bout [change data capture] solution qui s’adapte automatiquement verticalement et horizontalement. Tout processus qu’Arcion exécute sur la source et la cible est parallélisé à l’aide de techniques en instance de brevet pour atteindre un débit maximal. Il n’y a pas une seule étape dans le pipeline qui soit monothread. Il offre aux utilisateurs d’Arcion une réplication CDC à latence ultra-faible et peut toujours suivre le volume de données en constante augmentation sur la source. Si une entreprise souhaite migrer ou répliquer des données à l’échelle du téraoctet qui nécessitent un débit élevé, Arcion est la réponse », a déclaré Gary Hagmueller, PDG de la société, à VentureBeat.
Alors que les nouveaux outils d’intégration de données tels que Airbyte, Debezium, StreamSet et Kafka Connectors manquent cette fonctionnalité, il existe de nombreux outils CDC plus anciens (Qlik Attunity, HVR acquis par Fivetran) qui offrent cette capacité. Cependant, comme l’a souligné Hagmueller, toutes ces solutions plus anciennes nécessitaient un effort matériel à la fois pour la mise en place et la gestion – ce qui n’est pas le cas avec Arcion.
Événement
MetaBeat 2022
MetaBeat réunira des leaders d’opinion pour donner des conseils sur la façon dont la technologie métaverse transformera la façon dont toutes les industries communiquent et font des affaires le 4 octobre à San Francisco, en Californie.
Inscrivez-vous ici
Faciliter la réplication des données
Outre le lecteur natif pour les utilisateurs d’Oracle, la dernière version d’Arcion simplifie également la gestion des modifications de schéma DDL (langage de définition de données) et la transformation des données pour les entreprises.
Dans le cadre de la première, la capacité d’évolution du schéma de la plate-forme a été étendue pour capturer automatiquement les modifications DDL à partir d’une base de données source et les répliquer dans la plate-forme de données cible. Cette fonctionnalité évite aux ingénieurs de données les problèmes manuels pour maintenir l’alignement du schéma entre les bases de données source et cible. Auparavant, en cas de modification du DDL ou du schéma de la base de données source, ils devaient arrêter le processus de réplication et le reconstruire à partir de zéro en prenant un instantané du système source. Cela a entraîné des temps d’arrêt, un gaspillage de ressources de calcul coûteuses et des risques d’erreur de l’utilisateur et de perte de données.
«Oracle Golden Gate est une solution CDC qui prend en charge l’évolution automatique du schéma (DDL). Mais Arcion est la seule plate-forme CDC qui prend en charge le DDL prêt à l’emploi avec des entrepôts analytiques modernes comme Snowflake ou Databriks. Oracle Golden Gate ne fournit pas de support très robuste pour Snowflake et Databricks, donc toute personne adoptant de tels systèmes trouvera cette solution. Alternativement, l’équipe de données doit être prête à investir dans des ressources manuelles pour gérer l’évolution du schéma avec d’autres solutions CDC alternatives », a déclaré le PDG.
Pendant ce temps, pour aider les entreprises à mieux gérer les transformations de données, Arcion introduit une fonctionnalité sans code qui offre des transformations de colonnes de streaming flexibles et hautes performances à la volée. Cela élimine le besoin de consacrer des ressources à la création d’une table intermédiaire (par exemple, Kafka) et à l’écriture de code personnalisé pour transformer les données sur la cible. Cette pratique a également entraîné des retards dans les SLA.
Disponibilité du lecteur de journal Oracle
Le lecteur de journaux Oracle est actuellement disponible en version bêta et verra un déploiement plus large plus tard ce mois-ci, tandis que les deux autres fonctionnalités sont désormais généralement disponibles dans le cadre de la version entièrement hébergée d’Arcion.
Avec cette version, Arcion ajoute également Google BigQuery et Azure-Managed SQL Server comme nouvelles sources et Imply (fondé par les créateurs originaux d’Apache Druid) comme nouvelle cible. Au total, la plate-forme prend en charge plus de 20 bases de données d’entreprise et entrepôts de données pour la réplication des données. Il y a quelques mois, la société a également levé 13 millions de dollars en financement de série A pour une valorisation de 65 millions de dollars.
“Le marché des logiciels de réplication et de protection des données a montré une résilience bien supérieure aux attentes en 2020 malgré la pandémie”, a déclaré Phil Goodwin, directeur de recherche au sein du groupe des systèmes d’infrastructure et des technologies d’IDC. “Nous nous attendons à ce que ce marché revienne à son modèle de croissance normal, avec un TCAC de 2,7 % jusqu’en 2025. La partie des services de cloud public du marché est le point positif, avec un TCAC de 11,6 % attendu pendant cette période.”