Commencer avec Talend Open Studio (TOS)

Data
Talend est une société qui fournit des logiciels et des services dans le domaine de l'intégration de données depuis presque 15 ans. Il s'agit de l'un des acteurs majeurs de fournisseurs d'ETL avec son outil Talend Open Studio (TOS) for Data Integration.

Talend Open Studio For Data Integration (TOS)


Il s'agit de l'un des ETL (Extract Transform Load) leader sur le marché. TOS est un logiciel Open Source et gratuit, vous pouvez donc le télécharger et l'installer librement, ce qui représente un réel avantage sur ses concurrents et une vraie opportunité pour vous de vous lancer dans le sujet.


Rappel sur les ETL

Le terme ETL (Extract - Transform - Load) regroupe une séquence d'opérations visant à récupérer des données de diverses sources (cloud, fichiers plats, CRM, BDD, json, xml…), y apporter un traitement et à les stocker (Application tierce, DataWare House…).

L'outil proposé par Talend permet nativement d'interconnecter un nombre impressionnant d'outils et technologies via ses connecteurs pré-paramétrés. Plus de 900 selon l'éditeur, allant du simple fichier plat, aux appels api, en passant par le SQL ou encore le json.

Il se présente sous la forme d'un IDE.

  • Sur la gauche se trouvent vos ressources (jobs, variables, métadonnées…)
  • Au milieu de l'écran, l'éditeur graphique (qui permet de sélectionner vos composants, de les relier entre eux) ainsi que le détail du composant sélectionné. Cette seconde partie est également utilisée comme console lors de l'exécution des jobs.
  • Sur la droite, vous retrouvez l'ensemble des composants disponibles. Pour ne citer que les principaux : json, xml, xls, salesforce, sql, SAP, azure, hive, google, spss, jasper, jira… la liste est longue !


Comment ça marche ?

Vous pouvez rechercher dans la partie de droite les composants qui vous intéressent, les glisser / déposer sur l'éditeur graphique, pour ensuite le paramétrer.


Vous pouvez également (et c'est fortement conseillé !) visionner vos jobs avant de les builder afin de les exécuter via un ordonnanceur par exemple.


L'intérêt d'un tel outil, par rapport à des scripts maison par exemple, est qu'il propose en ensemble de connecteurs prêt à l'emploi. Vous n'avez plus qu'à y renseigner vos informations (identifiant, url, ports) pour les faire fonctionner. En cas de mise à jour, c'est Talend qui s'en charge.


Il devient alors très facile de connecter des bases SQL, des fichiers plats, des applications web, de croiser les données qu'elles hébergent et de les exploiter dans un projet de BI (Business Intelligence) par exemple, ou de charger les données compilées dans une application tierce (CRM, BDD).


La prise en main se fait rapidement et vous pourrez approfondir votre connaissance de l'outil petit à petit, en fonction de l'évolution de vos besoins.



Pour aller plus loin :



François,

Expert technique