Top 14 des questions et réponses de l'entretien SSIS [Pour les débutants et les réponses]

Publié: 2020-09-29

SSIS ou mieux connu sous le nom de SQL Server Integration Services est l'interface utilisée pour créer des solutions de très haut niveau (généralement au niveau d'une organisation entière) pour l'intégration et la transformation des données. Vous pouvez utiliser ces services d'intégration SQL Server pour éliminer complètement les problèmes auxquels vous êtes confrontés dans la gestion des données de votre organisation.

Tous vos besoins de gestion de données peuvent être facilement résolus en les divisant en tâches plus simples telles que la copie et le téléchargement de données, le chargement de toutes les informations dont vous disposez sur des silos de données ou des entrepôts de données, le nettoyage des données, l'exploration de données et enfin, en gérer les objets SQL serveur que vous avez déployés dans votre organisation.

Ces services d'intégration SQL Server peuvent également extraire les données et effectuer les transformations nécessaires sur les données à partir de diverses sources, telles que les fichiers de données, les fichiers eXtensible Markup Language et les données de toute base de données relationnelle telle que RDBMS (système de gestion de base de données relationnelle). Vous pouvez ensuite prendre les données que vous avez extraites de ces fichiers et les charger à l'emplacement souhaité de votre choix (il peut s'agir d'un seul endroit ou de plusieurs endroits, aucune restriction ici).

SQL Server Integration Service peut gérer tout cela à l'aide d'excellents outils intégrés à ce service. Vous trouverez également de nombreux outils graphiques qui peuvent ensuite être analysés sous la forme de packages avec une relative facilité. Vous pouvez utiliser ce service visuel pour faire votre travail sans avoir à écrire une seule ligne de code. Cependant, vous pouvez faire beaucoup plus si vous décidez de coder et d'écrire les programmes qui effectueraient les tâches que vous désirez.

Comme nous l'avons vu, SQL Server Integration Service est assez étendu dans son approche pour répondre aux besoins de données d'une organisation. Ainsi, si vous avez SQL sur votre CV et que vous essayez de trouver un emploi axé sur les données, il y a de fortes chances que l'organisation qui embauche ait besoin d'une expertise dans SQL Server Integration Service. Nous sommes allés de l'avant et avons rassemblé certaines des très célèbres questions d'entretien SSIS qui devraient vous aider à préparer votre prochain entretien.

Lire : SGBD vs RDBMS : Différence entre SGBD et RDBMS

Table des matières

Questions et réponses de l'entretien SSIS

Q1. Qu'entendez-vous par SSIS ?

Rép. SSIS, mieux connu sous le nom de SQL Server Integration Service, fait partie du serveur SQL que Microsoft a implémenté. Il est principalement utilisé pour résoudre les problèmes liés aux données rencontrés par les grandes entreprises.

Q2. Nommez quelques-unes des fonctionnalités essentielles à travers lesquelles l'ensemble du package SSIS est formé.

Rép. Il existe de nombreuses fonctionnalités vitales qui donnent vie au service d'intégration SQL Server de Microsoft. Certains d'entre eux sont énumérés ci-dessous:

  1. Le package de gestion du flux de données ou le package de flux de données de SQL Server Integration Service.
  2. Le package de contrôle de l'ensemble du processus de SQL Server Integration Service ou connu sous le nom de package de flux de contrôle.
  3. Le package est censé gérer et gérer tous les autres packages installés dans le service d'intégration SQL Server ou le package du gestionnaire de packages.
  4. Le package est responsable de la gestion des événements dans SQL Server Integration Service ou le package du gestionnaire d'événements.

Apprenez le cours de certification en science des données des meilleures universités du monde. Gagnez des programmes Executive PG, des programmes de certificat avancés ou des programmes de maîtrise pour accélérer votre carrière.

Q3. Découvrez la fonctionnalité d'exploration de solution de SQL Server Integration Service>

Rép. Le module de l'explorateur de solutions dans le concepteur SQL Server Integration Service est l'endroit où vous pouvez voir et trouver toutes les sources de données, afficher tous les projets en cours et d'autres fichiers qui peuvent parfois s'avérer très utiles.

Q4. Que voulons-nous dire lorsque nous utilisons le terme flux de données dans le contexte du service d'intégration SQL Server ?

Rép. Le flux de données dans le paradigme SQL Server Integration Service désigne le canal que les données empruntent pour atteindre l'origine des données jusqu'à la destination (l'endroit où les informations sont censées se trouver).

Q5. Qu'entendons-nous par le mot tâche dans le monde de SQL Server Integration Service ?

Rép. Tâche signifie à peu près la même chose dans le domaine de SQL Server Integration Service que dans tout autre langage de programmation. Le mot tâche est utilisé pour définir une unité de travail. Dans SQL Server Integration Service, cependant, vous constaterez qu'il existe deux catégories de fonctions, l'une étant les tâches de flux de contrôle et la seconde étant la tâche de maintenance de la base de données (ou la tâche de maintenance de la base de données).

Q6. Qu'entendez-vous par un package SQL Server Integration Service ?

Rép. Tout package du service d'intégration SQL Server de Microsoft n'est rien d'autre qu'un amalgame d'éléments qui, lorsqu'ils sont combinés, vous offrent ce service puissant. Les aspects qui constituent tout package SQL Server Integration Service sont les éléments de flux de données, le gestionnaire des événements, les variables pouvant être contrôlées, divers éléments de configuration et enfin, l'aspect censé gérer et gérer tous les événements.

Vous pouvez soit prendre tous ces éléments séparément et essayer de créer quelque chose qui n'utilise que les fonctionnalités dont vous avez besoin, soit installer un package prédéfini à partir du gestionnaire de packages. Si vous choisissez de créer un package par vous-même, vous aurez deux options, soit utiliser l'outil graphique pour mapper toutes les fonctionnalités dans le package, soit écrire du code qui le ferait pour vous.

Q7. Quels sont les noms de tous les différents fichiers ou types de connexion qui prennent en charge l'intégration de SQL Server Integration Service dans ceux-ci ?

Rép. Tous les différents types de connexions qui fonctionnent étonnamment bien dans SQL Server Integration Service sont répertoriés ci-dessous :

  1. Le client pour le framework .net SQL.
  2. Les mouches au format plat.
  3. Les fichiers Microsoft Excel.
  4. ODBC
  5. OLEDB
  6. Les fichiers sont écrits au format XML.

Doit lire : SQL Vs MySQL : Différence entre SQL et MySQL

Q8. Qu'entendez-vous par conteneur et nommez tous les différents types de conteneurs disponibles dans le service d'intégration SQL Server ?

Rép. Le conteneur dans le paradigme de SQL Server Integration Service est juste un outil de gestion des tâches qui peut regrouper quelques tâches spécifiques en utilisant la logique. Il permet également une interface simple à travers laquelle vous pouvez gérer l'étendue des tâches que vous avez couplées. Il existe quatre types de conteneurs différents que nous pouvons utiliser. Vous les trouverez tous listés ci-dessous :

  1. Pour conteneur de boucle.
  2. Pour chaque conteneur de boucle.
  3. Conteneur d'hôte de tâche.
  4. Conteneur de séquence.

Q9. Que signifie la contrainte connue sous le nom de priorité lorsque nous parlons de SQL Server Integration Service ?

Rép. Les contraintes de priorité sont configurées dans SQL Server Integration Service de manière à vous permettre de définir un flux de tâche en écrivant l'ordre dans lequel elles doivent être exécutées. Vous pouvez l'utiliser pour connecter toutes les tâches à accomplir et créer un flux logique qui semble naturel pour le projet.

Q10. Qu'entendez-vous par variables dans le contexte de SQL Server Integration Service, et quels sont les différents types de variables que l'utilisateur peut utiliser dans son programme ?

Rép. Les variables dans le contexte de n'importe quel langage de programmation signifient la même chose. Le concept de variables est tiré de sa définition mathématique, ce qui signifie que vous pouvez les utiliser pour stocker des valeurs. Vous pouvez alors plus tard au lieu d'avoir à écrire le même montant, encore et encore, pouvez référencer le nom de la variable, et vous serez en mesure d'accomplir des tâches similaires. Il existe deux types de variables auxquelles SQL Server Integration Service vous donne accès. Ce sont des variables définies par le système et des variables définies par l'utilisateur.

Q11. Qu'entendez-vous par gestionnaires de connexions dans SQL Server Integration Service ?

Rép. Les gestionnaires de connexion sont très pratiques lorsque nous essayons de trouver et de collecter des données à partir de nombreuses sources. Les gestionnaires de connexion sont l'outil qui aide à faciliter toutes les tentatives de connexion qui sont faites au système. Ils fournissent généralement des informations telles que l'identité du fournisseur de données, le nom du serveur, le mécanisme utilisé pour s'authentifier, le nom de la base de données utilisée, etc.

Q12. Que voulez-vous dire par un point d'arrêt SQL Server Integration Service ?

Rép. La réponse à ces questions d'entretien SSIS est la suivante. Un point d'arrêt est essentiellement utilisé pour interrompre le processus d'exécution de tous les packages. Il peut s'agir de dépanner pendant la phase de création de n'importe quel package dans le service d'intégration SQL Server.

Q13. Qu'entend-on par journalisation de l'événement dans le service d'intégration SQL Server ?

Rép. La journalisation des événements dans le cas de SQL Server Integration Service peut permettre à l'utilisateur de sélectionner une tâche particulière ou un événement ou même un package qui doit être connecté au système. L'utilisation principale de ce système de journalisation des événements est lorsque nous essayons de dépanner ou lorsque nous essayons de comprendre les performances du package.

Q14. Qu'entendons-nous par le terme tampon de flux de données ?

Rép. C'est l'une des questions et réponses d'entretien SSIS les plus élémentaires et pourtant l'une des principales que vous devriez connaître. Dans SQL Server Integration Service, nous utilisons tout le temps des tampons de données. C'est un type de table virtuelle qui est stockée dans la mémoire. Il peut être utilisé pour stocker des données.

Lisez aussi : SQL vs Python : Différence entre SQL et Python

Emballer

Si vous êtes curieux d'en savoir plus sur la science des données, consultez le programme Executive PG en science des données de IIIT-B & upGrad qui est créé pour les professionnels en activité et propose plus de 10 études de cas et projets, des ateliers pratiques, un mentorat avec des experts de l'industrie, 1 -on-1 avec des mentors de l'industrie, plus de 400 heures d'apprentissage et d'aide à l'emploi avec les meilleures entreprises.

Comment accélérer le flux de données dans SSIS ?

Le processus de SSIS est itératif. Tout d'abord, vous commencez par laisser les composants fonctionner individuellement ou en petits ensembles, puis vous vous assurez qu'ils fonctionnent dans le bon ordre. Les performances du flux de données dans SSIS peuvent être affectées par plusieurs sources internes et externes, telles que les systèmes sources utilisés pour les extractions de données.
Pour accélérer le flux de données dans SSIS, vous devez suivre quelques étapes comme indiqué ci-dessous :
1. Réduisez le nombre de colonnes et de lignes
2. La largeur des colonnes doit être réduite
3. Au lieu d'utiliser les options Afficher ou Table pour les sources relationnelles, utilisez l'option de commande SQL.
4. Pour les sources de fichiers plats, utilisez le mode d'analyse rapide
5. Effectuez les transformations nécessaires dans la requête source
6. Séparez les opérations agrégées
7. Optimisez et préchargez le cache pour les transformations de recherche
8. Définir explicitement les types de données
Les choix de conception que vous faites auront un impact sur la vitesse du flux de données dans le package SSIS. Vous devez faire les bons choix et suivre les points mentionnés ci-dessus pour accélérer le flux de données.

Quels sont les trois composants de flux de données dans SSIS ?

Il existe trois composants différents fournis par SSIS (SQL Server Integration Services) : les destinations, les transformations et les sources. Il y a un rôle différent joué par chaque composant de flux de données pour le bon fonctionnement du package SSIS.
1. Sources - Le travail des sources consiste à extraire les données de différents magasins de données, tels que des vues et des tables dans les bases de données relationnelles, les bases de données des services d'analyse et les fichiers.
2. Transformations – Les données sont modifiées, résumées et nettoyées par les transformations.
3. Destinations – Les données sont chargées dans les magasins de données ou les ensembles de données en mémoire par les destinations.

Quels sont les différents composants de l'architecture SSIS ?

Il existe quatre composants principaux de l'architecture SSIS. Elles sont:
1. Moteur d'exécution SSIS - Il gère le flux de travail du package SSIS.
2. Pipeline de flux de données - Il gère le flux de données de la source à la destination et s'occupe également des transformations en mémoire.
3. Modèle d'objet SSIS - Il crée, gère et surveille par programmation tous les packages SSIS.
4. Service Windows SSIS - Il gère et surveille les packages.
Ce sont les fonctionnalités des quatre composants de l'architecture SSIS.