Creative Commons License

Questions: première session

Question 1

Quelles sont les phases macroscopiques du Big Data. Décrivez l’objectif de chaque phase. (1 point)

Question 2

Le nettoyage de données est une partie essentielle du Big Data. Pourquoi ? Quelles sont les différentes façons d’effectuer ce nettoyage. N’écrivez pas les technologies ou les noms de logiciels existants. (0.5 point)

Question 3

En utilisant la base de données NoSQL, décrivez les différentes structures de base de données (les concepts, leur attributs et les relations entre eux) pour créer un système de recommandation pour les livres. Votre base doit contenir les informations essentielles des utilisateurs, leurs amis et également les livres préférés et lus par chacun de ces utilisateurs. Justifiez votre choix de base de données NoSQL. (0.5 point)

Question 4

Proposez un pseudocode pour parcourir les nœuds d’un graphe et en utilisant l’exemple ci-dessous, montrez le déroulement de votre pseudocode. Vous pouvez considérer les nœuds comme les pages web sur l’internet. (1 point)

graph