Questions: première session
- Durée: 1 heure
- Total: 10 points
- Documents: autorisés
- Types de documents autorisés: Tous les documents autorisés
- Calculatrices : non autorisées
Question 1
Qu’est-ce qu’un stockage de données? Quels sont les différents systèmes de stockage de données? Décrivez-les brièvement. (1 point)
Question 2
Considérons un capteur capable de mesurer les valeurs suivantes : luminosité, pression, rayonnements UV, température et humidité. Comment pouvez-vous représenter ces mesures quotidiennes dans un système de stockage de données? Codez en Python un programme qui peut lire ces données. (1 point)
Question 3
Le nettoyage de données est une étape importante avant de faire l’analyse de données. Pourquoi ? Quels sont les différents types d’erreurs que vous avez déjà vues? (0.5 point)
Question 4
Quelles sont les différences entre classification et partitionnement de données ? Quels sont les différents algorithmes que vous avez utilisés pendant vos travaux pratiques pour faire la classification et le partitionnement? Quels sont leurs avantages et inconvénients? (1 point)
Question 5.a
Quelles sont les différences entre les trois lignes suivantes :
a = [10, 20, 30, 40, 50]
b = (10, 20, 30, 40, 50)
c = {10, 20, 30, 40, 50, 10, 20, 30, 40, 50}
Codez en Python afin d’afficher la taille et le type de données des variables a, b et c.(0.5 points)
Question 5.b
Qu'est-ce qu'un dictionnaire en Python ? Expliquez avec un exemple ?(0.5 points)
Question 6.a
Qu’est-ce qu’un perceptron?(0.5 points)
Question 6.b
Qu'est-ce qu'un réseau de neurones artificiel?(0.5 points)
Question 6.c
Avant d’utiliser les données externes, quelles sont vos considérations? (0.5 points)
Question 7.a
Considérons un fichier CSV contenant les colonnes suivantes : ville, année et population. Ce fichier contient les informations de la population des 10 villes enregistrées depuis 1950. Votre objectif est de coder en Python un programme qui:
- peut lire ce fichier CSV
- tracer un graphique montrant la population en fonction de temps pour chaque ville
- calcule la ville plus peuplée en année 2000
- calcule la population moyenne des villes en année 2000.
(1.5 points)
Question 7.b
En continuant avec notre fichier CSV de la population, nous supposons que nos données sont complètes et qu’il ne contient pas d’informations incorrectes. Notre fichier contient l’information sur la population des villes de 1950 à 2017. Votre prochain objectif est d’estimer (ou prévoir) la population de chaque ville en année 2050. Codez en Python un programme pour réaliser cette tâche.(1.5 points)
Question 8.a
Qu'est-ce le 'Big Data' (Masse de données)?(0.5 points)
Question 8.b
Quelle est la différence entre l’apprentissage supervisé et l’apprentissage non-supervisé?(0.5 points)