Questions: deuxième session
- Durée: 1 heure
- Total: 10 points
- Documents: autorisés
- Types de documents autorisés: Tous les documents autorisés
- Calculatrices : non autorisées
Question 1
Qu’est-ce qu’un stockage de données? Quels sont les différents systèmes de stockage de données? Décrivez-les brièvement.(1 point)
Question 2
Considérons un capteur capable de mesurer les valeurs suivantes : luminosité, pression, rayonnements UV, température et humidité. Codez en Python un programme qui peut écrire et lire ces données quotidiennes dans un fichier JSON. (1 point)
Question 3
Le nettoyage de données est une étape importante avant de faire l’analyse de données. Pourquoi ? Quels sont les différents types d’erreurs que vous avez déjà vues? (0.5 point)
Question 4
Quelles sont les différences entre classification et partitionnement de données ? Quels sont les différents algorithmes que vous avez utilisés pendant vos travaux pratiques pour faire la classification et le partitionnement? (1 point)
Question 5.a
Quelles sont les différences entre les trois lignes suivantes :
a = [10, 20, 30, 40, 50]
b = (10, 20, 30, 40, 50)
c = {10, 20, 30, 40, 50, 10, 20, 30, 40, 50}
Codez en Python afin d’afficher la taille et le type de données des variables a, b et c.(0.5 points)
Question 5.b
Qu'est-ce qu'un dictionnaire en Python ? Expliquez avec un exemple ?(0.5 points)
Question 6.a
Qu’est-ce qu’un perceptron?(0.5 points)
Question 6.b
Qu'est-ce qu'un réseau de neurones artificiel?(0.5 points)
Question 6.c
Avant d’utiliser les données externes, quelles sont vos considérations? (0.5 points)
Question 7.a
Considérons un fichier CSV contenant les colonnes suivantes : ville, année et population. Ce fichier contient les informations de la population des 10 villes enregistrées depuis 1950. Votre objectif est de coder en Python un programme qui:
- peut lire ce fichier CSV
- tracer un graphique montrant la population en fonction de temps pour chaque ville
- calcule la ville moins peuplée en année 2000
- calcule la population moyenne des villes en année 2000.
(1.5 points)
Question 7.b
En continuant avec notre fichier CSV de la population, nous supposons que nos données sont complètes et qu’il ne contient pas d’informations incorrectes. Notre fichier contient l’information sur la population des villes de 1950 à 2017. Votre prochain objectif est d’estimer (ou prévoir) la population de Paris en année 2050. Codez en Python un programme pour réaliser cette tâche. (1.5 points)
Question 8.a
Qu'est-ce le 'Big Data' (Masse de données)? Que sont les 5V du Big Data? (0.5 points)
Question 8.b
Quelle est la différence entre l’apprentissage supervisé, l’apprentissage non-supervisé et l’apprentissage semi-supervisé?(0.5 points)