Traitement de données massives
John Samuel
CPE Lyon
Year: 2020-2021
Email: john(dot)samuel(at)cpe(dot)fr
Soit
Alors
Prendre des décisions signifie appliquer tous les classificateurs à un échantillon invisible x et prédire l'étiquette k pour laquelle le classificateur correspondant rapporte le score de confiance le plus élevé : \[\hat{y} = \underset{k \in \{1 \ldots K\}}{\arg\!\max}\; f_k(x)\]
\[ C_1.. ∪ ..C_k ∪ C_{outliers} = X \] et
\[ C_i ∩ C_j = ϕ, i ≠ j; 1 <i,j <k \]
\(C_{outliers}\) peut consister en des cas extrêmes (anomalie de données)
\[ Y ≅ f(X,β) \]
\[P(A|B) = \frac{(P(B|A).P(A))}{P(B)}\]
\[P(S|W) = \frac{P(W|S) \cdot P(S)}{P(W|S) \cdot P(S) + P(W|H) \cdot P(H)}\]