Traitement de données massives
John Samuel
 CPE Lyon
                Year: 2022-2023
                Email: john(dot)samuel(at)cpe(dot)fr
                 
            
 
                 
                 
                 
                 
                 
                 
                 
                .jpg) 
                
         
             
                 
                .png) 
             
                Soit
Alors
 
                 
                Prendre des décisions signifie appliquer tous les classificateurs à un échantillon invisible x et prédire l'étiquette k pour laquelle le classificateur correspondant rapporte le score de confiance le plus élevé : \[\hat{y} = \underset{k \in \{1 \ldots K\}}{\arg\!\max}\; f_k(x)\]
 
             
            \[ C_1.. ∪ ..C_k ∪ C_{outliers} = X \] et
\[ C_i ∩ C_j = ϕ, i ≠ j; 1 <i,j <k \]
\(C_{outliers}\) peut consister en des cas extrêmes (anomalie de données)
 
                 
            \[ Y ≅ f(X,β) \]
 
             
             
             
             
            \[P(A|B) = \frac{(P(B|A).P(A))}{P(B)}\]
\[P(S|W) = \frac{P(W|S) \cdot P(S)}{P(W|S) \cdot P(S) + P(W|H) \cdot P(H)}\]
