Récupérer la branche du TP :
git checkout 2_start_tp_pandera
Les nouveautés sur cette branche sont les suivantes :
requirements.txt
contient une nouvelle dépendance : pandera
Dans votre terminal, avec le bon environnement activé lancer la commande
pip install -r requirements.txt
Cette commande vérifie que tout est bien installé, et installe notamment panderas
Observer le module source/domain/entities/customer_data_schema
Nous avons pré-défini un ensemble de validation en utilisant Pandera notamment DataFrame Model.
Dans la suite, nous souhaitons définir les vérifications inhérentes à la colonne income
, voici ce que vous
devez faire :
income
(vous pouvez inspirer de la déclaration des autres colonnes)source.domain.usecase.prepare_data
grâce au décorateur @pa.check_input(RawCustomerSchema)
train
pour vérifier les données : il n'y a pas d'erreur.predict
avec un income à -10 : observer les logs@pa.check_input
par @validate_input
, celui là filtrera les erreurs de l'inputExplorer les autres vérifications possibles à mettre en place.
Les instructions du TP suivant sont ici