Pour réaliser ce TP, allez sur la branche 1_start_clean_notebook

git stash
git checkout 1_start_clean_notebook

Dans le projet, vous trouverez :

    .
    └── formation_indus_ds
        ├── input
        | ├── test.csv
        | ├── train.csv
        ├── notebook
        | ├── titanic.ipynb
        README.md

Voici l'état d'un prototype de science des données construit par l'un de vos collègues.

Le but de cette première étape est de nettoyer le notebook en suivant les pratiques de code que vous venez de
découvrir :

Un test pour vérifier si vous avez terminé est de redémarrer le cahier et d'exécuter toutes les cellules (symbole >>)

À ce stade, votre ordinateur portable est propre, il fonctionne et vous disposez de quelques fonctions.

Le but de cette étape est de documenter quelques fonctions.

Pour ce faire, vous devez utiliser les indications de type et les docstrings.

Les indications de type vous aideront à utiliser ces fonctions.

Les docstrings vous aideront à construire rapidement une bonne documentation dans les étapes suivantes.

A ce stade :

Le but de cette étape est d'extraire vos fonctions dans un fichier .py.

Vous pourrez ensuite réutiliser ces fonctions dans d'autres notebooks.

Pour ce faire :

import sys

sys.path.append("../src/")
from feature_engineering import *

Les instructions du TP suivant sont ici