Les valeures manquantes de la variable âge était traitées comme des 0. Et 'd_age' était calculé en valeur absolue. Ce qui avait pour conséquence : - Perte d'information car on ne sait pas si c'est 'self' ou 'partner' qui est le plus agé. - Si on a l'age de 'self' et une valeur manquante pour 'partner', d_age valait l'age de 'self'. On recréer donc la variable 'd_age' après imputations des valeurs manquantes, et on garde maintenant l'information du signe dans la différence. (on effectue toujours l'age de l'homme - l'age de la femme).