Skip to content

Fonction nett_format_dates

Nom de la fonction : nett_format_dates

Description : fonction de nettoyage pour le format des dates. Cette fonction remplace toutes sortes de dates écrites dans différents formats en un seul format : XXXX-XX-XX.

Personne référente : @marie.grosdidier

Contributeur(s) : @marie.grosdidier @marine.marjou

Fonctionnalités :

  • modifie les valeurs qui correspondent à des NA (valeurs listées sous forme de vecteur 'na_modalite'
  • modifie les soucis d'encoding souvent lors de convertion ou passage par Excel
  • modifie le format des dates
  • checker s'il y a des périodes dans les dates, ou plusieurs dates mises dans la même cellule ...
  • rajouter une partie vérification des dates produites
  • export d'un rapport stat sur le nombre de valeurs modifiées et celles non modifiées ...
  • gérer les dates du type "2 mai 2022"

ex: pour choisir la première date si plusieurs renseignées dans la cellule

### Création d'une fonction qui permet de garder que la première valeur d'un vecteur 
Select1Valeur <- function(valeur, pattern){
  valeur2 = substr(valeur,1,(unlist(gregexpr(pattern,valeur))[1]-1))
  return(valeur2)
}

nett_format_dates

Cette fonction reçoit en entrée le dataset et la variable date et en sortie renvoie le dataset avec une nouvelle variable date nettoyée. Cette fonction se base quasi entièrement sur la détection des dates via des expressions régulières (codé par Marie). La fonction anytime::anydate() permet de faire la même chose à l'exception que cette fonction ne corrige pas les dates au format DD/MM/YYYY si celles-ci sont ambigües (https://github.com/eddelbuettel/anytime/issues/129).

Edited by Ruger Charlotte