Bonjour,
J'ai besoin d'aide car mes qualités en statistiques sont un peu rouillées.
Je suis sûre qu'il existe une méthodo quelque part de ce que je veux faire mais je n'arrive pas à la trouver.
Voilà le sujet :
J'ai une population de clients 'perdus' et une poulation de clients encore en activité. En me basant sur les variables caractérisant cette population de clients 'perdus', je dois établir un score de risque sur mes actuels clients et le représenter sous forme de graphique.
Quelle méthodo me conseillez-vous ?
Aussi, à combien de temps estimez-vous ce travail ? J'ai l'impression que ça va prendre plusieurs semaines, mais mon chef s'attend définitivement à ce que je le fasse en moins de 3 jours. Est-ce que je suis vraiment trop rouillée ou c'est lui qui ne se rend absolument pas compte du travail que ça représente ? ou les 2 ?
Pour l'instant, j'utilise ce site : La régression logistique avec R, sa vie, son oeuvre - OD-Datamining
Mais j'ai des erreurs, bien que le site semble récent. Par exemple, avec le code suivant :
library(skimr)
pander(skim(titanic), split.tables=Inf)
R me retourne l'erreur :
Error in pander(skim(res_clust1), split.tables = Inf) :
could not find function "pander"
Même si j'ai bien (sauf erreur de ma part) déployé toutes les bibilothèques différentes.
Ce n'est pas très grave, mais j'ai des erreurs fréquentes et de mes recherches, c'est ce site qui semble correspondre le plus à mon besoin, donc ce post est surtout pour savoir si vous connaissez d'autres liens de ce genre que je n'aurais pas trouver.
Merci
Emilie.