- SQL server management studio
- SQL Server Integration Services
- Microsoft Visual Studio
- Power BI
Télécommunication.
Toute entreprise de télécommunication souhaite maximiser le nombre de clients. Pour atteindre cet objectif, il est important non seulement d'essayer d'en attirer de nouveaux, mais aussi de conserver ceux qui existent déjà. Fidéliser un client coûtera moins cher à l'entreprise que d'en attirer un nouveau. De plus, un nouveau client peut être faiblement intéressé par les services aux entreprises et il sera difficile de travailler avec lui, alors que les anciens clients disposent déjà des données nécessaires sur l'interaction avec le service.
Le besoin de cette étude est de : • Comprendre les raisons de résiliations des clients pour améliorer la qualité des offres et le service clientèle. • Analyser, de décrire et de prédire les données liées au désabonnement des clients afin de faire des tableaux de bord analytiques et prévisions à l'avenir pour faciliter la tâche de prise de décision pour la compagnie de télécommunication.
« IBM Teclo_Churn », Un ensemble de six fichiers Excel qui contiennent les informations sur une société de télécommunication fictive Telco qui a fourni des services de téléphonie résidentielle et Internet à 7043 clients en Californie au troisième trimestre de l’année 2020. Des informations sur les clients désabonnés, restés et ceux qui viennent de s’abonner. D’autres informations démographiques et géographiques importantes sont incluses pour chaque client, le type de contrat, les services choisis, le statut de désabonnement…etc Et aussi d’autres fichiers, un qui s’agit d’une calendrier de 2020 et l’autre qui contient des données sur tous les Zip Code de Californie.
- Telco_customer_churn_demographics.xlsx
- Telco_customer_churn_location.xlsx
- Telco_customer_churn_location.xlsx
- Telco_customer_churn_population.xlsx
- Telco_customer_churn_services.xlsx
- Telco_customer_churn_status.xlsx
- DimDates.xlsx
- Zipcode.xlsx
Dans cette partie du projet, nous mettrons en oeuvre l'entrepôt de données, en utilisant le schéma en étoile, qui est l'approche la plus utilisée pour développer des entrepôts de données, il se compose d'une table de faits faisant référence à un certain nombre de table de dimension. Notre entrepôt de données va contenir un table de fait ‘’Churn’’, et quatre dimensions : DimDates, DimCustomers, DimService et finalement DimLocalisation. Les attributs de chaque table sont représentés sur le schéma ci-dessous :
Extract, Transform, Load est la procédure générale de copier des données d'un ou de plusieurs sources dans un système de destination qui représente les données différemment des source ou dans un contexte différent de la source. Dans ce projet, nous extrairons les données des fichiers plats ci-dessous, et chargez-les dans ‘’ChurnDW’’ Datawarehouse créé sur SQL Server Management Studio (SSMS), nous devons remplir les quatre dimensions ainsi que la table des faits, pour ce faire nous utiliserons SQL Server Data Tools (SSDT).
Pour remplir cette dimension, on va fusionner les fichiers plats par des jointures et par la suite effectuer une conversion de données pour les rendre compatible avec ceux définies sur la base de données sur Management Studio.
On exporte la table de fait réalisé sous la format CSV afin d’effectuer une analyse descriptive et prédictive qui vise à explorer et comprendre l’ensemble de données, les raisons de désabonnement et réaliser un modèle prédictif d’attrition des clients.
Dans la dernière partie du projet, nous mettrons en oeuvre des solutions prédictives pour la compagnies Telco afin d'explorer les modèles en analysant les faits actuels et historiques et faire des prédictions sur la situation des futurs clients. Après le pré-traitement et la normalisation des données, on détermine la corrélation entre variables :
On choisit les variables les plus corrélées avec la variable cible en utilisant le SelectKBest avec un test Chi-square.
En affichant le rapport de classification, on remarque que le modèle implémenté effectue de bonne prédiction et avait de bonne score au niveau de tous les métriques d’évaluation.
La prise de décision est un rôle clé dans le succès de toute entreprise, ces décisions affectent directement l'entreprise, et donc une mauvaise décision par une source mal informée conduit à des résultats désastreux. Les décisions sont prises au niveau individuel jusqu'au niveau organisationnel. Cette solution BI que nous avons mise en place améliorera sûrement la décisions prises par les dirigeants de la compagnie Telco. Les systèmes de BI permettront en effet tous les gestionnaires de la compagnie Telco avec suffisamment d'informations et les rendre capables de la prise de décision.