Science des données : détection de la fraude par carte de crédit

Dans ce cours, j’expliquerai comment développer un modèle de détection de fraude par carte de crédit pour classer une transaction comme fraude ou légitime avec une très grande précision à l’aide de différents modèles d’apprentissage automatique. Il s’agit d’un projet pratique où je vais vous enseigner le processus étape par étape de création et d’évaluation d’un modèle d’apprentissage automatique.

Ce cours vous guidera à travers l’exploration et la compréhension initiales des données, l’analyse des données, la préparation des données, la construction de modèles et l’évaluation. Nous allons explorer les concepts RepeatedKFold, StratifiedKFold, Random Oversampler, SMOTE, ADASYN, puis utiliser plusieurs algorithmes ML pour créer notre modèle et enfin nous concentrer sur celui qui fonctionne le mieux sur l’ensemble de données donné.

Afin de vous permettre de voir plus facilement ce qui sera couvert dans le cours, je l’ai décomposé en tâches ci-dessous.

Tâche 1 : Mise en place des colis.

C’est la Tâche 2 : Importer les bibliothèques.

Tâche 3 : Obtenir les données de la source.

Tâche 4 : Apprendre à connaître les données

La Tâche 5 : Vérifier la distribution de la variable cible dans votre classe est l’étape suivante.

Tâche 6 : Trouvez des corrélations et créez une carte thermique.

Tâche 7 : S’assurer que les fonctionnalités fonctionnent correctement.

La tâche 8 : former la division de test

Tâche 9 : Voir comment une variable est répartie sur un graphique.

La matrice de confusion, le rapport de classification et l’AUC-ROC sont les éléments que vous devez connaître dans la tâche 10.

créé une fonction commune pour tracer la matrice de confusion pour les tâches 11 et 12.

Que devez-vous savoir sur la régression logistique ? KN ? Arbre? Forêt aléatoire ? XGBoost ?

Tâche 13 : J’ai créé une fonction unique qui pourrait être utilisée pour ajuster et prédire un modèle de régression logistique.

Tâche 14 : J’ai créé une seule fonction qui pourrait être utilisée pour ajuster et prédire un modèle KNN.

La tâche 15 : J’ai créé une fonction unique qui pourrait être utilisée pour ajuster et prédire un modèle d’arbre.

Tâche 16 : J’ai créé une fonction unique qui pourrait être utilisée pour ajuster et prédire un modèle de forêt aléatoire.

Tâche 17 : J’ai créé une fonction unique qui pourrait être utilisée pour ajuster et prédire un modèle XGBoost.

La tâche 18 : J’ai créé une seule fonction qui pourrait être utilisée pour ajuster et prédire un modèle SVM.

Science des données : détection de la fraude par carte de crédit – modélisation

Ce que vous devez savoir sur les Kfold répétés et les Kfold empilés dans la tâche 19.

Tâche 20 : Utilisation de RepeatedKFold et de l’évaluation du modèle pour effectuer une validation croisée pour la tâche 20

Tâche 21 : Utiliser StratifiedKFold et Model Evaluation pour effectuer une validation croisée et une évaluation de modèle.

La tâche 22 : Continuez avec le modèle qui a montré les meilleurs résultats jusqu’à présent, jusqu’à présent.

Tâche 23 : Random Oversampler, SMOTE et ADASYN sont quelques-unes des choses que vous devez savoir.

24 : Faire un suréchantillonnage avec un échantillonnage aléatoire et utiliser StratifiedKFold pour la validation croisée et évaluer le modèle que vous avez créé.

Tâche 25 : effectuer un suréchantillonnage avec SMOTE et évaluer les modèles que vous avez créés.

26 : Suréchantillonnage avec ADASYN et examen du modèle que vous avez créé

Tâche 27 : Réglage des hyperparamètres, ou

La tâche 28 : Trouvez les fonctionnalités les plus importantes.

Tâche 29 : Faites une conclusion finale.

Si vous voulez travailler au 21e siècle, vous devez savoir analyser des données et créer des modèles. Assurez-vous de suivre le cours maintenant et vous en saurez beaucoup plus sur l’apprentissage automatique en quelques heures seulement, alors n’attendez pas !

Similar Posts