Ce projet a pour objectif d'analyser un jeu de données contenant les ventes réalisées sur Amazon. L’analyse a été menée à l’aide de Python, notamment avec les bibliothèques pandas, matplotlib, seaborn et numpy. L’objectif principal est de tirer des insights sur les performances des ventes, les tendances produits, les périodes de forte activité, et les comportements clients.
- Python 3.x
- Pandas
- Matplotlib
- Seaborn
- NumPy
- Jupyter Notebook
Le notebook suit les étapes classiques d’un projet d’analyse de données :
-
Importation des bibliothèques
-
Chargement des données depuis le fichier
Amazon Sale Report.csv -
Exploration des données (EDA) :
- Taille et structure du dataset
- Types de colonnes
- Données manquantes
- Statistiques descriptives
-
Nettoyage des données :
- Suppression des valeurs manquantes
- Conversion de types (dates, numériques, etc.)
-
Visualisations :
- Analyse des ventes par produit, date, catégorie
- Corrélations entre les variables
- Graphiques linéaires, histogrammes, heatmaps
-
Insights :
- Identification des produits les plus vendus
- Heures/jours/mois avec les ventes les plus fortes
- Produits sous-performants ou non rentables
- Nettoyage d’un dataset brut
- Extraction d’indicateurs clés de performance (KPI)
- Visualisation claire des tendances
- Création d’une base pour des recommandations business
Amazon-vente.ipynb: Notebook principal avec toute l’analyseAmazon Sale Report.csv: Jeu de données sourceREADME.md: Présentation du projet
- Ajouter une analyse prédictive avec des modèles de machine learning
- Intégrer un dashboard interactif (ex. : avec Plotly ou Dash)
- Étendre l’analyse à plusieurs marketplaces Amazon (FR, US, etc.)