From 473afd9a898c0f49aa6f1b5ada157c8cf283e8d3 Mon Sep 17 00:00:00 2001 From: frodrigue-ensae Date: Tue, 5 Mar 2024 14:37:29 +0000 Subject: [PATCH] ajout_indicateur --- 0_KPI_functions.py | 5 ++ Spectacle/Stat_desc.ipynb | 155 +++++++++++++++++++++++++++++++------- 2 files changed, 131 insertions(+), 29 deletions(-) diff --git a/0_KPI_functions.py b/0_KPI_functions.py index 3073f3e..837e785 100644 --- a/0_KPI_functions.py +++ b/0_KPI_functions.py @@ -90,6 +90,11 @@ def tickets_kpi_function(tickets_information = None): # tickets_kpi = tickets_kpi.merge(avg_amount, how='left', on= 'event_type_id') + #Taux de ticket payé par internet selon les compagnies + + #tickets_kpi["Taux_ticket_internet"] = tickets_kpi["nb_tickets_internet"]*100 / tickets_kpi["nb_tickets"] + #tickets_kpi['Taux_ticket_internet'] = tickets_kpi['Taux_ticket_internet'].fillna(0) + return tickets_kpi def customerplus_kpi_function(customerplus_clean = None): diff --git a/Spectacle/Stat_desc.ipynb b/Spectacle/Stat_desc.ipynb index b048fb1..200b88a 100644 --- a/Spectacle/Stat_desc.ipynb +++ b/Spectacle/Stat_desc.ipynb @@ -3736,19 +3736,19 @@ }, { "cell_type": "code", - "execution_count": 1, + "execution_count": 30, "id": "d06ab865-4832-4fe9-918b-e5ff72bebee4", "metadata": {}, "outputs": [ { "ename": "NameError", - "evalue": "name 'plt' is not defined", + "evalue": "name 'company_campaigns_stats' is not defined", "output_type": "error", "traceback": [ "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", "\u001b[0;31mNameError\u001b[0m Traceback (most recent call last)", - "Cell \u001b[0;32mIn[1], line 2\u001b[0m\n\u001b[1;32m 1\u001b[0m \u001b[38;5;66;03m# Création du barplot\u001b[39;00m\n\u001b[0;32m----> 2\u001b[0m \u001b[43mplt\u001b[49m\u001b[38;5;241m.\u001b[39mbar(company_campaigns_stats[\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mnumber_compagny\u001b[39m\u001b[38;5;124m\"\u001b[39m], \u001b[38;5;241m100\u001b[39m \u001b[38;5;241m*\u001b[39m company_campaigns_stats[\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mratio_campaigns_opened\u001b[39m\u001b[38;5;124m\"\u001b[39m])\n\u001b[1;32m 4\u001b[0m \u001b[38;5;66;03m# Ajout de titres et d'étiquettes\u001b[39;00m\n\u001b[1;32m 5\u001b[0m plt\u001b[38;5;241m.\u001b[39mxlabel(\u001b[38;5;124m'\u001b[39m\u001b[38;5;124mCompany\u001b[39m\u001b[38;5;124m'\u001b[39m)\n", - "\u001b[0;31mNameError\u001b[0m: name 'plt' is not defined" + "Cell \u001b[0;32mIn[30], line 2\u001b[0m\n\u001b[1;32m 1\u001b[0m \u001b[38;5;66;03m# Création du barplot\u001b[39;00m\n\u001b[0;32m----> 2\u001b[0m plt\u001b[38;5;241m.\u001b[39mbar(\u001b[43mcompany_campaigns_stats\u001b[49m[\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mnumber_compagny\u001b[39m\u001b[38;5;124m\"\u001b[39m], \u001b[38;5;241m100\u001b[39m \u001b[38;5;241m*\u001b[39m company_campaigns_stats[\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mratio_campaigns_opened\u001b[39m\u001b[38;5;124m\"\u001b[39m])\n\u001b[1;32m 4\u001b[0m \u001b[38;5;66;03m# Ajout de titres et d'étiquettes\u001b[39;00m\n\u001b[1;32m 5\u001b[0m plt\u001b[38;5;241m.\u001b[39mxlabel(\u001b[38;5;124m'\u001b[39m\u001b[38;5;124mCompany\u001b[39m\u001b[38;5;124m'\u001b[39m)\n", + "\u001b[0;31mNameError\u001b[0m: name 'company_campaigns_stats' is not defined" ] } ], @@ -3915,7 +3915,7 @@ }, { "cell_type": "code", - "execution_count": 44, + "execution_count": 35, "id": "6db089d5-5517-4aee-a5fd-53f20ae3f0d7", "metadata": {}, "outputs": [], @@ -3984,6 +3984,65 @@ "plt.title(\"Boite à moustache du chiffre d'affaire selon les compagnies de spectacles\")" ] }, + { + "cell_type": "code", + "execution_count": 31, + "id": "76e08ece-0b58-4b3a-abca-53e30ccc907b", + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Statistique F : 0.6726212699019267\n", + "Valeur de p : 0.6108808380730608\n", + "Nombre de degrés de liberté entre les groupes : 4\n", + "Nombre de degrés de liberté à l'intérieur des groupes : 764875\n", + "Il n'y a pas de différences significatives entre les entreprises .\n" + ] + } + ], + "source": [ + "#test d'anova pour voir si la difference de chiffre d'affaire est statistiquement significative\n", + "\n", + "from scipy.stats import f_oneway\n", + "\n", + "# Créez une liste pour stocker les données de chaque groupe\n", + "groupes = []\n", + "\n", + "# Parcourez chaque modalité de la variable catégorielle et divisez les données en groupes\n", + "for modalite in products_purchased_reduced_spectacle['number_compagny'].unique():\n", + " groupe = products_purchased_reduced_spectacle[products_purchased_reduced_spectacle['number_compagny'] == modalite]['total_amount']\n", + " groupes.append(groupe)\n", + "\n", + "# Effectuez le test ANOVA\n", + "f_statistic, p_value = f_oneway(*groupes)\n", + "\n", + "# Nombre total d'observations\n", + "N = sum(len(groupe) for groupe in groupes)\n", + "\n", + "# Nombre de groupes ou de catégories\n", + "k = len(groupes)\n", + "\n", + "# Degrés de liberté entre les groupes\n", + "df_between = k - 1\n", + "\n", + "# Degrés de liberté à l'intérieur des groupes\n", + "df_within = N - k\n", + "\n", + "# Affichez les résultats\n", + "print(\"Statistique F :\", f_statistic)\n", + "print(\"Valeur de p :\", p_value)\n", + "\n", + "print(\"Nombre de degrés de liberté entre les groupes :\", df_between)\n", + "print(\"Nombre de degrés de liberté à l'intérieur des groupes :\", df_within)\n", + "\n", + "if p_value < 0.05:\n", + " print(\"Il y a des différences significatives entre au moins une des entrepries .\")\n", + "else:\n", + " print(\"Il n'y a pas de différences significatives entre les entreprises .\")" + ] + }, { "cell_type": "code", "execution_count": 54, @@ -4109,29 +4168,6 @@ "plt.show()" ] }, - { - "cell_type": "code", - "execution_count": 75, - "id": "254875ac-95e4-44fa-9f02-6cec144e4bde", - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "la p-value associé à la stat de fisher est superieure à 5% donc il n y a pas de lien entre les entreprise et le taux de ticket acheté en ligne\n" - ] - } - ], - "source": [ - "#test anova entre les entreprise de spectacle et taux d'achat de ticket en ligne\n", - "import statsmodels.api as sm\n", - "from statsmodels.formula.api import ols\n", - "model = ols('Taux_ticket_internet ~ number_compagny', data=purchase_spectacle).fit()\n", - "anova_table = sm.stats.anova_lm(model, typ=2)\n", - "print(\"la p-value associé à la stat de fisher est superieure à 5% donc il n y a pas de lien entre les entreprise et le taux de ticket acheté en ligne\")\n" - ] - }, { "cell_type": "code", "execution_count": 66, @@ -4160,7 +4196,7 @@ } ], "source": [ - "#repartion Chiffre d'affaire selon le numero de la compagnie\n", + "#repartition Chiffre d'affaire selon le numero de la compagnie\n", "\n", "sns.boxplot(data=products_purchased_reduced_spectacle, y=\"time_between_purchase\",x=\"number_compagny\",showfliers=False,showmeans=True)\n", "plt.title(\"Boite à moustache du temps ecoulés entre le premier et le dernier achat selon les compagnies de spectacles\")" @@ -4185,6 +4221,8 @@ } ], "source": [ + "#test d'anova pour voir si la difference de temps entre le premier et le dernier achat est statistiquement significative\n", + "\n", "from scipy.stats import f_oneway\n", "\n", "# Créez une liste pour stocker les données de chaque groupe\n", @@ -4223,6 +4261,65 @@ " print(\"Il n'y a pas de différences significatives entre les entreprises .\")" ] }, + { + "cell_type": "code", + "execution_count": 33, + "id": "74f06e96-3c25-4eca-8190-25b0a4ab0d75", + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "customer_id int64\n", + "nb_tickets int64\n", + "nb_purchases int64\n", + "total_amount float64\n", + "nb_suppliers int64\n", + "vente_internet_max int64\n", + "purchase_date_min float64\n", + "purchase_date_max float64\n", + "time_between_purchase float64\n", + "nb_tickets_internet float64\n", + "number_compagny int64\n", + "dtype: object" + ] + }, + "execution_count": 33, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "products_purchased_reduced_spectacle.dtypes" + ] + }, + { + "cell_type": "code", + "execution_count": 38, + "id": "20a70ec0-38f6-470e-a442-7884a150613a", + "metadata": {}, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "#Repartition du nombre de canaux de vente selon les entreprise\n", + "plt.figure(figsize=(8, 6))\n", + "sns.barplot(x='number_compagny', y='nb_suppliers', data=products_purchased_reduced_spectacle, ci=None) # ci=None pour ne pas afficher les intervalles de confiance\n", + "plt.title('Nombre moyen de canaux de vente par entreprise')\n", + "plt.xlabel('number_compagny')\n", + "plt.ylabel('Nombre moyen de caneaux ')\n", + "plt.show()" + ] + }, { "cell_type": "markdown", "id": "b9e84af4-a02b-4f83-81ae-b7a73475d060",