Depuis plusieurs mois, Google met en avant sa nouvelle solution de web analyse : Google Analytics 4. Cette version de Google Analytics va progressivement remplacer les précédentes versions et principalement Universal Analytics.
Si vous utilisez Universal Analytics (UA), vous serez contraint de passer à Google Analytics 4 (GA4) avant le 01/07/2023.
En effet, Google communique auprès de tous ses utilisateurs Analytics pour les inciter à démarrer cette migration dès que possible, car il ne sera plus possible d’enregistrer de nouvelles données dans votre compte Universal Analytics après cette date !
De nombreux articles évoquent les raisons de cette migration et les bonnes pratiques en termes de taggage et de paramétrage.
Chez Yumens, nous avons commencé cette migration dès que cela a été possible et nous disposons à présent de nombreux comptes GA4 parfaitement fonctionnels. L’objet de cet article n’est pas de revenir sur la migration en tant que telle, ni sur les recommandations pour que celle-ci se déroule le mieux possible. Non. Je souhaitais évoquer un point précis, dont peu de gens parlent et qui a une incidence forte sur vos rapports et analyses statistiques : le mode de comptabilisation des sessions.
Concrètement, comment étaient comptabilisées les sessions dans Universal Analytics ?
Avant, dans Universal Analytics, et toutes les versions antérieures de Google Analytics d’ailleurs, les sessions étaient comptabilisées de la façon suivante :
- Une nouvelle session était ouverte à chaque fois qu’un utilisateur chargeait une première page vue s’il n’avait pas été actif sur votre site durant les 30 dernières minutes.
- Une nouvelle session était ouverte à chaque fois qu’un utilisateur chargeait une page vue depuis un lien traqué (paramètres de tracking utm_source, utm_medium, utm_campaign)
- Les sessions prenaient fin après 30 minutes d’inactivité.
- Les sessions prenaient également fin à 23H59M59SEC tous les jours.
Ce mode de calcul avait des avantages et des inconvénients.
Parmi les avantages, on peut citer par exemple le fait qu’une session était mécaniquement reliée à une source, un support et une campagne puisqu’une nouvelle session s’ouvrait à chaque première page vue depuis un lien traqué.
En revanche, l’inconvénient principal était de comptabiliser des sessions supplémentaires et artificielles, dans le cas de succession de pages consultées en provenances de différents liens traqués.
Et maintenant, comment sont comptabilisées les sessions dans GA4 ?
À présent, dans GA4, le mode de calcul des sessions fonctionne différemment. GA4 considère chaque interaction comme un événement qu’il enregistre et cela est aussi valable pour les sessions. Par défaut, lorsqu'un internaute consulte une première page sur un site et que cet internaute n’a pas déjà une session en cours, GA4 va collecter un événement “session_start” et va générer un identifiant de session (ga_session_id) basé sur l’horodatage de cette session. Jusque-là, rien de très différent. Cet identifiant de session sera rattaché à chaque évènement que l’internaute fera sur le site jusqu’à ce qu’il y ait une inactivité supérieure à 30 minutes. La principale nouveauté est que cet internaute n’ouvrira pas de nouvelle session s’il vient à nouveau sur le site depuis un lien traqué dans l’intervalle de 30 minutes. Le même identifiant de session lui sera attribué.
Pour comptabiliser le nombre total de sessions, GA4 calcule le nombre de sessions en estimant le nombre d'identifiants de session différents. On notera, au passage, que Google parle d’une “estimation”, ce qui n’était pas le cas dans Universal Analytics.
Et donc ? Cela change quoi dans les rapports GA4 par rapport à Universal Analytics ?
Cette méthode de calcul génère des résultats qui peuvent surprendre, comme vous pouvez le voir ci-dessous avec 407 sessions le 03/02, 446 sessions le 04/02 et un total de 853 heu… non… 849 sessions !
En effet, lorsque vous affichez des rapports qui contiennent plusieurs niveaux de dimensions, par exemple, une répartition par source ou par campagne, le total général de sessions ne correspond pas toujours à la somme de chaque ligne, et c’est normal.
Prenons cet exemple simple :
- à 14:01, un internaute ouvre une nouvelle session sur votre site en provenance d’une campagne emailing
- à 14:02, ce même internaute quitte votre site
- à 14:03, cet internaute recherche votre marque dans le moteur de recherche Google
- à 14:04, cet internaute retourne sur votre site en cliquant sur Google Ads
Bilan dans le rapport Universal Analytics :
- 1 session en provenance de l’email
- 1 session en provenance de Google Ads
Total : 2 sessions
Bilan dans le rapport GA4 :
- 1 session en provenance de l’email
- 1 session en provenance de Google Ads
Total : 1 session !
Comme l’identifiant de session est le même entre les deux sessions et que GA4 comptabilise le nombre d’identifiants distincts : 1+1=1.
Est-ce que cela change l’analyse des données GA4 ?
À petite échelle, cela n’est pas forcément problématique. En revanche, ce changement peut représenter un volume élevé de sessions sur de gros sites dont les sources sont multiples.
Google nous indique donc les informations suivantes dans sa rubrique d’aide Google Analytics : Le nombre de sessions de votre propriété Google Analytics 4 peut être inférieur à celui de votre propriété Universal Analytics. En effet, Google Analytics 4 ne crée pas de session lorsque la source de la campagne change en cours de session, contrairement à Universal Analytics. Si une session s'étend sur deux jours (par exemple, si elle commence à 23:55 et se termine à 00:05), elle est considérée comme unique, même si elle est comptabilisée une fois pour chaque jour.
Concrètement, il y a de grandes chances que vos volumes de sessions (au total) baissent. Par ailleurs, les impacts peuvent être multiples dans vos rapports, à fortiori si vous exportez vos données de Google Analytics 4 (via API ou export fichier Excel/CSV), par exemple :
- Sommer des sessions qui seraient segmentées par leviers ou par campagnes ne vous donnera pas exactement le même résultat que dans vos rapports au sein de GA4
- Sommer des sessions quotidiennes pour obtenir des volumes de sessions mensuelles ne vous donnera pas exactement le même résultat que dans vos rapports au sein de GA4
La métrique “session” est la seule qui change réellement. Ce scope est particulier, car il regroupe différents évènements, et c’est justement la règle de regroupement qui a changé. Il n’y a pas d’impact sur le nombre de conversions, de transactions ou de pages vues, puisque ces métriques ne sont pas des regroupements (1 unité de ces métriques = 1 enregistrement dans GA4). En revanche, il y aura des impacts sur tous les indicateurs qui utilisent les sessions dans leur calcul, comme “pages par session” ou encore “taux de conversion”.
L’attribution ne semble pas impactée. Si un internaute effectue une conversion sur votre site, et que vous avez choisi le modèle d’attribution “Modèles basés sur des règles multicanaux” pour vos rapports, cette conversion sera attribuée à la dernière source de trafic collectée correspondant à la session active, au moment de la conversion. Attention, de nouveaux modèles d’attribution sont disponibles et le modèle par défaut proposé par GA4 n’est pas le même que celui utilisé par Universal Analytics.
À la date à laquelle je rédige cet article, je vois un autre impact, mais pour lequel je n’ai pas encore de certitude et qui semble encore obscure, côté Google. Chez Yumens, nous utilisons beaucoup les chemins de conversions multicanaux dans nos analyses basées sur Universal Analytics. Ces chemins de conversions multicanaux (MCF) correspondent à la succession de sessions ayant, in fine, générées une conversion.
Exemple :
- Un internaute vient le lundi sur votre site depuis un email.
- Cet internaute revient le mardi sur votre site depuis un moteur de recherche Bing
- Cet internaute revient le mercredi sur votre site depuis Facebook
⇒ le chemin de conversion, dans ce scénario, sera : [email > Bing > Facebook]
Pour le moment, GA4 ne propose pas de solution d’extraction des chemins de conversion multicanaux via API, comme c’est historiquement le cas pour Universal Analytics. Pourquoi ? Cela est-il lié à ce nouveau mode de collecte ou de calcul ?
Vous l’aurez compris, cette nouvelle règle est un changement majeur dans le monde de la web analyse, mais qui, finalement, n’aura que peu d’impact pour de nombreux annonceurs. Si l’objectif de votre site est de générer des contacts ou de vendre des produits, les principaux indicateurs ne seront pas impactés. Les KPI les plus importants, qui mettent en relation vos investissements et vos bénéfices (CPL, coût par contact unique, ROI, ROAS, COS) restent inchangés.