Étiquette : Tableau croisé dynamique

Boostez votre productivité avec Power Query : le couteau suisse d’Excel

Boostez votre productivité avec Power Query : le couteau suisse d’Excel

Cela fait maintenant quelques années que Power Query est inclus dans Excel. Il reste toutefois peu exploité. Il faut dire que pour les habitués d’Excel, l’interface de Power Query paraît trop simpliste. Deuxième raison d’une adoption plus limitée : il faut apprendre un nouveau langage pour prendre le contrôle de Power Query. Il s’agit du langage M.

Déjà que maîtriser toutes les formules d’Excel n’est pas chose aisée, pourquoi donc faudrait-il s’intéresser à ce module complémentaire d’Excel qu’est Power Query ? C’est ce que je vais développer dans cet article. Vous y trouverez notamment quelques tutoriels (ou tutorial ?) en français.

Excel et Power Query : Vous ne verrez plus jamais ça !

Avez-vous déjà dû ouvrir un fichier .csv dans Excel et rencontré l’écran ci-dessous ?

Source du fichier utilisé : https://www.data.gouv.fr/fr/datasets/r/bf82e99f-cb74-48e6-b49f-9a0da726d5dc

Vous savez, c’est quand on ouvre un fichier csv ?

Désormais, Microsoft a remplacé l’ancien utilitaire d’importation de fichiers par Power Query justement ! Vous l’avez peut-être déjà utilisé à votre insu en pensant que les bugs étaient corrigés.

Vous devrez importer votre fichier, et non juste double-cliquer dessus (même si le logo d’Excel apparaît sur votre fichier csv…)

Désormais, vous aurez l’interface suivante lors de vos imports de fichiers :

Fichier CSV - Importer - Interface Power Query

Alors, ce serait uniquement cela Power Query ? Un nouvel utilitaire d’import ? Heureusement que non ! Comme je vais vous le présenter dans cet article, Power Query est bien plus puissant que cela. L’import des données est effectivement LE point d’entrée de l’outil. Comme vous allez le voir dans les paragraphes suivants, Excel n’est qu’une source parmi tant d’autres…

Qu’est-ce que véritablement Power Query ?

En résumé

Power Query est une usine de transformation de vos données. Telle une chaîne industrielle, Power Query va opérer une suite d’étapes que vous allez lui demander. Et à chaque fois que vous actualiserez les données dans Excel (ce sera identique avec Power BI), la chaîne que vous avez mise en place va s’exécuter.

En détail

Certains diront qu’il existe déjà les macros pour cela… et ils auront raison et un peu tort quand même. J’ai déjà développé mon point de vue sur le sujet des macros dans Excel et sur les blocages qui sont là et vont continuer sur la sécurité des macros en entreprise. Raison supplémentaire de passer à Power Query et les autres produits de la gamme Power (Power Apps, Power Automate, Power BI notamment).

Là où Power Query se distinguera des macros, c’est que c’est un moteur uniquement fait pour transformer vos données vers un état souhaité. Alors, je comprends que dit ainsi, cela paraît bien abstrait !

Dans les grandes lignes, les possibilités offertes par Power Query, une fois les données importées, seront :

  • Sélectionner les colonnes à conserver ou à supprimer
  • Réordonnancer les colonnes conservées
  • Filtrer les lignes à conserver / à supprimer (en particulier, les doublons, les lignes contenant des erreurs, etc.)
  • Nettoyer les données (les séparer, les convertir, les mutualiser, etc.)
  • Combiner plusieurs sources entre elles (c’est l’un des gros morceaux qu’un simple point ne peut résumer !). Le mot combiner est à prendre dans le sens commun ici. Car au sein de Power Query, le terme Combiner correspond à une action bien spécifique.

Paré pour la suite

Au final, quand vous avez combiné toutes les possibilités, vous disposez d’une machine ultra puissante de préparation de vos données (c’est la première étape clé pour la mise en place des tableaux de bord…).

Avec Power Query, vous pouvez voir plus grand et plus loin que votre seul classeur. Importer des données issues de plusieurs sources est d’une facilité déconcertante !

Vous pourrez disposer d’un fichier de pilotage qui va, à proprement parler, consommer les données dont vous avez besoin et produire de beaux rapports ! Ces données peuvent bien être où elles veulent, tant que vous y avez accès, vous pourrez les importer. Il n’y a qu’à regarder la liste des connecteurs à disposition (nativement !).

Par où commencer et comment apprivoiser l’interface de Power Query

L’import des données est obligatoirement la première étape de tous les traitements. La première fois que vous ouvrirez l’interface, vous aurez une envie irrésistible de saisir vos données ou de les modifier cellule par cellule (comme un bon vieux Excel…). Ne pouvant y arriver, je sais qu’une pointe de frustration et à la limite de rejet peut émerger en vous. Résistez ! Tout ressemble et rien n’est identique à votre interface habituelle d’Excel.

Interface Power Query

Vous verrez des tableaux de données, des menus déroulants avec des filtres à disposition, la possibilité de déplacer vos colonnes, et à ce stade vous ne mesurez pas les conséquences de vos actes.

Chaque action que vous réaliserez dans cette interface représentera une étape qui sera enregistrée automatiquement. Par la suite, elle sera reproduite à chaque rafraîchissement de vos sources de données.

Exemple n°1 : Utilisez Power Query pour importer des données

La première action qui pourra vous interpeler est de devoir importer dans Power Query les données qui se trouvent déjà dans votre classeur Excel. Je comprends bien que cela vous surprenne.

On ouvre l’interface de Power Query depuis Excel et pourtant le premier « ne voit pas » les données du second. Comme nous le verrons dans les paragraphes suivants, Power Query peut importer des données de nombreuses sources différentes. Et hormis la phase d’apprentissage initiale, vous verrez rapidement que la plupart du temps, les données dont vous avez besoin proviendront de sources externes plus fréquemment que vous ne l’imaginez aujourd’hui.

Et tout comme je vous l’ai déjà indiqué, il sera bien plus performant et efficace à termes que les données NE PROVIENNENT PAS du classeur où vos traitements Power Query seront configurés.

Toutefois, pour débuter, ce sera plus simple d’avoir les données et les traitement dans le même classeur. (Pourquoi tant de personnes recherchent « Power Query pour les nuls » ?? On a le droit d’être un débutant sans être qualifié de nul !)

Importer des données qui sont déjà dans votre classeur

Cette option est à privilégier pour débuter son apprentissage de Power Query. Deuxième cas de figure, vous n’allez utiliser Power Query que pour quelques traitements simples et rapides.

Je vous avertis tout de même : on commence toujours petit et avant de s’en être rendu compte, on a construit une usine à gaz. Et ensuite, changer les modalités d’import peut être cavalier pour un débutant. Aussi, je me dois de vous prévenir que c’est faisable, à condition d’en mesurer les conséquences et disposer du savoir-faire.

Étape n°1 : Onglet « Données » puis « À partir de Tableau ou d’une Plage »

Power Query - Importer des données déjà présentes dans le classeur
Power Query – Importer des données déjà présentes dans le classeur

Le dernier encadré est très important à bien lire. Un tableau Excel est un objet bien particulier qui diffère des simples cellules mises en forme pour avoir l’apparence d’un tableau.

Un objet tableau dans Excel dispose d’un nom réutilisable dans des formules, les formules faisant références aux données du tableau n’utiliseront plus les n° de lignes ou nom de colonne « A, B, C… » mais le nom de la colonne. Et si des cellules sont fusionnées, elles seront « défusionnées ».

Étape n°2 : Création d’un tableau à partir de vos données et ouverture de Power Query Editor

Power Query - Importer depuis une plage - Créer un tableau
Power Query – Importer depuis une plage – Créer un tableau

À ce stade, Excel vous propose de créer un tableau comme indiqué dans le titre en (1) (seulement si vous n’êtes pas déjà dans un tableau).

Veillez bien à la seconde partie (2) : Mon tableau comporte des en-têtes.

Cela pourrait ne pas être le cas ! Certains fichiers de données brutes ne disposent pas de noms de colonnes. Si vous êtes dans cette situation et que vous maintenez cette case cochée, vous perdrez les données de la première ligne. Celles-ci devenant de facto l’en-tête du nouveau tableau.

Si vous décochez cette case, Excel vous créera une ligne d’en-tête avec des noms d’une créativité incroyable : Colonne1, Colonne2, etc. Mais au moins, vous ne perdrez aucune donnée !

Étape n°3 : Apprivoiser l’interface de Power Query Editor

Power Query - Interface édition
Power Query – L’interface d’édition

Ici, vous croyez retrouver un pseudo Excel… et c’est tout sauf la même chose !

Décomposons l’interface
  1. Les onglets et le ruban
  2. Les données dans l’état de l’étape sélectionnée (vous comprendrez par la suite…)
  3. Les requêtes Power Query disponibles dans ce classeur
  4. Les étapes de transformation

Que s’est-il passé jusqu’à présent ? Vous avez créé une requête d’import des données auxquelles vous avez déjà accès dans le classeur. Si par mégarde, vous cliquez sur le bouton « Fermer et charger », vous aurez la chance d’avoir un nouveau onglet nommé « Tableau1 » avec la copie de toutes vos données.

Normal, vous n’aurez pas utilisé une seule des possibilités offertes par Power Query ! Il faudra maintenant ajouter des étapes de traitement de vos données pour que cela en vaille la peine.

Par exemple, vous pourriez « Trier » vos données par total des ventes de manière décroissante et ne conserver que les 5 premières.

Voyons ce que cela donne
Power Query - Trier et filtrer les lignes
Power Query – Trier et filtrer les lignes

On voit qu’à droite, deux nouvelles étapes se sont ajoutées à la liste : « Lignes triées » et « Conserver les premières lignes ». J’avais au préalable sélectionné la colonne « Sales » pour réaliser ces opérations.

Sauf que maintenant, si je clique sur « Fermer et charger », seules 5 lignes vont être importées dans le nouvel onglet d’Excel. Et par n’importe lesquelles, celles des 5 ventes les plus importantes.

Pas de formule, pas de fonctions avancées, jusque 4 clics et l’affaire est dans le sac !

Et que se passera-t-il si vous ajoutez des données à votre tableau initial ? Vous n’avez qu’à faire un essai, ajoutez de nouvelles lignes, cliquez sur « Actualiser tout » dans l’onglet « Données » et voyez le résultat !

Importer des données depuis des fichiers (CSV, txt)

Idéalement, il est préférable d’avoir un fichier qui fait office de tableau de bord qui soit séparé des sources de données. C’est pourquoi, je vous recommande de ne plus ouvrir les fichiers contenant les données, mais de les importer à l’aide de Power Query.

Ainsi, lorsque vous aurez de nouvelles données à analyser, vous n’aurez qu’à actualiser votre import et tous vos rapports seront à jour et actualisés.

Étape n°1 : Onglet « Données » puis « À partir d’un fichier texte/CSV »

Power Query - Importer depuis un fichier csv
Power Query – Importer depuis un fichier csv

Rendez-vous dans l’onglet « Données » puis cliquez sur « À partir d’un fichier texte/CSV » et enfin, sélectionnez votre fichier à importer.

Étape n°2 : Contrôlez les modalités de l’import et la qualité de la prévisualisation

Au moment de sélectionner votre fichier CSV à importer, l’écran suivant apparaît. Étudions-le attentivement :

Power Query - Interface import
Power Query – Interface import
1. Contrôler l’encodage (Origine du fichier)

Ce qui fait qu’un caractère accentué comme « é » apparaissent comme suit : « Ã© », c’est ce qu’on nomme son encodage. C’est à dire, la langue avec laquelle le fichier a été enregistré sur le disque de l’ordinateur. Et lorsqu’on n’indique rien, c’est un peu le jeu de la chance, soit c’est dans la langue la plus parlée (UTF-8), soit c’est celle de Windows (ANSI). Et les deux langues ne sont pas identiques.

Ici, Power Query présence en (1) ce qu’il nomme « Origine du fichier », et on voit qu’il a reconnu UTF-8. Quelle que soit la proposition, vous pouvez la changer tout de suite ou plus tard. Par principe, le plus tôt sera le mieux !

2. Contrôler le délimiteur

Là, Power Query a fait bien des progrès par rapport au module d’import d’Excel. En général, il ne se trompe pas. Toutefois, selon vos données, cela pourrait être une virgule, des tabulations ou comme dans l’illustration, un point-virgule.

Vous avez aussi la possibilité d’indiquer un autre séparateur et de voir ce que cela donnerait dans la prévisualisation.

3. Plage de contrôle des types de données

Les types de données sont importants pour Power Query. Si vous avez besoin de déterminer une année à partir d’une des colonnes, celle-ci doit obligatoirement être une date, sinon, vous aurez un message d’erreur. Comme le chargement et l’analyse de l’ensemble des données importées pourrait être chronophage, ici, Power Query vous propose de n’analyser que les 200 premières lignes pour déterminer le type de chaque colonne. (le choix se situe principalement entre Texte, Nombre entier, Nombre décimal, Date, Booléen, Pourcentage).

In fine, pas d’inquiétude, tout sera modifiable et corrigeable si besoin par la suite. Disons que tant qu’à travailler, autant bien commencer !

Importer depuis un dossier

Pour le cas de l’import depuis un dossier, en réalité, il s’agira de fusionner au moins deux fichiers de même nature et structurée de la même manière.

Et pour cela, l’article sur comment fusionner plusieurs fichiers Excel vous explique tout !

Power Query va plus loin ! Il peut importer des données depuis un fichier PDF ou depuis une image

Eh oui ! Power Query peut enfin faire ce que vous avez tenté des dizaines de fois avec l’espoir que « Cette fois, ça va fonctionner ! » à savoir copier un tableau depuis un fichier PDF et le coller dans Excel.

Power Query peut importer dans Excel les données tabulaires de votre fichier PDF avec une grande facilité. Il faut que votre fichier PDF soit bien un PDF Texte. C’est à dire qu’il n’est pas le fruit d’une numérisation. Sinon, autant faire l’import d’une image !

Oui, vous avez bien lu, on peut faire de la reconnaissance de caractère depuis Excel, en particulier si vos données sont dans un tableau. La performance de la reconnaissance dépendra de la qualité de votre image.

Comment fait-on tout cela ?

Tout est dans la vidéo ci-dessous :

Exemple n°2 : Traitez de plus grandes quantités de données à l’aide de Power Query qu’avec Excel

Non, 1’048’576 ne représente pas la limite du nombre de lignes qu’Excel peut traiter. À l’aide de Power Query, Excel pourra analyser plusieurs millions de lignes de données !

Attention, traiter ne signifie pas importer ! Alors, à quoi cela peut-il bien servir me direz-vous ?

Eh bien, entre nous, lorsqu’on a besoin d’analyser plus d’un million de lignes de données, c’est rarement pour les étudier une par une. Il s’agira ici nécessairement de créer des tableaux croisés dynamiques (voir des tableaux de bords).

Nous avons vu ensemble dans le paragraphe précédent qu’il était possible d’importer et de fusionner toutes les données se trouvant dans les fichiers d’un dossier.

Et même avec un unique fichier de plusieurs millions de lignes, l’erreur à ne pas commettre, serait de vouloir visualiser les données à analyser. Vous n’avez réellement besoin que de les analyser. En cas de nécessité, vous pourrez voir le détail.

Exemple avec un fichier CSV volumineux

Si vous tentez d’ouvrir un fichier disposant de plus d’un million de lignes, vous aurez droit au message suivant :

Fichier CSV trop volumineux - Message avertissement / erreur
Fichier CSV trop volumineux – Message avertissement / erreur

Pour vous le prouver, voici le même fichier ouvert à l’aide de Notepad++ :

Fichier CSV volumineux - Illustration dans Notepad++
Fichier CSV volumineux – Illustration dans Notepad++

Comment traiter ce fichier volumineux seul ou suite à la compilation des fichiers dans un dossier à l’aide de Power Query ?

Au moment d’importer vos millions de lignes de données, vous devrez bien ouvrir vos yeux ! Une petite option cachée de prime abord est là pour vous aider !

Il s’agit du menu déroulant présent à côté du bouton « Charger » :

Power Query - Menu charger dans

Regardez bien de plus près :

Menu charger dans - Zoom

Et ce petit menu va vous donner l’accès au menu suivant :

Importer les données directement dans un TCD
Importer les données directement dans un TCD

Comme indiqué, vous pourrez importer les données dans un tableau croisé dynamique directement !

Et vous verrez ensuite ce menu apparaître sur la droite :

Power Query - Importer fichier de plusieurs millions de lignes
Power Query – Importer fichier de plusieurs millions de lignes

Pendant l’import, le nombre de lignes importées va croître et dépasser allègrement le million de lignes permis dans une feuille de calcul Excel.

Merci Power Query !

Exemple n°3 : Réduisez les erreurs dans vos données à l’aide de Power Query (en améliorant leur qualité avant de les traiter !)

Avec les exemples précédents, nous avons vu que Power Query est votre super-assistant d’accès aux données. Et ce, même si vous avez plusieurs millions de lignes de données à traiter.

À partir d’ici, je vais vous initier aux autres possibilités de cet outil. Vous allez désormais pouvoir automatiser les traitements que vous faisiez manuellement.

Qu’est-ce qu’une donnée de mauvaise qualité ?

La qualité de vos données est essentielle pour débuter leurs analyses. Si vous avez déjà rencontré l’une des situations suivantes, alors, vous allez adorer ce qui suivra…

1. Des caractères espaces inutiles au début ou à la fin dans une cellule.

Cela empêche en plus Excel de reconnaître le type de données et d’adapter la mise en forme convenablement. Par exemple en nombre décimal ou en date.

2. Des sauts de lignes d’origine inconnue.

Au moment où vous analysez vos données à l’aide d’un tableau croisé dynamique, vous trouvez qu’il y a quelque chose qui cloche… jusqu’à ce que vous vous rendiez compte qu’à cause des lignes vides, toutes les données n’ont pas été incluses dans l’analyse !

3. Des cellules qui contiennent deux données au lieu d’une !

C’est parfois ce qui arrive quand on fait un export de données depuis un ERP. Vous devez encore retraitez cette cellule, le plus souvent avec des formules, pour séparer toute une colonne en deux colonnes.

4. Des noms de colonnes très techniques et peu compréhensibles pour les néophytes.

Vous devez à chaque fois, renommer vos colonnes pour les rendre compréhensibles dans le rapport.

5. Le pire de tous : les lignes incomplètes

Parfois, les outils qui exportent les données ne remplissent pas toutes les valeurs s’il n’y a pas de changement d’une ligne à l’autre. On peut avoir par exemple, la date d’une vente qui n’est présente en première colonne que lorsqu’on change de jour de l’écriture. Il vous faut faire de nombreuses manipulation pour compléter chaque ligne…

6. D’autres idées ?

D’autres cas de mauvaise qualité des données existent (d’ailleurs, vous pouvez me les proposer en commentaire de cet article) et vous font perdre un temps précieux à chaque fois.

Eh bien, tous ces cas de figure sont automatisables en quelques clics à l’aide de Power Query !

Mais le plus beau dans l’histoire, c’est qu’une fois que vous avez construit vos étapes de nettoyage. Vous n’avez plus jamais à vous en soucier !

Améliorer la qualité de vos données à l’aide des premières fonctions de Power Query

Je vous propose l’illustration ci-dessous avec la même numérotation que les points soulevés précédemment.

En choisissant dans le ruban, l’onglet « Transformer« , vous aurez accès aux fonctionnalités ci-dessous :

Power Query - Fonctionnalités simples
  1. En sélectionnant la ou les colonnes de votre choix et en cliquant sur « Format » puis « Supprimer les espaces« . Vous aurez déjà réglé le premier point.
  2. Dans cette interface, le filtre d’une colonne n’agit pas exactement comme dans Excel. Ici, quand vous filtrez quelque chose (par exemple en supprimant les lignes vides), vous ajoutez une étape automatisée de suppression des lignes vides ! Eh oui, c’est tout !
  3. « Fractionner la colonne » va automatiser le fait de séparer une colonne avec des données en autant de colonnes que d’occurrence du séparateur choisi. Parfois ce sera un caractère tabulation, parfois ce sera un caractère dièse, ou ce que vous souhaitez ! Et voilà !
  4. Ici, si vous double-cliquez sur un nom de colonne et changez son nom, vous n’avez pas simplement changé de nom. Vous avez automatisé le renommage depuis votre fichier source. Ce dernier n’a pas bougé. En revanche, lors de l’utilisation dans Excel, seul le nom que vous aurez choisi apparaîtra !
  5. Last but not least ! Vous pouvez compléter toutes les cellules qui seraient vides à partir de la cellule la plus proche qui a des données. En clair, si vous reprenez l’exemple avec la date (au paragraphe précédent), toutes les cellules vides peuvent être complétées en un clic !

Exemple n°4 : Simplifiez vous la vie avec toutes les données de type date et heure à l’aide de Power Query

Mise en situation des problèmes potentielles avec les dates et les heures

Les données de type date sont certainement celles qui ont donné et qui continueront de donner de nombreux maux de têtes à ceux qui les manipulent…

Entre les formats américains et européens, les séparateurs entre les jours, les mois et les années des plus exotiques ou encore des formats étranges, il vous faut souvent bien de la patience pour les rendre utilisables.

Et je ne vous parle pas des configurations régionales de votre ordinateur ! Car oui, selon la configuration de votre système d’exploitation, Excel va traiter différemment les données que vous allez lui fournir !

En résumé, les sources de difficultés peuvent être :

  • L’ordre dans lequel une date vous est transmises (12.31.2025 ou 31.12.2025). Dans cette situation, c’est encore facile à identifier, mais 8.9.2025, c’est le 8 septembre ou bien le 9 août ?
  • Le choix du séparateur de date entre celui fourni et celui de votre système… Dans l’exemple précédent, j’ai choisi le symbole « . » et non « / » comme c’est le cas en France habituellement. Comment Excel va réagir ?
  • Parfois, les dates viennent au format année puis mois puis jour : 2025.12.31. C’est plus clair pour identifier les composantes de la date, mais comment Excel va l’interpréter ?
  • Il y a également les dates « techniques » qui inclut l’heure et le décalage horaire par rapport à l’heure universel UTC : 20251231T12:42-0500

Comment Power Query peut vous simplifier la vie ?

Avant que vous découvriez Power Query pour traiter vos données de type date, vous pouviez tenter d’écrire des formules complexes afin d’identifier dans quel cas vous vous trouviez.

Maintenant, quelques clics suffisent !

Il suffit de regarder les différences entre import via Power Query ou ouverture direct du même fichier CSV (Lien vers le fichier utilisé dans l’illustration) :

Power Query - Différences traitement dates avec Excel

Et ce n’est pas tout ! Grâce aux fonctions intégrées à Power Query, vous pourrez extraire l’année, le mois, le jour d’une date en deux clics. En à peine plus de clics, vous pourrez intégrer des dates aux formats régionaux exotiques à votre format. Et enfin, faire la différence entre deux dates ou entre deux heures ! (même si je vous explique en détail comment ajouter des heures avec Excel ou comment calculer un âge avec Excel, avec Power Query, ce sera plus rapide !).

Exemple n°5 : Ajoutez, Fusionner, Étendez vos données à l’aide de Power Query au lieu de vos formules Excel

À l’aide de ces autres fonctionnalités, vous allez goûter au véritable potentiel de Power Query ! Je dois d’abord redéfinir certains termes. En effet, entre la vie de tous les jours, Excel et Power Query, certains termes ne signifient pas la même chose…

Ajouter des données avec Power Query

Lorsqu’on vient du monde Excel, « ajouter » signifie faire une addition. Dans Power Query, pas du tout… « Ajouter des données » signifie « empiler des données » dans un tableau unique.

Power Query - Ajouter des données

Cette opération sert à mutualiser dans une table unique des données issues de sources souvent différentes.

Cas d’usage type : Sortir une liste unique de fournisseurs (ou de clients) en mutualisant des données issues de deux logiciels différents.

Il faudra souvent ajouter une étape de suppression des doublons pour obtenir la liste mutualisée. À l’inverse, vous pourriez souhaiter identifier les doublons, et pour cela, vous sélectionneriez conserver les doublons.

Fusionner des données avec Power Query

Dans Excel, nous n’avons pas l’habitude de fusionner les données… plutôt des cellules. En revanche, on a souvent besoin de compléter nos données à partir d’un identifiant. En clair, lorsqu’une commande contient un code fournisseur, parfois, on souhaite récupérer son nom et son adresse par exemple.

Dans Excel, c’est la fameuse fonction RECHERCHEV() qui réalise cette opération. En passant, je vous recommande d’utiliser la nouvelle fonction RECHERCHEX() (si vous disposez d’une licence Excel 2021 ou Excel 365). Deuxième info en passant, voici comment faire une RECHERCHEV avec plusieurs critères.

Avec Power Query, si vous souhaitez faire cette opération, alors vous devrez fusionner vos données.

Power Query - Fusionner données
Power Query – Fusionner données

Je ne rentre pas ici dans les détails de toutes les options. La fusion entre deux tables offre des options avancées qui mériteraient des explications plus détaillées… Le choix du symbole multiplier n’est pas anodin.

Power Query - Fusionner des données - Type de jointure

Étendez vos données avec Power Query

On vient de voir précédemment qu’il est possible de fusionner ses données entre elles. D’une certaine manière, vous venez en quelques clics d’enrichir vos données. Et que se passerait-il si vous aviez accès à d’autres données ? Que vous pouviez les connecter avec celles que vous possédez déjà ?

Connaissez-vous les API ? Les « Application Programming Interface » ? Dans la langue des informaticiens, cela veut dire : accéder à un logiciel et à ses fonctionnalités à l’aide de la programmation. Si vous remettez dans le contexte, ici, il ne s’agit pas de faire ses courses en lignes, mais plutôt d’accéder à des données.

Une mine de données se trouvent par exemple sur le site https://data.gouv.fr. De là, vous pouvez connecter directement votre fichier Excel aux données actualisées du site officiel !

Conclusions sur Power Query

Vous avez vu tout au long de cet article, des illustrations, des exemples et une courte présentation de l’interface. Power Query est véritablement une plateforme à maîtriser (et si vous EXCELLER avec, c’est mieux !).

Je n’ai pas la possibilité dans un seul article de développer toutes les possibilités. Et l’une mériterait pourtant un développement, Power Query est le préparateur caché de Power BI !

Ainsi, si vous souhaitez rentrer dans l’univers de Power BI, vous aurez un passage obligé par Power Query ! Et si vous êtes prêt à découvrir Power BI, il ne reste qu’à vous inscrire à la liste d’attente ci-dessous :

Prenez

le prochain départ vers

un nouveau monde

Tous vos commentaires sont les bienvenus pour enrichir l’article, partager vos expériences !

Le tableau croisé dynamique pour les nuls : c’est fini !

Le tableau croisé dynamique pour les nuls : c’est fini !

Ce nouvel article « le tableau croisé dynamique pour les nuls » vient en complément de l’article « Réussir son premier tableau croisé dynamique« . Après avoir lu l’article, vous saurez faire la différence entre les tableaux d’Excel simples et les Tableaux Croisés Dynamiques (TCD) !

Tableau croisé dynamique pour les nuls : Poser les bases

Excel est un tableur. Au départ, il a été conçu pour manipuler des données sous forme de tableaux : des lignes et des colonnes de valeurs.

Qui dit manipuler, dit faire des opérations avec ces données. On peut les compter, les additionner, les soustraire, etc.

Pour cet objectif, Excel propose toute une panoplie de fonctions (J’en ai dénombré 480 sur la page officielle de Microsoft). Avec toutes celles-ci, on pense qu’il doit bien exister une fonction pour chacun de nos besoins.

C’est justement sur ce dernier mot qu’il faut s’arrêter : nos besoins !

Définir ses besoins avant d’expliquer les tableaux croisés dynamiques (pour les nuls et pour les autres !)

Comme une image vaut mieux qu’un long discours, prenons un exemple de tableau. À partir de là, nous pourrons déterminer les différents besoins.

Voici un fichier exemple que vous pouvez récupérer sur le site de Microsoft.

Fichier exempleTCD – Fichier exemple

Vous avez ici des chiffres de ventes par branche, par pays, par produit et par date. Avec toutes ces données, on peut imaginer un bon nombre d’analyses à réaliser…

Commençons par un besoin « simple »

Votre responsable vient vous voir et vous demande : « Peux-tu me faire le top 5 des pays où nous vendons le plus ? ».

À cet instant, votre cerveau commence à entrer en ébullition…

Alors d’abord, il faudrait que je fasse un tri par pays… Ensuite, il faudra que je fasse le total pour chacun d’entre eux. Après je pourrai le noter dans une liste et faire un tri sur le total.

Entre nous, cela fait déjà pas mal de manipulations à faire pour juste « un top 5 », vous ne trouvez pas ?

Excel ne recèlerait pas une fonction pour faire cela en quelques clics ? Vous me voyez venir ? Mais d’abord, continuons avec un besoin plus élaboré.

Et si la demande était plutôt… celle-ci

« J’aurais besoin de l’évolution des ventes par produit, par pays et par mois »

Là, vous vous dîtes que cela va certainement vous prendre des heures de construire manuellement ce type de tableau. Consolider tous les chiffres manuellement prendra du temps.

Même si des fonctions Excel existent pour vous aider à cela, à chaque fois, il faut un peu de temps pour construire votre tableau.

>> Je vous propose d’ailleurs d’essayer par vous-même de répondre à cette demande sans les tableaux croisés dynamiques. Ainsi même les « nuls » (je préfère quand même l’expression « à qui on n’a jamais expliqué comment ça fonctionne ») auront une solution dans cette situation.

Le tableau croisé dynamique aurait toutes les réponses ? (pour les nuls et pour les autres !)

Contrairement au tableau contenant les chiffres de ventes, un tableau croisé dynamique (TCD) ne permet pas de saisir de valeur. Un TCD a BESOIN d’un simple tableau de valeurs pour fonctionner. Il va puiser toutes ses données de ce dernier.

Un TCD sert à faire toutes les consolidations automatiquement. Le mot « dynamique » vient d’ailleurs de là. Derrière le mot « consolidation », il faut comprendre la liste des opérations ci-dessous :

Tableau croisé dynamique pour les nuls - Opérations de consolidationTableau croisé dynamique pour les nuls – Opérations de consolidation

Un autre nom, plus pompeux certes, mais peut-être plus clair, serait « tableau consolidant automatiquement les valeurs d’un autre tableau selon les axes sélectionnés par l’utilisateur ». Finalement, on va s’en tenir à TCD, OK ?

Passer au tableau croisé dynamique pour tous

Récapitulons ce que vous devez avoir appris jusqu’ici :

  1. Un TCD a besoin d’un tableau normal avec des données pour fonctionner.
  2. Un TCD n’est pas modifiable. Son contenu n’est que le résultat d’une consolidation des données du tableau source.
  3. Il faut établir la question à laquelle on souhaite répondre avant de construire un TCD.

Sur ce dernier point, il faut être clair. On ne peut avec un seul tableau répondre à deux questions différentes.

Un tableau croisé dynamique répond à une question. Deux questions = Deux TCD.

Charles Exceller

Déterminer le top 5 des pays où il y a eu le plus de ventse et présenter l’évolution des ventes par produit, par pays et par mois n’est pas la même chose.

Voici donc un nouvel apprentissage : vous devrez construire autant de TCD que vous avez de questions ! Mais, rassurez-vous, Excel sait faire cela parfaitement ! C’est la mémoire de votre ordinateur qui fera défaut avant Excel, je vous l’assure !

Passer de l’idée à l’action : Dessinez votre tableau croisé dynamique !

Avant de commencer à jouer avec l’objet dans Excel, prenez une feuille à côté de vous et représentez la réponse à votre question.

PaysVentes
pays 11’234 €
pays 22’345 €
etc.x’xxx €
Représentation cible de notre futur tableau croisé dynamique

À partir de ce moment, vous êtes prêt à construire votre premier tableau croisé dynamique.

On pourra noter qu’en ligne se trouvent les pays, et les valeurs qui nous intéressent sont les sommes des ventes.

Deuxième question, deuxième représentation :

ProduitPaysMois 1Mois 2Total
Article 1
Pays 112 €23 €35 €
Pays 245 €56 €101 €
Article 2
Représentation cible du futur 2e tableau croisé dynamique

Première observation, ce tableau n’a rien à voir avec le premier. Vous comprenez donc aisément qu’un deuxième TCD est nécessaire pour le représenter.

Vous noterez les éléments suivants :

  1. Le nombre de lignes est déterminé par le nombre de produits puis par le nombre de pays.
  2. Les colonnes contiennent les mois.
  3. Les valeurs représentées sont les sommes des ventes (correspondantes au mois, au produit et au pays donnés).

En représentant ce tableau, vous pourriez vous rendre compte qu’il manque l’indication de l’année. Si vos données contiennent des valeurs sur plusieurs années, les ventes pourraient concerner tous les mois de janvier (toutes années confondues). Ce point doit rester à votre esprit. Attendons de voir comment Excel se comporte.

Créez votre tableau croisé dynamique

Maintenant que vous avez les idées claires sur votre tableau (ou vos tableaux) cible, vous pouvez prendre les rênes des TCDs.

Cliquez sur « Insertion » dans le ruban, puis cliquez sur « Tableau croisé dynamique ».

Tableau croisé dynamique pour les nuls - Insérer votre TCDTableau croisé dynamique pour les nuls – Insérer votre TCD

L’écran suivant apparaît alors :

Tableau croisé dynamique pour les nuls - Sélection des donnéesTCD – Sélection des données

Plusieurs observations sur cet écran :

  1. Excel essaie de détecter automatiquement le tableau qui sera la source de votre TCD. Il peut être juste comme faux. Toujours vérifier.
  2. Sur votre feuille de données, la source de données se trouve encadrée par des pointillés verts (cf. zoom de la capture d’écran). C’est un autre moyen de vérifier que toutes vos données sont correctement sélectionnées.
  3. Par défaut, Excel insérera votre TCD sur une nouvelle feuille de calcul. Ne soyez pas surpris.

Tableau croisé dynamique pour les nuls - Composition de votre feuilleTCD – Composition de votre feuille

Votre nouvelle feuille se composera de trois zones :

  1. À cet emplacement, se trouvera votre tableau résultat. Cette zone ne servira qu’à quelques actions limitées (filtrer et trier).
  2. Ici, vous verrez l’ensemble des colonnes de votre tableau source. Ce sont celles que vous pourrez utiliser pour construire votre TCD. Si une colonne manque à l’appel, vérifier à nouveau votre source, contient-elle bien toutes les colonnes ?
  3. La clé de voûte de votre TCD se trouve ici. Vous construirez ici le contenu des lignes, des colonnes ou des valeurs de votre TCD.

Répondre à notre première question : le top 5 des pays par volume de ventes

Si vous remontez de quelques paragraphes, lorsque je vous ai demandé de dessiner votre tableau cible, j’ai décrit ce tableau d’une manière particulière. J’ai mis l’accent sur les données qui se trouvaient en lignes, en colonnes ou en valeurs.

C’était une manière d’introduire ce qu’il vous reste à faire. Glissez-déposez simplement les colonnes de votre tableau source (en 2) vers les emplacements correspondants (en 3).

Vous obtiendrez pour la première question (le top 5 des pays) le tableau suivant :

Tableau croisé dynamique pour les nuls - Première réponseTCD – Première réponse

Nous avons une petite chance ici, car il n’y a que 5 pays dans la source de données, sinon, quelques clics supplémentaires auraient été nécessaires… 😉

Par ailleurs, j’ai dû mettre en forme les valeurs sous forme monétaires (onglet Accueil, format nombre comptabilité). Souvent, Excel saura reconnaître le bon format des données.

Répondre à notre deuxième question : Les chiffres de ventes des produits, par pays et par mois.

Comme annoncé, vous aurez à insérer un nouveau TCD. Après l’avoir fait, vous aurez à réaliser les opérations suivantes :

  1. Glissez-déposez d’abord les produits, puis les pays en lignes.
  2. Passez ensuite aux ventes vers les valeurs (Sales)
  3. En dernier, placez la date en colonnes.

Vous verrez alors le résultat suivant :

Deuxième réponseTCD – Deuxième réponse

Notez qu’en 4, Excel a reconnu automatiquement que la colonne « Date » contenait effectivement des données de dates (Excel ne se fie qu’au contenu, pas au nom…). Et réalise automatiquement des regroupements par année et par trimestre !

En plus, votre tableau contient des sous-totaux intermédiaires et les totaux par lignes et par colonnes ! Que demander de plus ! Tous ces résultats consolidés en quelques clics…

Merci les tableaux croisés dynamiques ! Pour ceux qui le souhaitent, vous pouvez télécharger le fichier résultat ou encore continuer votre lecture avec « Réussir son premier tableau croisé dynamique« .

Je vous présente également dans cette vidéo un autre exemple d’utilisation des tableaux croisés dynamiques avec les données sur le Covid-19 mis à disposition par le gouvernement via https://data.gouv.fr.

https://www.youtube.com/watch?v=H0iao5mAtcs

Réussir son premier tableau croisé dynamique avec Excel !

Réussir son premier tableau croisé dynamique avec Excel !

Tous les débutants ont entendu parler du fameux “Tableau croisé dynamique” dans Excel (TCD pour les intimes, et Pivot Table pour les anglosaxons). Je vous propose dans ce tutoriel de vous initier et vous accompagner dans vos premiers pas. D’autres articles suivront pour aller le plus loin possible.

Menu Insertion - Tableau croisé dynamique

Introduction

Excel est connu pour permettre de stocker des listes sans fin (enfin si, 1’048’576 lignes et 16’384 colonnes exactement). Une fois ces données saisies ou importées, on peut les mettre dans des tableaux, les filtrer, les mettre en forme, faire toutes sortes de calculs. Et c’est déjà pas mal.

Jusque là, Excel fait un travail de tableur tout à fait honorable. Mais il n’aurait sans doute pas eu le même succès sans les fonctions d’analyse comme la fonction « tableau croisé dynamique » (par la suite, j’utiliserai son petit nom : TCD).

Une fois que vous y avez goûté, que vous avez compris la puissance que vous pouviez en tirer, il n’y a rien à faire, dès que vous voyez un tableau de données, vous ne pensez qu’à ça… Alors, allons-y !

Étape 0 : À quoi ça sert un TCD (Tableau Croisé Dynamique) dans Excel ?

J’aurais bien envie de vous dire “A croiser les données !”, mais ce serait un peu léger comme explication…

Cela sert à faire des résumés consolidés de vos données. Qui dit résumé, dit qu’il faut de la matière au départ. Et ici, notre matière, ce sont les lignes de données d’un tableau. Selon votre contexte et votre usage, cela peut être des listes de factures ou de commandes, des listes d’articles, de projets, de résultats sportifs ou toute autre liste.

En général, chacune des lignes de valeur dispose d’une information du type « catégorie”, “lieu”, “date”, etc. Et on se pose quelques questions sur cette masse d’information, par exemple :

  1. Quelle est la somme des factures par pays ?
  2. Combien d’articles ont été vendus par mois ?

Sans le tableau croisé dynamique d’Excel, vous êtes condamnés à faire de nombreuses manipulations !

Et vous devrez faire ceci pour chacun des résultats recherchés, et, selon votre activité et vos besoins, recommencer tous les mois, ou pire, toutes les semaines ou même tous les jours !

Alors qu’un TCD vous donnera l’information en quelques secondes, le temps de quelques clics. En plus, vous pourrez simplement rafraîchir le résultat pour que toutes les valeurs se mettent à jour automatiquement.

Désormais, vous êtes prêt à aller plus loin, passons à la première étape.

Si vous pensez que vous avez besoin de plus d’explications, j’ai rédigé un second article qui détaille encore plus les objectifs d’un tableau croisé dynamique. Je l’ai humblement nommé le tableau croisé dynamique pour les nuls.

Vous pourrez ensuite reprendre le fil de cet article.

Étape 1 : Préparez vos données

Excel est un outil qui demande de la rigueur ! Il y a des règles à respecter afin que l’outil vous donne tout ce qu’il a dans le ventre. Je vous rassure, cette préparation n’a rien de très surprenant, et par la suite, vous transformerez ces bonnes habitudes en réflexes.

Voici la liste des actions minimales et obligatoires de préparation :

  1. Chaque colonne de votre tableau doit posséder un intitulé
  2. Chaque intitulé doit être unique
  3. Votre tableau ne contient pas de lignes ou de colonnes fusionnées
  4. Des données sont présentes à toutes les lignes (pas de saut de ligne pour aérer ou “faire joli”)

La liste des actions supplémentaires suivantes n’est pas obligatoire pour débuter avec la fonction tableau croisé dynamique d’Excel.

Toutefois, pour exploiter les TCD au mieux, je vous les recommande :

  1. Pour les valeurs vides, laissez le champ réellement vide et n’écrivez pas N/A par exemple
  2. Respectez un formatage homogène des dates et reconnu par Excel en tant que date
  3. Donner des noms de colonnes qui sont parlants pour vous sur la nature des contenus
  4. Soignez la saisie des valeurs textuelles en restant homogène (“Paris”, “paris”, “PARIS” ne sont pas homogènes)

Étape 2 : Vous êtes prêt à créer votre Tableau Croisé Dynamique

Je vous propose d’utiliser les données publiques de la liste des localisations des musées de France. Nous chercherons à trouver le nombre de musées par région et par département.

Une fois le fichier téléchargé, enregistré sur votre ordinateur et ouvert dans Excel, vous pouvez poursuivre.

Dans l’onglet Insertion, cliquez sur “Tableau croisé dynamique” :

Menu Insertion - Tableau croisé dynamique

La fenêtre suivante apparaît :

Créer un tableau croisé dynamique

Si vous curseur est positionné sur une des valeurs de votre tableau, Excel le détecte et présélectionne l’ensemble des colonnes et lignes de votre tableau. C’est à ce moment que l’absence de lignes vides est essentielle. Car Excel peut identifier cette ligne vide comme une indication de fin du tableau.

Pour vos premiers pas, je vous invite à vérifier que l’ensemble du tableau est correctement présélectionné en déplaçant les ascenseurs verticaux et horizontaux avec la fenêtre de création du TCD toujours ouverte.

Si tout est correctement sélectionné, vous pouvez valider en cliquant sur OK.

Et si vous avez bien suivi le pas-à-pas, vous vous serez rendu compte de la présence d’une ligne blanche dans le fichier des musées !

Menu Insertion - TCD - Plage de sélection

Ce qui aurait totalement induit en erreur les résultats d’analyse ! Ce qui m’a également interpelé, c’est le nombre de lignes de la sélection par défaut ($A$1:$O624) qui indique une sélection de la ligne 1 à la ligne 624, hors le fichier dispose de 1254 lignes ! Il faut donc supprimer la ligne vide et recommencer.

Cette fois-ci, la sélection est correcte :

Menu Insertion - TCD - Plage de sélection ajustée

Et voilà ! C’est fait ! “Mais, il n’y a rien !” me direz-vous. Eh oui, c’est maintenant que tout commence.

Tableau croisé dynamique - vide

Étape 3 : Petite explication de ce que vous avez devant vous

Vous avez devant vous un tableau qui est prêt à consolider les données de votre tableau et à répondre à toutes vos questions.

Sur chacun des emplacements du tableau qui est devant vous, vous aller pouvoir placer les colonnes du tableau, et selon le lieu de dépôt, les conséquences seront différentes.

Déterminer les LIGNES

Commençons par “LIGNES”, en bas à gauche. Lors du dépôt d’une des colonnes, le TCD va analyser le contenu du tableau initial de valeur et présenter une liste de valeurs textuelles. Celle-ci contiendra très exactement toutes les valeurs du tableau initial de manière unique.

TCD - lignes

L’objectif est de faire des regroupements. Ainsi, pour le champ “NEW REGIONS”, le nom de la région ne sera indiqué qu’une seule fois, même si celui-ci est répété sur 100 lignes différentes dans la source de données.

Déterminer les VALEURS

Continuons en bas à droite : “VALEURS”. Lors du dépôt d’une colonne à cet emplacement, le TCD va chercher à présenter un résultat numérique, et ce, qu’elle que soit la nature des données. Même avec le champ “NEW REGIONS”, un TCD cherchera un nombre.

TCD - valeurs

Pour les champs contenant des nombres, par défaut, il calculera une somme. Pour tous les autres types de champ (texte, date, …), il calculera le nombre de valeurs total.

Ainsi, si nous combinons ces deux premiers axes, nous pourrons disposer du nombre de musées par région. Il faut ici “glisser-déposer” le champ “NOM DU MUSEE” dans le bloc « VALEURS ».

TCD - valeurs complétées

Déterminer les COLONNES

Ensuite, remontons en haut à droite sur “COLONNES”. La finalité est identique à “LIGNES”, mais à partir de colonnes. Soigneusement combinées à “LIGNES”, vous pourrez découper vos résultats selon un autre axe d’analyse (à condition que l’attribut sélectionné soit pertinent). Dans l’exemple présent, il n’y aurait aucun intérêt à ventiler le résultat par département. En effet, chaque département n’appartient qu’à une seule région, et donc aucune consolidation de chiffres possibles.

Si nous avions eu accès au tarif d’entrée des musées, alors, on aurait pu mettre le prix en colonne. Ainsi, nous aurions vu le nombre de musée à un prix donné, et ce, région par région.

Déterminer les FILTRES

Enfin, en haut à gauche, nous avons “FILTRES”. Le dépôt d’une colonne ici permettra, comme le nom le sous-entend, de filtrer selon les valeurs à analyser du tableau initial.

Ainsi, si on ne souhaite pas voir certaines catégories de produit polluer les résultats, nous n’avons pas besoin de les supprimer du tableau initial.

Étape 4 : Construisez le Tableau Croisé Dynamique qui vous correspond

Avant d’aller plus loin, vous devez être au clair avec la question à laquelle vous souhaitez répondre. Vous recherchez le nombre de musées “par région et par département” (1) ou bien, “par département et par région” (2) ?

Si vous ne voyez pas la différence entre ces deux questions, voici une illustration :

TCD - musées par région puis département

Tableau croisé dynamique - musées par département puis région

Vous pouvez voir que c’est légèrement différent. Le total général est identique, c’est normal, ce sont les mêmes données. En revanche, les valeurs n’ont pas été regroupées de la même manière.

Bravo ! Vous avez parfaitement franchi toutes les étapes qui vous mène à la maîtrise des TCD. Dans de futurs articles, je développerai bien d’autres possibilités offertes par les TCD.

Je vous propose également cette vidéo pour illustrer l’utilisation des tableaux croisés dynamiques avec l’analyse des données publiquement disponibles sur le Covid via le site https://data.gouv.fr :

https://www.youtube.com/watch?v=H0iao5mAtcs

Étape 5 : Aller plus loin avec les GCD : Les graphiques croisés dynamiques

Maintenant que vous maîtrisez les TCD, vous pouvez aller explorer encore plus de possibilités avec les GCD ! Les graphiques croisés dynamiques. Ces derniers sont les graphiques liés aux TCD. Pour tout savoir sur les graphiques croisés dynamiques, suivez le guide !

Étape 6 : Avez-vous apprécié cet article ?

Votre avis m’aide à continuer ! Je vous remercie de commenter cet article si cela a été le cas, d’ailleurs, si cela ne l’a pas été aussi. Sinon, je ne le saurai jamais… !

>