[Groupe K2] Enjeux du Big Data - Note de synthèse et Rapport complet

Kévin Dumoux Messaoud Chibane Jean-Baptiste Harry Jun Zhou Shirine Benhenda Timothé Hervé Yara Furlan Franck Duval Yann Levy Aurélie Sale Sonia Dahech François Marchessaux Franck Decloquement Aurélie Luttrin

30/11/2022 - 14 min. de lecture

[Groupe K2] Enjeux du Big Data - Note de synthèse et Rapport complet - Cercle K2

Cercle K2 neither approves or disapproves of the opinions expressed in the articles. Their authors are exclusively responsible for their content.

Kevin Dumoux est Co-créateur du Cercle K2, Conseil en Stratégie, Transformations digitales et M&A - Messaoud Chibane (PhD) est Directeur du MSc Finance & Big Data, NEOMA Business School, Lauréat du Trophée K2 "Finances" 2018 - Shirine Benhenda (PhD) est Experte en Biologie moléculaire, données OMICS - Sonia Dahech est Directrice CRM, Trafic et Data omnicanal chez BUT - Franck DeCloquement est Expert en intelligence stratégique, Enseignant à l'IRIS et l'IHEDN, Spécialiste Cyber - Franck Duval est Administrateur des Finances publiques, Directeur adjoint du pôle gestion fiscale, DDFiP 92 - Yara Furlan est Trader Social Media chez Publicis Media - Jean-Baptiste Harry est HPC & AI Solution Architect & pre sales EMEA chez NEC Europe - Timothé Hervé est Risk Manager à la Banque de France - Aurélie Luttrin est Président, Eokosmo - Yann Levy est Data Analyst, Expert BI - François Marchessaux est Senior Partner, Franz Partners - Conseil en Stratégie & Management - Aurélie Sale est Coach Agile chez Renault Digital - Jun Zhou est Entrepreneur, Lecturer & Consultant in Chinese Social Media

---

TELECHARGER LE RAPPORT

---

Note de synthèse

Le Big Data, une nouvelle révolution industrielle

 

Au cours des trois dernières décennies, la quantité de données auxquelles les entreprises et les individus ont accès a explosé. La datasphère globale, c'est-à-dire l’ensemble des données disponibles sous forme digitale dans le monde, atteindra 80 zettabytes en 2022 et doublera d’ici 2025 (IDC, 2021). Pour décrire ce phénomène, le concept de Big Data (données massives) a vu le jour. Il permet notamment de mettre en lumière la capacité pour les entreprises de développer des outils plus précis d’aide à la décision (Big Data Analytics), d’améliorer leur performance organisationnelle et d’en tirer un avantage compétitif. 

Certaines entreprises comme Netflix, Amazon, Google, articulent l’ensemble de leur stratégie sur l’exploitation du Big Data. Selon (Cavanillas, 2016) l’industrie des nouvelles technologies et des télécommunications contribuent pour 5 % du PIB de l’Europe et, dans ce cadre, les solutions Big Data (et de l’open data) peuvent participer à améliorer la compétitivité des entreprises européennes. Ainsi, selon une estimation du WISE Institute, le Big Data peut contribuer au PIB de l’Union européenne à hauteur de 1.9 % sur un horizon de 5 ans, soit approximativement l’équivalent d’une année de croissance de PIB.  

Bien sûr, la seule présence des données ne peut à elle seule générer tout son potentiel économique car celui-ci doit être exploité par les techniques les plus avancées de l’intelligence artificielle (IA). Selon une étude du cabinet Mc Kinsey, l’IA pourrait contribuer à 13 trillions de dollars d’activité économique soit l’équivalent de 1.2 % de PIB additionnel par année. Cet apport dans la richesse globale se ferait à travers une diversité de facteurs tels qu’une plus grande automatisation du travail, une accélération du rythme de l’innovation et un accroissement de productivité et de compétitivité. Si le Big Data est devenu un facteur majeur de développement économique, la question est de déterminer qui seront les pays dominants dans les décennies à venir et où se situeront l’Europe et la France sur l'échiquier .

 

Pourquoi le Big Data révolutionne-t-il le fonctionnement des entreprises ?

Selon (Philippon, 2019) l’association du Big Data et des technologies de l’IA peut être envisagée sous trois angles : 

  1. Elles constituent un actif incorporel pour l’entreprise.
  2. Elles révolutionnent les outils permettant d’accroître sa part de marché : Exemples : Amazon et Netflix utilisent des outils de Big Data pour améliorer les recommandations de produits à leurs clients. 
  3. Elles apportent des outils de prévision (et donc d’aide à la prise de décision) beaucoup plus puissants. Les outils de Big Data peuvent par exemple être utilisés pour adapter les politiques de prix en fonction de la démographie des consommateurs (âge, genre, lieu de vie, etc.) (Cavallo, 2017).

En exploitant les avantages du Big Data dans leurs organisations, les entreprises augmenteraient leur productivité de 5 % et leur profitabilité de 6 %. Elles diminueraient le coût d’acquisition de nouveaux clients de 47 % et augmenteraient la valeur de leur firme de 8 % (McAfee, 2012). 

De plus, le Big Data constitue un nouveau vecteur d’innovation pour les entreprises. Tout d’abord, il permet d’optimiser la rentabilisation de leurs actifs, de personnaliser leurs services ou de lancer de nouveaux produits (Trabucchi, 2019).

Certaines industries sont déjà bien avancées dans leur transition vers l’adoption du Big Data.  À titre d’exemple, la Figure 1 montre le taux d’adoption du Big Data par industrie en 2020 au Royaume-Uni. On peut constater que la banque de détail est en tête avec 80 %, suivie par l’industrie de l’énergie et les transports. La santé arrive en dernière position avec 52 % d’adoption seulement. 

Par ailleurs, l’adoption du Big Data permet de nourrir, au cœur des écosystèmes, les processus d’innovation collaborative directe et indirecte, passive ou intentionnelle entre les entreprises, leurs fournisseurs, et les différentes institutions (Bresciani, 2021). 

Si l’on ausculte l’interaction entre le Big Data et l’innovation du point de vue de la recherche scientifique, on assiste à un vrai changement de paradigme. En effet, la démarche scientifique classique consiste, en partant de conjectures, à émettre des hypothèses et à les vérifier à partir de données échantillonnées. Au contraire, avec le Big Data, il est courant de collecter un grand nombre de données et d’extraire leurs sens et leurs corrélations a posteriori. 

D’autre part, la variété immense des données de natures différentes nécessite la mise en place de projets pluridisciplinaires et l’intervention d’experts de domaines parfois radicalement différents, ce qui requiert un nouveau mode d’organisation du monde académique. Aujourd’hui, il existe peu de revues scientifiques de haut niveau qui soit véritablement pluridisciplinaire. Pourtant, les pays qui seront à même de mettre en place ce nouveau type d’environnement académique, permettant au Big Data d’exprimer toute son potentiel, seront très probablement aux premières places mondiales de l’innovation.  

Enfin, le Big Data est en passe de révolutionner le monde de l’éducation. En effet, grâce aux développements des cours online comme Udemi, OpenClassrooms ou Coursera, un volume important d’information est produit. La digitalisation des échanges entre professeurs et élèves permet aux premiers d’accéder aux travaux de ces derniers, de contrôler leur performance et de leur renvoyer du feedback quasiment en temps réel. Cette immédiateté dans l’interaction pédagogique couplée au volume important de données produites permet de construire des modèles d’apprentissage qui peuvent s’adapter aux préférences et compétences des étudiants afin de construire un système éducatif plus efficace et plus juste. 

Il semble donc clair que le Big Data, couplé aux technologies de l’IA, doivent occuper une place majeure dans la stratégie économique et d’innovation des entreprises et des grandes puissances. Il est légitime, nécessaire et urgent de se demander comment se positionne la France et plus généralement l’Union Européenne (UE) dans ce nouvel ordre mondial. 

Quand on pense aux super puissances de la data, les deux pays qui viennent à l’esprit sont les Etats-Unis et la Chine, notamment grâce à leurs entreprises iconiques dans le domaine, respectivement les GAFAM et Alibaba, Tencent et Huawei. Cependant, si l’ère du Big Data peut redessiner un nouvel ordre mondial dans un avenir proche, comme le pétrole l’a fait au 20ème siècle, cette transformation se fera de manière différente car ce nouvel or digital n’est pas produit uniquement dans ces deux pays. Pour classer les pays selon un nouveau critère de GDP (Gross Data Product), l’étude de la Harvard Business Review (Chakravorti Bhaskar, 2019) classe les pays selon un nouveau jeu de critères : 

  • Volume  : la quantité totale de données consommées à haut débit par un pays, comme approximation des données brutes générées ;
  • Usage  : nombre d’utilisateurs actifs d’internet comme approximation de la diversité des utilisateurs, de leur comportements et de leurs besoins;
  • Accessibilité : c'est-à-dire le degré auquel les institutions du pays donnent accès aux différentes applications, aux chercheurs en IA et aux innovateurs dans leur généralité ;
  • Complexité : le volume des données haut débit consommée par utilisateur, qui permet de mesurer la complexité et la sophistication de l’activité digitale d’un pays. Cette dernière mesure est comparable au concept de PIB par habitant qui permet de comparer les niveaux relatifs de prospérité et de développement des pays. 

Peut-être que le critère le plus difficile à appréhender pour classer les différents pays dans ce nouvel ordre digital est celui de l’accessibilité : nous avons le problème de la protection des données qui peut en apparence être en conflit avec celui d’une certaine ouverture des données, nécessaire pour alimenter de façon efficiente les outils d’IA. Parmi les grandes économies, La Chine présente un avantage concurrentiel à court terme puisque, par la taille même de sa population, elle génère une quantité importante de données sur laquelle les institutions gouvernementales ont un droit de préhension tout en limitant l’accès de ces données aux autres pays. 

Si l’on ne considère que les critères de l’accessibilité et de la complexité (Figure 1), on constate que les Etats-Unis dominent le classement alors que la Chine figure parmi les mauvais élèves sur ces deux critères.  Sans surprise, l’Union Européenne montre un bon niveau d’accessibilité mais son score de complexité reste faible comparé à d’autres pays européens non UE tels que le Royaume Uni ou la Suisse. À l'exception de la Suède, on constate une certaine homogénéité dans le classement des différents pays de l’UE avec une France qui domine le critère d’accessibilité. 

Lorsque les 4 critères sont pris en considération, les trois premières puissances dans l’ordre mondial du Big and Open Data sont les Etats-Unis, le Royaume-Uni et la Chine suivi par la Suisse, la Corée du Sud et en sixième position la France. 

Il semble donc au vu de ces éléments que la France soit bien positionnée pour profiter de l’expansion du Big Data dans les années à venir. Cette analyse est confirmée par la progression de la France au sein du Global Innovation Index (GII 2021). Elle devance la Chine et talonne l’Allemagne (en 10ème position). Cette amélioration est à mettre en perspective avec le mouvement de la Frenchtech. Pourrappel, le nombre de Licornes françaises est passé, de 2018 à 2021, de 4 à 26. Il faut cependant relativiser ces données positives notamment au regard du positionnement moyen de la France (18ème) sur le Network Readiness Index. Cet index mesure entre autres le niveau fondamental de l’infrastructure ICT (Information and Communication Technology), la sophistication des entreprises et des individus dans leur utilisation de ces technologies, ainsi que le niveau des investissements publics dans leurs infrastructures technologiques. De même, dans un contexte plus général, l’OCDE mesure l’intensité de recherche et de développement dans les nouvelles technologies des différents pays (le niveau de dépenses R&D en pourcentage du PIB). Sur cette échelle, la France alloue seulement 2.5 % de son PIB contre 4.9 % pour Israël et 4.6 % pour la Corée du Sud.

Enfin un futur positionnement avantageux de la France dans le classement du Big Data ne pourra se matérialiser que si sa politique de protection des données est à la hauteur des enjeux économiques et stratégiques. Aujourd’hui, celle-ci est classée 14ème, derrière des pays attendus comme les Etats-Unis (1er), le Royaume-Uni (2ème) mais aussi des pays plus surprenants tels que l’Arabie Saoudite (3ème), l’Estonie, l’Espagne ou encore la Russie. 

En conclusion, la France possède un certain nombre d’atouts pour atteindre une place dominante dans le nouvel ordre mondial induit par le Big Data. Mais ce seul objectif économique ne peut se faire sans prendre le risque de créer un grand nombre d’inégalités à la fois entre les petites et les grandes entreprises mais aussi entre les individus qui ne seront pas tous équipés du même bagage culturel et éducationnel pour « surfer sur la vague »  du Big Data. 


Le risque d’une stratégie seulement basée sur le critère économique

L’adoption généralisée du Big Data dans les économies occidentales favorisera les grandes compagnies au détriment des plus petites. En effet, d’après (Bessen, 2017), les nouvelles technologies propulsent la productivité des grandes entreprises ainsi que leurs marges opérationnelles. L’ère du Big Data pourrait donc causer la quasi-disparition des entreprises de petite taille qui n’auraient pas la capacité de générer suffisamment de données pour bénéficier des économies d’échelle qui profitent à leurs compétiteurs. De plus, puisque les grandes entreprises génèrent plus de données que leurs concurrentes, plus modestes, les institutions financières, elles-mêmes disposeront de plus d’informations sur les grandes entreprises et leurs proposeront donc des opportunités de financement plus avantageuses (Begenau, 2018). 

Même si l’ère du Big Data génèrera un grand nombre d’opportunités économiques et créera beaucoup d’emplois dans la technologie pour les data scientists, data analysts de demain, elle automatisera un grand nombre de tâches et provoquera probablement l’abandon d’un nombre important de postes aujourd’hui occupés par des êtres humains. Ces personnes, qui ne possèdent pas les compétences appropriées aux traitement des données Big Data, auront des difficultés à maintenir leur employabilité. Nous pourrions donc assister à une substitution « Machine contre Humain ». Nous devons donc anticiper cette possibilité et nous préparer à ce que l’innovation Big Data favorise le consommateur en partie mais cause des externalités négatives pour le travailleur non formés à ces nouvelles technologies. 

Enfin, l’ère du Big Data va accentuer le fossé entre les pays développés et les pays en voie de développement. En effet, ces derniers risquent de devenir  de simples fournisseurs de données qui seront exploités par la suite par les entreprises dominantes des pays développés. 

On peut ainsi voir que l’impact du Big Data sur tous les secteurs du monde s’apparente à une véritable révolution industrielle et est en passe de changer les rapports de force économique au sein des sociétés mais aussi entre pays. L’ensemble de ses ramifications est tellement vaste qu’il faudrait plusieurs ouvrages pour toutes les traiter. Nous allons ici nous concentrer sur les aspects du Big Data qui nous semblent essentiels pour bien appréhender ses conséquences à court et moyen termes. Nous centrerons notre analyse sur les thèmes suivants :

 

1. Le Big Data, ou comment les entreprises doivent opérer leur mutation pour profiter de cette révolution industrielle

Le monde économique a pris conscience du volume extraordinaire des données disponibles et pressent son potentiel en termes de nouvelles opportunités de création de valeur et d’amélioration des process de décision et d’exécution. Mais de la prise de conscience à l’exploitation optimale des données des pas de géants restent à faire. Quels sont les changements à opérer par les entreprises pour adopter le Big Data dans leur business model ? 

 

2. Le Big Data et son impact sur le secteur financier

Contrairement aux idées reçues, ce n’est pas l’industrie des télécommunications ou le secteur de la technologie qui sont le plus en pointe dans l’adoption du Big Data mais bien le secteur financier avec au premier rang la banque de détail, alors que la banque d’investissement est en septième position. Les sources de données exploitées par les services financiers sont multiples, s’étendant des profils et comportements clients de la banque de détail, aux flux d’investissements, aux prix disponibles sur les marchés financiers en passant par les analyses fournies par les experts financiers et les agences de notation. 

L’industrie financière est forcée d’opérer une véritable mutation en raison de l’expansion des Fintech et de leur business model plus agile qui offre des services plus larges et moins chers à leurs consommateurs. Parmi les plus connues, on peut citer Quonto, Lydia, ou encore Finexkap, Fintech spécialisée dans l’affacturage qui utilise des algorithmes de Big Data pour évaluer le risque client avec une précision accrue. Dans la mesure où le secteur financier irrigue l’économie, il est crucial de comprendre comment le Big Data va impacter la gestion des risques, le financement des entreprises et des particuliers et le secteur de l’assurance.

 

3. Le Big Data et les services publics

Le Big Data impacte tous les pans de l’économie et de la société. Comment envisager un secteur privé  performant dans son utilisation des données sans l’existence d’un service public qui adopte lui-même une approche sophistiquée dans la collecte, l’organisation et la valorisation de celles-ci. 

Prenons par exemple le secteur de la santé où une quantité importante de données patients est stockée dans les systèmes informatiques des hôpitaux  publics, cliniques privées, médecins généralistes et spécialistes sans que ces systèmes communiquent nécessairement entre eux. Une des conséquences de cette absence de cohérence est le coût financier supporté par le système de santé du fait de la multiplications d'examens médicaux, lesquels pourraient être parfois évités si toutes les données médicales des patients étaient centralisées. Un autre problème est aussi l’éventuelle « perte de chances » subie par le patient, due à ce manque de communication. Ces données pourraient être mis à profit afin de concevoir des algorithmes de prédiction qui permettraient d’obtenir des signaux faibles de présence de maladies graves qui seraient traitées en amont avant que l’état de santé des patients ne se dégrade.  

Un parallèle peut aussi être établi avec le domaine de la Justice ou celui de notre infrastructure fiscale où le manque de cohérence entre les différentes bases de données publiques conduisent à des pertes d’efficacité, des erreurs de procédure ou même des fraudes alors qu’une exploitation optimale du Big Data pourrait résoudre ces problèmes et donc améliorer le service rendu aux individus et la situation financière des Etats. 

 

4. Le Big Data et la refonte du monde du travail

On voit qu’une telle mutation engendrera à moyen et long termes un changement profond des économies occidentales. Qu’en est-t-il du marché du travail ? 

Une hyper-digitalisation des échanges créera forcément de nouveaux métiers et une nouvelle façon d’appréhender les échanges humains. Mais ces nouvelles opportunités seront-elles l’apanage des classes les plus favorisées ou « ruisselleront-elles » sur l’ensemble de la société ?

 

5. Le Big Data et les risques encourus : cybersécurité, dépendance matérielle et souveraineté numérique

Si toutes les révolutions industrielles s’accompagnent de gains de productivité, elles exposent aussi les économies qui en bénéficient à un certain nombre de risques. Dans le cas du Big Data, la performance des entreprises et des Etats en termes de cybersécurité est essentielle pour garantir la viabilité de cette mutation. De plus, ce nouvel « or noir » peut être transférable plus facilement que son ancêtre physique : se pose la question de la souveraineté des nations quant aux données qu’elles possèdent. Quelles sont les politiques nationales et internationales à mettre en place afin de protéger les prérogatives des Etats quant à l’utilisation et/ou le partage de leurs données ? Pour la France en particulier, c'est une question stratégique qu'il est nécessaire de traiter en priorité.

Enfin, on oublie souvent que cette révolution digitale repose sur la performance du hardware utilisé pour stocker les données et exécuter les algorithmes d’intelligence artificielle qui les exploitent. Qui sont les constructeurs majeurs de ces composants matériels et comment éviter une dépendance trop importante vis-à-vis de ces acteurs ?

 

TELECHARGER LE RAPPORT COMPLET

 

Kevin Dumoux Messaoud Chibane Shirine Benhenda Sonia Dahech Franck DeCloquement Franck Duval Yara Furlan Jean-Baptiste Harry Timothé Hervé Aurélie Luttrin Yann Levy François Marchessaux Aurélie Sale Jun Zhou

 

 

30/11/2022

Last publications