[Groupe K2] La révolution de la data pourrait être à plusieurs vitesses : les dirigeants, salariés et citoyens doivent en être conscients.
22/12/2022 - 4 min. de lecture
Le Cercle K2 n'entend donner ni approbation ni improbation aux opinions émises dans les publications (écrites et vidéos) qui restent propres à leur auteur.
Ano Kuhanathan est Professeur associé à NEOMA Business School et Co-directeur du MSc Finance & Big Data
---
La data est l'un des grands enjeux des années à venir. Une course technologique s'est engagée depuis bientôt une décennie. Les entreprises et les institutions publiques se sont lancées dans des projets ambitieux pour tirer parti de l'immensité des données qui sont produites, disponibles et peuvent désormais être exploitées afin d'optimiser l'expérience des clients, la productivité des travailleurs, la rentabilité du capital, le bien-être des usagers et des citoyens, etc. Cette course a parfois tendance à ressembler à une ruée vers l'or - anarchique, conflictuelle, pleine de vendeurs d'huile de serpents. Toutefois, une chose est certaine : cette course à la data porte en elle le germe de nombreuses sources d'inégalités. Ces inégalités peuvent être "classées" dans trois grandes catégories.
Tout d'abord, le déploiement de la data peut exacerber l'inégalité entre Nations. En effet, le grand public aura certainement noté le débat récent sur la question de la "souveraineté numérique". Ce débat n'est que le reflet de la prise de conscience par certains États, notamment en Europe, des inégalités naissantes. Les géants du numérique américains contrôlent et amassent des quantités de données pharaoniques sur les citoyens/consommateurs du monde entier, le déploiement des satellites basse altitude est dominé par les acteurs américains et les Chinois vont très certainement contrôler les infrastructures des futurs réseaux 5G. En outre, chez ces deux superpuissances, la réglementation sur l'usage et la protection des données est relativement faible, ce qui confère aux entreprises et institutions de ces pays un avantage important dans l'exploitation des données. Alors qu'en Europe, nous sommes avant tout des clients et pourvoyeurs de données, avec une réglementation nettement plus restrictive. Il ne s'agit pas ici de faire le procès de la régulation européenne, qui a ses mérites, mais ce déséquilibre entraînera des avantages économiques, industriels, voire diplomatiques à certains pays sur d'autres.
La seconde source d'inégalité venant de la data concerne les entreprises. En effet, les grandes entreprises ont investi ces dernières années dans des data labs, acheté des données externes, mis en place des processus pour mieux collecter et stocker leurs données, etc. Or, comme nous l'a révélé la crise du Covid-19, les petites entreprises sont à la traîne sur ces sujets digitaux. Les TPE-PME ont pour beaucoup manqué le virage digital, alors la data... Si nos plus petites entreprises, qui, rappelons-le, représentent l'essentiel de l'emploi, se retrouvent désavantagées face aux grandes entreprises dont elles sont souvent les fournisseurs, leurs modèles économiques, leurs rentabilités et leurs activités pourraient être mis sous pression. Un contre-argument au déséquilibre que je pointe ici serait de mentionner les start-ups qui sont des petites structures innovantes et dont beaucoup cherchent à vivre d'un modèle économique fondé sur la data. Néanmoins, il est utile de rappeler que la majorité de ces entreprises ne soufflent pas leur 4ème bougie et que celles qui prospèrent en apparence sont souvent financées grassement et se permettent de recruter des data scientist en leur offrant des rémunérations que beaucoup de PME ne pourraient se permettre de supporter. En somme, il s'agit d'un microcosme bien particulier dont les pratiques ne peuvent être généralisées à l'ensemble des entreprises.
Enfin, la data pourrait exacerber les inégalités entre individus (consommateurs, citoyens, usagers). En effet, les modèle de Machine-Learning utilisent les données passées pour "apprendre" et faire des prévisions ou prendre des décisions pour le futur. Sauf que voilà, le passé reflète aussi nos biais du passé. Si une banque n'octroyait que peu de crédit aux résidents d'un certain code postal (au hasard, de Seine-Saint-Denis, par exemple) et qu'elle décide de développer un modèle de décision automatique d'octroi de crédit, il est possible que le modèle discrimine contre les résidents de cette zone géographique, perpétuant une inégalité ancrée dans le passé (encore une fois, il n'est pas question ici de débattre du bien-fondé des décisions passées). Autre exemple, lors de mes fonctions passées, j'ai travaillé avec une équipe de data scientist sur un modèle de pricing automatique pour une compagnie d'assurance. L'objectif de l'entreprise était d'avoir une prime personnalisée en fonction du client - véritable Graal pour tout assureur. L'entreprise avait acquis des données bancaires, des données sur les achats en ligne, etc., pour mener à bien le projet. Après les premiers tests, on s'est rendu compte que les modèles discriminaient systématiquement les femmes. Nous avons donc retiré la variable "Gender" des modèles. Pas de chance, les modèles discriminaient de nouveau les femmes. cette fois, ils avaient détecté la caractéristique du genre à travers les comportements d'achats (transaction chez une enseigne de lingerie, un parfumeur, un esthéticien, etc.). Face à ces problèmes multiples, d'ordre réglementaire mais aussi éthique, le projet a finalement été mis en "sommeil". Voilà le type de dilemme auquel les entreprises auront à faire face. Les données et les modèles ne feront que perpétuer nos biais, ce qui pourrait renforcer les inégalités économiques et sociales, voire même être une entrave à l'égalité des chances - imaginez si les sélections scolaires ou d'embauche embarquaient automatiquement ce type de biais.
En somme, la data offre un champ des possibles phénoménal pour la société, les entreprises et les individus. Mais son exploitation, différente d'un pays à l'autre, d'une entreprise à l'autre et sur la base de modèles qui risquent d'embarquer avec eux nos biais du passé pose de sérieuses questions. Des questions auxquelles citoyens, salariés, dirigeants et gouvernants doivent être sensibilisés afin d'être vigilants et de prendre des décisions informées.
Cette Tribune s'inscrit dans le cadre du Groupe K2 "Enjeux du Big Data" composé de :
Kevin Dumoux est Co-créateur du Cercle K2, Conseil en Stratégie, Transformations digitales et M&A - Messaoud Chibane (PhD) est Directeur du MSc Finance & Big Data, NEOMA Business School, Lauréat du Trophée K2 "Finances" 2018 - Shirine Benhenda (PhD) est Experte en Biologie moléculaire, données OMICS - Sonia Dahech est Directrice CRM, Trafic et Data omnicanal chez BUT - Franck DeCloquement est Expert en intelligence stratégique, Enseignant à l'IRIS et l'IHEDN, Spécialiste Cyber - Franck Duval est Administrateur des Finances publiques, Directeur adjoint du pôle gestion fiscale, DDFiP 92 - Yara Furlan est Trader Social Media chez Publicis Media - Jean-Baptiste Harry est HPC & AI Solution Architect & pre sales EMEA chez NEC Europe - Timothé Hervé est Risk Manager à la Banque de France - Aurélie Luttrin est Président, Eokosmo - Yann Levy est Data Analyst, Expert BI - François Marchessaux est Senior Partner, Franz Partners - Conseil en Stratégie & Management - Aurélie Sale est Coach Agile chez Renault Digital - Jun Zhou est Entrepreneur, Lecturer & Consultant in Chinese Social Media
---
22/12/2022