En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d’intérêts.
Pour en savoir plus et paramétrer les cookies… Fermer

publicité

La donnée mange le monde et la France passe à table


Débat : La donnée, c'est bon, mangez-en ! Ce pourrait être le slogan de la France et de l'Etat plateforme, avec des données publiques qui circulent et se combinent à d'autres données. Et cette ouverture peut être un levier face aux GAFA, à condition de trouver un juste équilibre.

 

La donnée, les grands acteurs américains du numérique en raffolent, un peu trop parfois peut-être même. En contrepartie de services gratuits, les utilisateurs consentent à partager ce patrimoine - et deviennent alors des produits, comme le veut la maxime.

Le débat autour de la puissance des GAFA et de l'exploitation qu'ils font des données ferait presque oublier que la donnée a d'autres visages, qu'elle n'est pas uniquement personnelle, ainsi que d'autres usages que la publicité.

La donnée n'est pas l'or noir

Enfermer toutes les données dans des bunkers n'est pas une alternative, défendent par exemple les partisans de l'open data. Partage et circulation, y compris des données publiques, sont au contraire des moyens d'enrichir cet actif et de favoriser l'émergence d'innovations.

L'Etat a un rôle de premier plan à jouer. C'était même le cœur du 2e grand débat organisé par Syntec Numérique (sous le patronage du Secrétariat d'Etat au numérique) : quelle politique de la donnée pour quelles politiques publiques ?

Le soutien de Mounir Mahjoubi n'est pas une surprise, lui qui promeut à chacune de ses prises de parole sur le sujet un équilibre "entre performance et humanité". Ethique et économie ne s'opposent pas, assurait en décembre à la Cnil ce partisan de la portabilité des données, une des mesures du RGPD.

Pour l'Etat français, il est temps d'aller au-delà de la seule ouverture des données publiques, l'open data, et de mettre en œuvre un "service public de la donnée." Pour Simon Chignard, (data) éditeur du portail public data.gouv.fr, ces données "deviennent source de création de valeur, d'innovation, économique, sociale."

Et cette création repose sur un principe, celui de la "circulation des données" - ainsi que l'encouragement à cette circulation. "Il n'y a pas de valeur à stocker des données." Adieu la vente par l'Etat de grands référentiels de données. Le modèle a en effet démontré ses limites, par exemple au travers de la vente par l'IGN de ses bases cartographiques en 2012 à des acteurs comme Google et Microsoft.

Pour autant, la conception de la donnée en tant que matière première revient aujourd'hui en force avec l'intelligence artificielle. Les données sont directement mises à contribution durant la phase d'apprentissage des algorithmes. Et si la France veut, comme le souhaite le président Macron, devenir un pays de référence dans le domaine de l'IA, elle se doit de capitaliser sur ses données.

Vers un "service public de la donnée"

Dans ce contexte, la donnée devient ainsi un levier d'innovation. Mais celle-ci peut prendre plusieurs formes, souligne Simon Chignard. Les données publiques peuvent être exploitées par des acteurs privés pour créer des produits et services. Et le représentant d'Etalab de citer par exemple Handisco, concepteur d'une canne blanche connectée.

Le malvoyant accède à diverses informations, et en particulier les horaires et la localisation des arrêts de bus. Pour délivrer ce service, Handisco est utilisateur des données de transport et participant du pilote transport.data.gouv.

L'importance des données dans le domaine de l'IA illustre également le fait que la donnée puisse relever de l'actif stratégique. Et cette donnée, c'est "celle qui donne à celui qui la contrôle une place majeure dans un écosystème."

La France en compte plusieurs de ces actifs stratégiques, comme la base Sirene, reconnue comme un standard de fait et donc utilisée par tous - mais autrefois vendue par l'Insee. Ces données de référence ont été introduites par la loi République numérique et sont au cœur du service public de la donnée. Ce service compte aujourd'hui 9 bases de données.

Comme les entreprises, l'Etat se rêve en Etat plateforme. Pour le directeur de la DSI de l'Etat, la Dinsic, c'est même un "devoir des pouvoirs publics", et le moyen de s'affranchir de la domination des GAFA.

"Nous sommes en train d'entrer dans une économie où il est pratiquement impossible d'innover réellement sans demander la permission à un GAFA" juge Henri Verdier. Le rôle de l'Etat est de favoriser un développement économique hors de cette tutelle.

Liberté d'innover dans sans la permission des GAFA

Mais, c'est aussi une question de "souveraineté", celle de l'Etat, mais également des citoyens, et leur "liberté d'innover dans un monde sans demander la permission (…)". L'Etat plateforme part du principe qu'il peut "agir et penser comme les plateformes". A une différence notable cependant : "il ne crée pas de la valeur pour des actionnaires, mais pour défendre l'intérêt général, aux entreprises d'innover dans une économie sur laquelle nous avons encore un droit de regard."

La Dinsic s'efforce donc de se doter des briques essentielles à une plateforme, dont une infrastructure adaptée, mais aussi des "communs" comme la base adresse nationale (co-construite par l'IGN, La Poste et OpenStreetMap), de certificats, d'un système d'identité forte (France Connect en cours d'ouverture) et bien entendu d'APIs.

Comme les acteurs privés, la DSI œuvre à la "plateformisation" du système d'information avec une dizaine de grandes API aujourd'hui. Et cette évolution représente un véritable bouleversement de l'informatique de l'Etat, historiquement "massivement en silos" et "verticale".

Et si la circulation et le partage des données publiques sont essentiels à la stratégie de plateforme de l'Etat, c'est car une telle stratégie ne peut être passive. "On devient plateforme parce qu'on fait naître des usages, si on montre son efficacité et en envisageant la plateforme en fonction d'usages réels" rappelle Henri Verdier.

Et la France doit impérativement réussir dans ce domaine : "Dans une bataille économique terrible, géostratégique, mondiale, la puissance publique est en train de s'armer pour desserrer un tout petit peu l'étau et partager avec la société civile une capacité à être plus autonome et souverain dans cette compétition."

Si l'Etat muscle son jeu, en quelque sorte, ce n'est pas dans son coin et pour lui seul. Les partenariats et l'ouverture des données doivent s'effectuer au profit des acteurs privés et des associations - si possible européens.

La révolution est dans la collaboration, pas l'ouverture

Ainsi, pour Benjamin Jean, fondateur d'Inno³ et président de l'asso Open Law, l'ouverture des données par l'Etat est certes un "grand pas", mais "la révolution n'est pas là." C'est dans la collaboration qu'elle réside, cette révolution permettant de "renforcer un actif".

"L'Etat est un bon élève, mais beaucoup aussi dans le secteur privé sont dans cette logique-là. C'est-à-dire qu'ils ne vont pas chercher à tout produire seuls, mais à mettre en place un environnement qui permet la production de la ressource. La finalité est la même, une ressource la plus innovante possible, mais la manière d'y parvenir est différente. Et forcément, cela passe par un changement culturel."

Pour autant, ajoute Benjamin Jean, "le secteur privé n'a pas attendu l'Etat pour faire de l'open data." Plusieurs projets ont été montés par des industriels, en particulier dans le secteur du transport. Certains mouvements peuvent en outre participer d'une logique de coopétition (à double sens) entre secteurs public et privé. 

Au nom de la souveraineté, l’Etat peut d'ailleurs avoir intérêt à concurrencer le secteur privé ou à obtenir de celui-ci qu’il partage certaines des données qu’il produit – sans enfreindre les protections légales. Henri Verdier évoque ainsi des données « d’intérêt général » et cite l’exemple des transports.

"Typiquement, il est impossible d’organiser les transports dans une ville si on ne détient pas toutes les données de transport. Donc il faudra bien que certaines données de transport soient utilisées par la puissance publique et par les urbanistes."

Mais cette mise en commun des données revêt également une importance nouvelle à l’ère de la révolution de l’intelligence artificielle. Ces IA sont élaborées grâce à des données d’apprentissage. Et ce sont ces données, ces "savoirs", qui donnent aux IA leur logique.

"Ces intelligences artificielles risquent d’organiser le monde dans lequel nous vivons pour les 30 prochaines années. Et on les éduque maintenant (…) Les IA ne connaissent que ce qu’on leur donne à manger" insiste Henri Verdier.

Demain, la tomate un légume pour la France

Pour en illustrer les enjeux, il cite l’exemple de la tomate. En France, juridiquement et pour la botanique, la tomate est un fruit. En revanche, aux Etats-Unis, elle bénéficie d’une fiscalité différente étant considérée comme un légume.

Les grandes de bases de données aux US classent ainsi la tomate parmi les légumes. Pour les IA formées grâce à ces bases, la tomate appartient à cette famille. Cet exemple, anecdotique en apparence, souligne cependant le comportement d’IA nourries grâce à ces données, éduquées pour "adopter un point de vue sur le monde qui n’est pas le nôtre."

"Les IA type Google ou Amazon pensent que les tomates sont des légumes. Si bien qu’aujourd’hui, les applications françaises sont obligées de dire que les tomates sont des légumes, sinon elles ne marchent pas" déclare le directeur interministériel du numérique, pointant une recommandation du rapport Villani.

Celui-ci nous dit que nous n’avons "pas le droit de ne pas nous préparer à éduquer les IA avec toutes les données que nous pouvons utiliser en France." Et cela implique d’ouvrir certaines données au profit de la recherche sur l’IA, sans remettre en question les secrets légaux, y compris des données médicales.    

Mais plus modestement, l’ouverture des données participe aux interactions entre écosystèmes, par exemple entre les banques et l’Etat. "Les stratégies de plateforme sont suivies par d’autres secteurs d’activité (…) Le domaine bancaire, poussé par le régulateur, est obligé de s’APifier" par exemple afin de pratiquer l’open-banking, souligne le patron du numérique de Sopra Banking Software, Guillaume Blot.

"Cet écosystème, qui lui-même évolue, est en interaction avec l’écosystème des services publics numériques. Et cela marche dans les deux sens." Mais ces interactions pourraient se développer encore au sein du parcours usager, dans le privé, comme dans le public.

Au travers d’API, les grands opérateurs fourniraient, lors de démarches administratives, des justificatifs de domicile. Lors de la souscription d’un crédit auprès d’un établissement financier, des justificatifs sont également requis et dont dispose la puissance publique.

"Sous réserve de la privacy, et bien évidemment du consentement des usagers, qu’est-ce qui interdirait de mettre en interaction le service offert par la banque avec le service numérique de l’Etat plateforme pour aller chercher directement l’information ?" imagine Guillaume Blot. Et pour ce dernier, le premier service à mutualiser est celui gérant l’identité numérique, c’est-à-dire France Connect.

Les participants du débat de la donnée organisé par Syntec Numérique reconnaissent bien entendu la nécessité de réguler ces échanges entre public et privé, y compris les conditions d’utilisation même des données publiques et des API.

Camille Putois, fondatrice de K et ancienne de Matignon, rappelle que des garde-fous très précis sont indispensables : gratuité, protection des données personnelles et "il faut que l’administration ait accès à l’ensemble des données d’activité."

"Il faut construire avec prudence" recommande quant à lui Henri Verdier. "On fabrique un monde où il faut réinterroger la souveraineté (…) Une gouvernance est à construire. Ce qui nous manque aujourd’hui, ce sont des concepts, du recul sur des retours d’usage après de premières expérimentations. Je ne pense pas cependant qu’il y ait de problèmes culturels majeurs."

Le prochain grand débat de la donnée se tiendra le 15 mai 2018 et aura pour thème l'économie de la donnée

Articles relatifs

Contenus sponsorisés

Contenus partenaires

Réagissez à l'article

1 réponse
Connectez vous ou Enregistrez-vous pour rejoindre la discussion
    
  • La souveraineté, c'est l'affaire du peuple et de personne d'autre!
    Que les élus agissent en serviteurs du peuple, ce qu'ils sont censé être!

    Comment appliquer le concept de souveraineté aux données?
    N'entre ou ne sort pas qui veut à la frontière!
publicité