Nos données numériques seront-elles bientôt stockées sur de l’ADN ?

Auteur(s)
FranceSoir
Publié le 15 décembre 2021 - 15:45
Image
ADN
Crédits
Unsplash
Molécule d'ADN.
Unsplash

Stocker des fichiers sur de l’ADN, c’est désormais possible. Si la technologie demande encore à être perfectionnée, Stéphane Lemaire, directeur de recherche au laboratoire de biologie computationnelle et quantitative du CNRS, entretient l’espoir que ce procédé soit pleinement opérationnel d'ici à 2030. L’objectif : mettre en place une solution qui réponde au besoin de stockage de données massives.

Avec son partenaire Pierre Crozet, maitre de conférences à l’université Paris Sorbonne, ils ont développé et breveté en 2019 ce processus d’enregistrement qui fait appel à la technologie DNA Drive. Avec Erfane Arwani (cofondateur de Nanocloud, SharePlace et Osaka), les deux chercheurs ont cofondé en 2021 la société Biomemory qui se chargera de commercialiser cette technologie futuriste.

Une première historique aux Archives Nationales

En guise de preuve de concept, le 23 novembre 2021 aux Archives Nationales, Stéphane Lemaire et Pierre Cozet ont réalisé sur des fragments d'ADN synthétisés l’encodage de la Déclaration des droits de l'Homme et du citoyen de 1789, ainsi que la Déclaration des droits de la Femme et de la citoyenne écrite par Olympe de Gouges en 1791.

Stockés à plus de 100 milliards d'exemplaires dans une minuscule capsule métallique inoxydable de 18 mm sur 5 mm, ces documents pourront, vraisemblablement, être conservés pour une durée d’au moins… 50 000 ans, rapporte le site L'Usine Digitale. Les fameuses capsules reposeront dans « l’Armoire de fer » du musée des Archives de Paris, un coffre dans lequel se trouve aussi le testament de Napoléon 1ᵉʳ, la dernière lettre de Marie-Antoinette et la Constitution de la Vᵉ République.

Comment ça marche ?

La technologie DNA Drive utilise des fragments d’ADN de synthèse, précisément des plasmides ou des chromosomes, qui sont encodés grâce à la biologie synthétique et rendus lisibles grâce à des séquenceurs de poche. Pour l’encodage, la technique consiste à convertir du code binaire (0 ou 1) en données quaternaires, correspondant aux quatre nucléotides qui forment une molécule d'ADN (A, T, C, G). Pour la lecture, l'algorithme DNA Drive reconvertit les données en informations binaires, qui sont ensuite décompressées permettant ainsi de récupérer les fichiers d'origine.

À ce jour, ce système est coûteux en temps comme en argent. Plusieurs jours ont été nécessaires pour encoder la Déclaration des droits de l’Homme. Une heure pour la décoder. Pour autant, M. Lemaire espère que cette technologie sera « viable économiquement d’ici quelques années. »

Cela étant, les applications de la méthode restent pour l’instant limitées par son caractère à usage unique : après lecture, le fichier devient inutilisable suite à la réhydratation de la molécule qui détruit le fragment.

Pourquoi cette méthode de stockage ?

Ce qui a motivé ces recherches, c’est le constat que les capacités de stockage risquent de ne plus être en adéquation avec les besoins. Par exemple, au musée des Archives Nationales, plus de 70 To de données sont actuellement numérisées, un volume qui devrait atteindre les 200 To d'ici à quelques années.

Outre leur haute consommation d’énergie, les "datacenters" sont fragiles du fait de leur durée de vie oscillant entre cinq et sept ans. Par comparaison, selon les chercheurs, l’ADN serait une alternative de stockage durable et économique. 100 g d’ADN humain suffiraient à contenir l’intégralité des données mondiales.

« Garantir la transmission du patrimoine aux générations futures est un vrai défi pour le papyrus, le parchemin, le papier, mais encore plus pour le numérique », explique Bruno Ricard, directeur général des Archives nationales.

Un programme de recherche financé par l’État français

Le ministère de la Recherche a intégré le développement de cette technologie de stockage des données dans son lot des quatre « programmes et équipements prioritaires de recherche » (PEPR). Il ambitionne de « positionner l’écosystème de recherche académique et industriel français comme un acteur incontournable du stockage sur polymère (ADN et non-ADN) à l’échelle internationale ».

C’est pourquoi 50 millions d'euros seront reversées pour le financement du projet MoleculArXiv, piloté par le CNRS. L'INRIA, l'Université de Strasbourg, l'Université Paris Sciences et Lettres, et l'Université Côte d’Azur se joindront aussi à cette entreprise. D'ici à cinq ans, l’objectif est d’accroitre la vitesse d’écriture et de lecture par 100.

À LIRE AUSSI

Image
ADN
Révolution dans le stockage de données : les archives nationales encodent de l’ADN !
Grâce à la biologie moléculaire, on peut désormais encoder des informations sur de l’ADN. Le procédé, relativement simple, permettrait d’assurer la pérennité des donné...
25 novembre 2021 - 11:15
Société
Image
google photo
Fin du stockage illimité et gratuit sur Google Photos. Quelles alternatives ?
Depuis que les smartphones se sont généralisés, les albums photos se remplissent sans cesse de clichés pris par l’utilisateur lui-même, mais aussi par ses enfants, ses...
03 juin 2021 - 13:25
Lifestyle
Image
La puce Neuralink d'Elon Musk
Les avancées de la neurotechnologie rendent sa régulation indispensable
Les neurotechnologies sont les technologies qui ont une influence sur la manière dont sont compris le cerveau et la pensée. Ce domaine connaît un très fort développeme...
08 septembre 2021 - 19:04
Société
Soutenez l'indépendance deLogo FranceSoir

Faites un don

Dessin de la semaine