Новое достижение учёных из Microsoft позволит создать эксабайтные диски

перевод
Cat1987 21 февраля в 18:21 14,4k
Оригинал: Liam Tung


Перспектива появления огромных хранилищ данных, основанных на ДНК, стала вполне реальной благодаря новому методу извлечения данных.

Уже сейчас Microsoft видит в синтетической ДНК перспективный носитель информации, который сможет удовлетворить потребности в хранении больших данных. Предыдущие исследования показали, что всего лишь несколько грамм ДНК способны хранить в себе эксабайт данных, при этом срок их хранения составляет около 2000 лет.

Но главным недостатком этой технологии явялется дороговизна и медленность записи, которая включает в себя преобразование нулей и единиц в нуклеотиды. Извлечение данных из ДНК представляет собой секвенирование и обратный перевод файлов в нули и единицы. Поиск и извлечение определенных файлов также является большой проблемой.

Но это осталось в прошлом — ученые из Microsoft Research и Вашингтонского университета впервые получили произвольный доступ к ДНК-носителю в крупном масштабе. Как они объяснили, отсутствие произвольного доступа или возможности выборочного извлечения файлов из ДНК-хранилища приводит к тому, что для нахождения нужных файлов пользователь должен секвенировать и декодировать весь набор данных. Получение произвольного доступа позволит уменьшить количество операций по секвенированию.

Для получения произвольного доступа к ДНК учёные создали библиотеку праймеров, которые прикреплены к каждой последовательности молекулы и используются в качестве мишеней для выбора нужных её фрагментов.

Исследователи также разработали алгоритм для более эффективного декодирования и восстановления данных. Старший научный сотрудник Microsoft Сергей Еханин отметил, что новые алгоритмы более терпимы к ошибкам в написании и чтении последовательностей ДНК, что сокращает секвенирование и обработку данных, необходимую для их восстановления.

В синтетической ДНК было закодировано 200 мегабайт данных, состоящих из 35 файлов объёмом от 29 килобайт до 44 мегабайт. В данных файлах содержатся HD-видео, аудиофайлы, изображения и тексты. Учёные полагают, что метод, который они использовали для случайного доступа, будет масштабироваться до физически изолированных ДНК-пулов, способных вмещать в себя несколько терабайт.
Проголосовать:
+25
Сохранить: