چگونه میتوان دادهها را برای هزار سال ذخیره کرد؟
دینا زلینسکی، دانشمند ژنومیک انسان در مؤسسه ملی بهداشت و تحقیقات پزشکی فرانسه در خانهاش در پاریس، ظرف شیشهای کوچکی را رو به دوربین لپتاپ خود نگه میدارد تا من (جوسلین تیمپرلی، روزنامهنگار بیبیسی) در تماس ویدئویی آن را ببینم. تشخیص آن سخت است، اما او میگوید که باید بتوانم لایه روشن و تقریباً شفافی را در ته ظرف ببینم که همان DNA است.
اما این DNA خاص است و حاوی کد ژنوم انسان نیست و از حیوان یا ویروسی نیز نیامده است. درعوض، این DNA نمایش دیجیتالی از یک موزه را در خود ذخیره دارد. زلینسکی میگوید: «بهراحتی دهها سال و شاید صدها سال دوام خواهد آورد.»
پژوهش دراینباره که چگونه میتوانیم دادههای دیجیتال را درون رشتههای DNA ذخیره کنیم، در دهه گذشته و در پی توالییابی ژنوم انسان، سنتز DNA و توسعه ژندرمانی بهشدت افزایش پیدا کرده است. دانشمندان فیلمها، کتابها و سیستمهای عامل کامپیوتر را درون DNA رمزگذاری کردهاند. نتفلیکس حتی از آن برای ذخیرهسازی یکی از قسمتهای مجموعهی «بیوهکرها» استفاده کرده است.
اطلاعات ذخیرهشده در DNA مشخص میکند که موجود حاصل از آن اطلاعات چه باشد. اما بسیاری از کارشناسان میگویند DNA شکل فشرده، بادوام و ماندگاری از ذخیرهسازی را فراهم میکند که میتواند جایگزین بسیاری از اشکال دیجیتالی نامطمئنی شود که عمر کوتاهی دارند و برای ذخیرهسازی به انرژی بسیار زیادی نیاز دارند.
در همین حین، برخی از پژوهشگران درحال بررسی راههای دیگری هستند که میتوانیم دادهها را عملاً برای همیشه در آنها ذخیره کنیم، مانند حک کردن اطلاعات روی مهرههای شیشهای بسیار بادوام که از نقاشیهای غار الهام گرفته شده است. اما این دادهها واقعاً چقدر میتوانند دوام بیاورند و آیا واقعاً میتوانیم برای ذخیره حجم عظیمی از دادهها که توسط انسان تولید میشود، بر آنها تکیه کنیم؟
همانطور که به سمت دنیای دیجیتالیتر پیش میرویم، وابستگی ما به دادهها بهشدت افزایش پیدا میکند. فیلمها، عکسها، صفحات وب، اسناد تجاری، سوابق امنیتی حیاتی و همه چیزهایی که استفاده میکنیم، دیجیتالی شدهاند و ما هر روز بیشتر از این شکل از دادهها استفاده میکنیم.
بیشتر مجموعه دادههای که تولید کردهایم، به شکل یک و صفر روی نوارهای مغناطیسی ذخیره میشوند اما این راهحل ایدهآلی نیست. یکی از مشکلات بزرگ، مغناطیسکاهی است. آهنرباهای دائمی بهتدریج میدان مغناطیسی خود را از دست میدهند، بنابراین، برای اطمینان از حفظ دادهها مهم است که هر چند سال یک بار هارد دیسکها بازنویسی شوند. زلینسکی میگوید: «بهطور متوسط شاید حدود ۱۰ تا ۲۰ سال دوام داشته باشد و اگر خوششانس باشید و شرایط عالی باشد ممکن است تا ۵۰ سال بماند.»
در سال ۲۰۱۸، اسپیس ایکس خودروی تسلا رودستر را به همراه نسخه حکاکیشده مجموعه کتاب بنیاد اثر ایزاک آسیموف به فضا فرستاد.
ذخیرهسازی دادهها همچنین به مراکز داده عظیمی نیاز دارد که از مقادیر زیادی انرژی برای خنک نگه داشتن تجهیزات استفاده میکنند که در دنیایی که با بحران انرژی روبهرو است، ایدهآل نیست. این مشکل آنقدر مهم بهنظر میرسد که در سال ۲۰۱۹ برنامه ذخیرهسازی اطلاعات مولکولی ایالات متحده (MIST) با هدف پیدا کردن جایگزینی برای تأسیسات کنونی ذخیرهسازی داده راهاندازی شد. زلینسکی میگوید: «ازنظر سختافزار واقعاً داریم به پایان خط میرسیم. فکر میکنم که صنعت واقعاً توانایی تولید هارد دیسکها و سرورهای کافی برای ذخیرهسازی تمام این اطلاعات را ندارد.»
اما آیا واقعاً نیاز داریم که تمام این دادهها را نگه داریم و آنها را برای مدت طولانی حفظ کنیم؟
افراد به دلایل مختلفی میخواهند دادهها را برای مدت طولانی ذخیره کنند. یکی از دلایل آن علم است. پژوهشگران درحال تولید حجم بیسابقهای از دادهها هستند و هرچه دادههای بیشتری داشته باشند، بهتر است.
- چرا سازندگان هارد دیسک روی ذخیرهسازی دادهها در DNA سرمایهگذاری میکنند؟
- با این وبسایت موقعیت خودروی تسلا رودستر ایلان ماسک را در فضا دنبال کنید
- نوستالژی؛ فلاپی دیسک چیست و آیا هنوز کاربرد دارد؟
لچسار یونکوف، دانشمند کامپیوتر که در آزمایشگاه ملی لس آلاموس روی ذخیرهسازی DNA کار میکند، میگوید، برای مثال، تلسکوپهای رادیویی و شتابدهندههای ذرات مانند برخورددهنده هادرونی بزرگ (LHC) در سازمان تحقیقات هستهای اروپا (CERN) در مرز فرانسه و سوئیس دادههای فراوانی را تولید میکنند و دانشمندان میخواهند همه آنها را حفظ کنند. فقط LHC هر سال ۹۰ پتابایت ( ۹۰ میلیون گیگابایت) داده تولید میکند.
مارک بیث، استاد مهندسی زیستی در مؤسسه فناوری ماساچوست یکی از بنیانگذاران استارتاپ Cache DNA است که با هدف ایجاد دسترسی گسترده و مفید به مولکولهای زیستی تأسیس شد. بیث میگوید تهدیدهای جهانی که بشریت با آن روبهرو است، ما را بر آن میدارد که هم اطلاعات ساخت بشر مانند هنر و علم را حفظ کنیم و هم DNA همه موجودات روی زمین را حفظ کنیم. او میگوید: «اگر قرار باشد حیات اینجا بازآفرینی شود یا به سیاره دیگر برده یا از آنجا آورده شود، با ذخیرهسازی دادهها، سوابقی از آنچه انجام دادیم و آنچه داشتیم، وجود خواهد داشت.»
بسیاری از پژوهشگرانی که روی ذخیرهسازی اطلاعات در DNA کار میکنند، بر این باورند که محیط ذخیرهسازی عالی برای برای ذخیرهسازی گسترده و پایدار پیدا کردهاند.
ما معمولاً DNA را بهعنوان راهی برای ذخیرهسازی اطلاعات ژنومیک میبینیم، اما بسیاری از پژوهشگران درمورد امکان ذخیره حجم عظیمی از دادههای دیجیتالی که مراکز داده سراسر جهان را پر کردهاند، هیجانزده هستند. بیث میگوید DNA در اینجا یک انتخاب منطقی است: «هزاران سال است که طبیعت از DNA برای ذخیرهسازی اطلاعات به شکل ژنوم استفاده میکند. دیانای میلیاردها سال است که وجود دارد و چیزی است میتوانید روی آن حساب کنید. تا زمانی که DNA محیط ذخیرهسازی اطلاعات اساسی گونهای مانند انسان باشد، چیزی خواهد بود که میدانیم با آن چهکار کنیم.»
شتابدهندههای ذرات جهان هر سال صدها پتابایت داده تولید میکنند
زلینسکی میگوید، این واقعیت را که DNA طی ۳/۷ میلیارد سال گذشته بهینه شده است، با عصر اطلاعات مقایسه کنید که در دههی ۱۹۵۰ آغاز شد. او میگوید: «درزمینه فناوریهای ساخت بشر خیلی پیشرفت کردهایم اما فناوریهای ما ازنظر کارآیی از DNA بهتر نیستند. وقتی زندگی ما بهعنوان یک سلول شروع میشود، تمام دستورالعملها برای هدایت تکتک سلولها در آن وجود دارد تا زمانی که به حدود ۳۰ تریلیون سلولی میرسیم که بدن انسان را تشکیل میدهد.»
زلینسکی میگوید علاوهبراین، این واقعیت که میتوانیم قطعات DNA را از حیوانات چند هزار ساله مانند ماموتهای پشمالو بازیابی کنیم که اطلاعات سودمندی را درمورد ژنوم آنها ارائه میدهند، نشان میدهد که DNA بسیار بادوام است.
نیمهعمر DNA (مدت زمانی که طول میکشد تا نصف آن تخریب شود) در فسیلی که به خوبی حفظ شده است، حدود ۵۰۰ سال است، به این معنا که پس از حدود ۱/۵ میلیون سال DNA دیگر قابل خواندن نخواهد بود.
بااینحال، DNA بسیار شکننده است و شرایطی که منجر به تشکیل فسیل میشود، فوقالعاده نادر است. رطوبت، اسید و تشعشات به دیانای آسیب میرسانند. اولگیکا میلنکوویچ، استاد مهندسی برق و کامپیوتر در دانشگاه ایلینوی در اربانا شمپین میگوید: «راههای بسیار زیادی برای تخریب DNA وجود دارد. اما اگر در شرایط سرد و خشک نگهداری شود، صدها سال میماند.».
از طرف دیگر، DNA را میتوان با قرار دادن درون مواد دیگری مانند دانههای شیشهای محافظت کرد که تقلیدی از نحوه محافظت شدن مواد ژنتیکی درون فسیلهای باستانی است. رابرات گراس، پژوهشگر مؤسسه فناوری فدرال زوریخ در سوئیس و تیمش نشان دادهاند که این دانهها از DNA دربرابر مواد شیمیایی و گرما محافظت میکنند.
حفاظت بیشتر میتواند از قرار دادن آن در مکان امن ازنظر فیزیکی حاصل شود. بهگفتهی میلنکوویچ، ذخیره کردن دادههای دیجیتالی که برای بشریت حیاتی است در DNA محصورشده در طاقی یخی میتواند به این معنا باشد که این اطلاعات میتواند تقریباً تا ابد بماند.
یکی دیگر از مزیتهای بزرگ DNA این است که تراکم اطلاعات در آن بالا است تا حدی که هیچ یک از دستگاههای ساخت بشر به پای آن نمیرسد. بهگفتهی یونکوف، حدود ۳۳ زتابایت دادهای که طبق تخمینها، انسان تا سال ۲۰۲۵ تولید خواهد کرد (۳/۳ و ۲۲ صفر جلوی آن) میتواند با ذخیرهسازی درون DNA به اندازه یک توپ پینگپنگ فشرده شود. او بر این باور است که با دستیابی به توانایی ذخیره کردن این مقدار اطلاعات در DNA ممکن است فقط چند دهه فاصله داشته باشیم.
قبل از اینکه مارپیچ مضاعف DNA در سال ۱۹۵۳ کشف شود، بسیاری از دانشمندان معتقد بودند که ساختار آن برای ذخیره اطلاعات بیش از حد ساده است، اما آنها در اشتباه بودند.
علاوهبراین، برخلاف دیگر محیطهای ذخیرهسازی اطلاعات ساخت بشر، بعید است که ذخیرهسازی اطلاعات درون DNA هرگز منسوخ شود. میلنکوویچ میپرسد: «کدامیک از ما هنوز از فلاپیدیسک استفاده میکنیم؟» درمورد DNA، همیشه باید بتوانیم آن را بخوانیم. زلینسکی میگوید: «درمورد هر فناوری ساخت بشر به دستگاه جدیدی برای خواندن آن نیاز دارید. اگر DNA منسوخ شود، در آن شرایط، مسائل دیگری برای نگرانی خواهیم داشت.»
مزیتهای دیگری نیز برای ذخیرهسازی اطلاعات درون DNA وجود دارد. میلنکوویچ خاطرنشان میکند توالیهای DNA قبلا با موفقیت در علوم پزشکی مانند ژندرمانی و زیستشناسی مصنوعی استفاده شده است و این امر با پیشرفت تحقیقات ادامه پیدا میکند. برای ذخیرهسازی آن همچین به انرژی نیازی نیست.
البته چالشهای بزرگی هم وجود دارد. همانطور که در مقالهای که سال ۲۰۱۸ منتشر شد، آمده است، درحالیکه DNA پتانسیل عظیمی بهعنوان ابزار ذخیرهسازی داده در آینده دارد، تنگناهای متعددی مانند هزینههای بسیار زیاد، مکانیسمهای بسیار کند نوشتن و خواندن و آسیبپذیری نسبتبه جهشها یا خطاها وجود دارد که نیاز است برطرف شود.
فرایند تبدیل دادههای دیجیتال به DNA اساسا شامل تبدیل آن به الفبای DNA است. دیانای از چهار مولکول معروف به نوکلئوتید یا باز تشکیل شده است: آدنین (A)، سیتوزین (C)، گوانین (G) و تیمین (T) که با ترتیبهای متفاوتی در رشتههای طولانی به هم متصل شدهاند.
رایجترین روش برای تبدیل اطلاعات دیجیتال به کدهای DNA نیازمند تبدیل صفرها و یکهای کد دیجیتال به این چهار حرف و سپس سنتز DNA مطابق با آن است. میلنکوویچ میگوید: «میتوانید از A برای نشان دادن برای مثال ۰۰، از T برای نشان دادن ۰۱ از G برای نشان دادن ۱۰ و از C برای نشان دادن ۱۱ استفاده کنید. سپس میتوانید هر محتوای دیجیتالی را که به صورت کلاسیک روی دیسک یا نوار یا فلش وجود دارد، به این الفبای چهار حرفی تبدیل کنید.»
سنتز DNA روشی بود که توسط دو مقاله برجستهی منتشرشده در سالهای ۲۰۱۲ و ۲۰۱۳ استفاده شد که هر کدام حدود ۷۰۰ کیلوبایت داده را در DNA ذخیره کردند (رکورد قبلی کمتر از یک کیلوبایت بود).
در مقالهای در سال ۲۰۱۷، زلینسکی (که در آن زمان پژوهشگری در مرکز ژنوم نیویورک بود) و همکارانش یک مقاله علمی، یک فیلم یک دقیقهای، سیستم عامل کامپیوتر، ویروس کامپیوتر و کارت هدیه آمازون (درمجموع حدود دو مگابایت) را با استفاده از این روش روی DNA ذخیره کردند.
البته مانع بزرگ برای ذخیرهسازی دادههای زیاد روی DNA هزینه است که بسیار بیشتر از هزینه ذخیرهسازی دادهها روی سرورها یا هارد دیسکها است. ذخیرهسازی آن پنج مورد دیجیتال برای زلینسکی ۷۵۰۰ دلار هزینه داشت.
زلینسکی میگوید هزینه ذخیرهسازی روی DNA متغیر است، زیرا به روش سنتز و طرح رمزگذاری و نحوه رمزگشایی آن بستگی دارد. او میگوید، تخمین معقول در حدود چند هزار دلار به ازای هر مگابایت داده، هم برای رمزگذاری و هم رمزگشایی با استفاده از توالییابی است.
سخنرانی گتیسبورگ آبراهام لینکلن، رئیسجمهور ایالات متحده، روی توالی DNA تغییریافته باکتری ایکولای ذخیره شده است.
برای مثال، تبدیل این مقاله و تصاویر آن به اطلاعات ذخیرهشده روی DNA به معنای فشردهسازی دادهها از حدود ۲۰ مگابایت به حدود ۵۰۰ کیلوبایت، به کارگیری طرح رمزگذاری، سپس ارسال آن برای آزمایشگاه به منظور سنتز رشته با هزینهای در حدود هزار دلار است.
آزمایشگاه با استفاده از روشی که هر بار یک نوکلئوتید را به هر رشته DNA اضافه میکند، فرایند پرزحمت ساخت آن را تکمیل میکند. زلینسکی میگوید: «بزرگترین مانع سنتز DNA است و کاهش هزینه بزرگترین تمرکز پژوهشگران است.»
اگرچه نیازی نیست که رشتههای حاصل کامل باشند. اگر از آن برای ذخیرهسازی دادهها استفاده میکنید و نه رویههای پزشکی (که سنتز DNA در ابتدا برای آنها توسعه پیدا کرد)، ممکن است نرخ بالاتری از خطا را بتوان تحمل کرد. بنابراین، فضا برای ایجاد روشهای سریعتر و با دقت کمتر سنتز وجود دارد. زلینسکی میگوید: «میتوانید خطاهای موجود در دادهها را مدیریت کنید و همچنان فایلهای خود را بازیابی کنید. بنابراین میتوانیم سنتز غیردقیقتری داشته باشیم.»
بیث میگوید برای اینکه بتواند با محیطهای دیجتال رایج رقابت کند، هزینه ذخیرهسازی اطلاعات روی DNA باید حدود یک میلیون برابر کمتر شود. این راه بسیار طولانی است، اما دانشمندان درحال کار روی روشهایی برای افزایش تعداد مولکولهای DNA هستند که میتواند بهطور همزمان نوشته شود. بیث میافزاید، اگر به صنعت الکترونیک نگاه کنید، آنها شاهد کاهش هزینهها بودهاند. هزینه سنتز دیانای نیز نسبتبه قبل به میزان قابلتوجهی کاهش پیدا کرده است.
گزینه دیگری که نیاز به سنتز ندارد، ذخیرهسازی دادهها در DNA طبیعی است که ویرایش شده است.
در سال ۲۰۲۰ گروه میلنکوویچ دیانای باکتری ایکولای را برای ذخیرهسازی سخنرانی گتیسبورگ آبراهام لینکلن، رئیسجمهور آمریکا و تصویری از یادبود لینکلن، با ایجاد سیستم کارت پانچ برای ایجاد شکافهایی در توالی ژنتیکی باکتری ویرایش کردند (درواقع با ایجاد شکافهایی کوچکی در نوکلئوتیدها با استفاده از سیستمهای ویرایش ژنی مانند کریسپر و آنزیمهای برشدهنده دیگر). این رویکرد درنهایت میتواند ارزانتر از ساخت مولکولهای DNA کاملاً جدید باشد. میلنکوویچ میگوید: «این مدل کاملاً متفاوتی است. شما اطلاعات را در محتوای توالی و به شکل ترکیبی از ATGC ذخیره نمیکنید، بلکه اطلاعات را به شکل تغییرات ساختاری در ماپیچ مضاعف ذخیره میکنید.»
میلنکوویچ میگوید باکتری اصلی به نقطه مرجع کد تبدیل میشود و به سنتز نیازی نیست که به این معنا است که فرایند باید ارزانتر باشد و محصولات جانبی سمی مرتبط با سنتز DNA تولید نمیشوند. اگرچه هزینهای که در اینجا پرداخت میشود، کاهش تراکم دادههایی است که میتوان در رشته خاصی از دیانای ذخیره کرد: «کاهش تقریباً ۵۰ برابری در تراکم را نسبتبه روش سنتز دیانای تخمین زدیم.»
دانشمندان میدانند که دیانای میتواند دادهها را برای هزاران سال ذخیره کند، زیرا قبلا ژنوم بسیاری از حیوانات منقرضشده را رمزگشایی کردهاند.
یکی دیگر از روشهای تجربی برای ذخیرهسازی دادهها در DNA که در سال ۲۰۱۷ توسط دانشمندان هاروارد گزارش شد، وارد کردن قطعاتی از نوکلئوتیدها به رشته DNA موجود در سلول زندهای است که قطعات DNA را بهعنوان نوعی مکانیسم ایمنی در خود ادغام میکند. این تیم کلیپ فیلم سال ۱۸۷۸ ادوارد مایبریج از اسب درحال چهار نعل کردن را درون یک باکتری قرار دادند. میلنکوویچ میگوید: «این اثر در یک موجود زنده باقی میماند. تا زمانی که آن ارگانیسم یا فرزندانش وجود داشته باشند، اطلاعات ذخیره باقی میماند، اگرچه ممکن است در طول زمان جهش پیدا کند و اطلاعات تغییر پیدا کند.»
یونکوف میگوید ازآنجا که میتوانیم دادهها را از فسیلها استخراج کنیم، تقریباً مطمئن هستیم که اطلاعات ذخیرهشده در DNA میتواند دوام زیادی داشته باشد. بنابراین، سؤال جالب این نیست که محیط ذخیرهسازی یعنی مولکولهای DNA تا چه مدت دوام میآورند، بلکه این است که آیا میتوانیم هزار سال دیگر آن دادهها را بخوانیم.
سازمان یونکوف بخشی از گروهی به نام اتحادیه ذخیرهسازی دادهها درون دیانای است که بهدنبال کشف این مسئله است چگونه میتوانیم اطمینان حاصل کنیم که میتوانیم دادهها را در قرنهای آینده رمزگشایی کنیم. یکی از کارگروههای آن که گروه روزتا استون نام دارد، درحال بررسی نحوه ایجاد دستورالعملی جهانی برای نحوه خواندن آرشیو ذخیره دیانای است.
امروزه خواندن دیانای با چالشهای متعددی همراه است. ابتدا باید آن را توالییابی کنید. این کار شامل استفاده از تکنیک مولکولی متداولی به نام پیسیآر برای ساخت تریلیونها نسخه از رشته دیانای میشود که میخواهید رمزگشایی کنید. متأسفانه این فرایند میتواند با خطاهایی همراه باشد. زلینسکی میگوید: «بسیاری از این خطاها را بهراحتی میتوان هنگام رمزگشایی وقتی دیانای را به حالت داده برمیگردانید، کنترل کنید.»
بعد خود توالی میآید و اینجا هم مشکلی وجود دارد. درحالحاضر توالییابی در دستگاههای رومیزی انجام میشود که اجرای آنها چند ساعت طول میکشد. بنابراین، این شکل از ذخیرهسازی دادهها سیستمی نیست که به سرعت به آن دسترسی داشته باشید.
یکی از مواردی که این زمان انتظار را بهبود میدهد، «دسترسی تصادفی» است، یعنی توانایی بررسی دادهها برای بازیابی آنچه بهدنبال آن هستید، بهطوریکه نیازی نباشد کل رشته را توالییابی کنید. این مورد با اضافه کردن بارکد به انتهای رشتههای دیانای نشان داده شده است.
اگرچه بهگفتهی یونکوف، مولکولهای DNA که درحالحاضر تولید میشوند، نسبتاً کوتاه هستند (۱۵۰ تا ۲۰۰ جفت باز). بنابراین، استفاده از بخشی از این فضا برای شناسایی رشته دیانای ازطریق بارکد فضای کمتری برای نوشتن دادههایی که میخواهید ذخیره کنید، باقی میگذارد: «این مشکلی بسیار جدی است. اما وقتی فناوری بهتر شود و بتوانیم مولکولهای بسیار طولانی با هزاران یا دهها هزار جفت باز را بنویسم، مشکل کمکم ناپدید میشود.»
این نگرانی وجود دارد که روزی دیانای سنترشده برای گمراه کردن تحقیقات پزشکی قانونی مورداستفاده قرار گیرد.
در روش دیگری برای بهبود دسترسی تصادفی، تیم بیث رشتههای DNA را در مهرههای سیلیسی قرار داد که با استفاده از رشتههای کوتاهی از نوکلئوتیدها روی سطح مهره برچسبگذاری شده بودند. بیث میگوید همانطور که برای شناسایی محصولات در یک سوپرمارکت بارکد آنها را میخوانید، ما بارکدهایی از جنس اسیدهای نوکلئیک را روی این کپسولهای کوچک دیانای قرار میدهیم تا بتوانیم آنها را شناسایی کنیم و بدانیم حاوی چه اطلاعاتی هستند.
هنوز مشخص نیست که چگونه میتوانیم اطلاعات ذخیرهشده درون DNA را وارد کامپیوترهای درحال کار کنیم. تیم بیث با ایجاد سیستم فایلبندی برای دیانای آزمایشهایی انجام داده است. بیث میگوید: «این کار شبیه تبدیل حالت مایع یا جامد اطلاعات دیانای به چیزی شبیه هارد درایو کامپیوتر است که در آن این توانایی را داشته باشید که آن را مانند موتور جستجویی مانند گوگل مورد جستجو قرار دهید.» حتی مایکروسافت درحال بررسی نحوه تلفیق مولکولهای زیستی در طراحی کامپیوتر است.
بااینحال، سنتز گسترده دیانای با خطراتی همراه خواهد بود. افرادی ممکن است سعی کنند از آن برای ذخیرهسازی اطلاعاتی به جز دادهها استفاده کنند. زلینسکی میگوید در تئوری، مردم میتوانند ویروسها یا باکتریها را سنتز کنند یا حتی دیانای یک فرد را تولید کرده و آن را در صحنه جرم قرار دهند. او میگوید: «در بسیاری از خطوطِ تولید توالیهای ژنتیکی بازسنجیهایی وجود دارد که دادههای تولیدشده را با ژنومهای شناختهشده مقایسه میکنند تا مطمئن شوند که توالی واقعی و مضری مانند توالی یک عامل بیماریزا وجود ندارد.»
بیث موافق است که خطرات و مسائل زیادی در ارتباط با حریم خصوصی وجود دارد. او خاطرنشان میکند که بسیاری از شرکتها بهدنبال تهیه فهرستی از دیانای تمام افراد روی زمین هستند. برخی دیگر اشاره کردهاند که چقدر ترسناک است که تصور کنیم که کسی بتواند توالی دیانای میلیاردها انسان را درون سیستم ذخیرهسازی کوچکی نگهداری کند. بیث میگوید: «باید فناوریهایی را دراینزمینه بسازیم، زیرا اگر این کار را انجام ندهیم، نمیتوانیم این خطرات را کاهش داده یا آنها را درک کنیم.»
با توجه به این مسئله، ارزش آن را دارد که درباره جایگزینهای ذخیرهسازی دادهها درون دیانای فکر کنیم. پیتر کازنسکی، استاد الکترونیک نوری در دانشگاه ساوتهمپتون نوعی فناوری ذخیرهسازی نوری را توسعه داده است که بهعقیدهی او رقیب شایستهای محسوب میشود که میتواند میلیونها یا حتی میلیاردها سال دوام بیاورد.
این تیم با نوشتن لیزری فمتوثانیهای (یک میلیونیم یک میلیاردم ثانیه) کار میکنند و با استفاده از لیزری شبیه لیزر مورد استفاده در جراحی چشم، اطلاعات را روی دیسکهای شیشهای سیلیسی بادوام حک میکنند. پالسهای لیزری کوتاه و شدید به روش خاصی متمرکز میشوند تا انفجار ریزی را ایجاد کنند که باعث ایجاد حفرهی ریزی درون شیشه میشود. کازنسکی میگوید: «در این شرایط نانوساختارهای بسیار ریزی میتواند تشکیل شود و ما از این ساختارها برای رمزگذاری اطلاعات استفاده میکنیم.»
کازنسکی میگوید این فرایند شبیه نحوه سوزاندن (burn) سیدیها و دیویدیها با استفاده از پلیمرهای نور لیزری یا رنگ به منظور ثبت اطلاعات است، اما در اینجا ساختارها بسیار ریز و پایدار هستند و در دمای تا حداقل هزار درجه سانتیگراد پایدار بوده و توسط تشعشات آسیب نمیبینند. او میگوید: «یکی از مزیتهای روش ذخیرهسازی ما ماندگاری آن است که میتواند تقریباً تا ابد باقی بماند.»
این فناوری اطلاعات را در پنج بُعد تولید میکند: علاوه بر سه بعد عادی که توسط حفره ایجاد میشود، جهت و شکل حفره را نیز میتوان کنترل کرد که امکان ذخیرهسازی متراکمتر دادهها را فراهم میکند. این تراکم هرگز نمیتواند به تراکم دیانای برسد، اما با افزایش لایهها در حکاکی به آرامی افزایش پیدا میکند. تاکنون اسنادی ازجمله اعلامیه جهانی حقوق بشر، منشور کبیر انگلیس، کتاب مقدس شاه جیمز و مجموعه راهنمای مسافر مجانی کهکشان با استفاده از این فناوری ذخیره شدهاند.
دیانای میتواند حجم بالایی از دادهها را در یک منطقه میکروسکوپی ذخیره کند.
در سال ۲۰۱۸، ایلان ماسک حکاکی مجموعه علمیتخیلی بنیاد اثر آیزاک آسیموف را با موشک فالکون هِوی به فضا فرستاد، درحالیکه مایکروسافت فیلم سوپرمن ۱۹۷۸ را درون یک شیشه ذخیره کرده است. هنرمند میکا تاجیما حتی دادههای عواطف انسانی را با استفاده از این روش ذخیره کرده است. او تمام توییتهای ارسالشده در ژاپن در سال ۲۰۲۰ را جمعآوری و ذخیره کرد. کازنسکی میگوید: «از فرایندی مشابه چیزی که مردم باستان استفاده میکردند، استفاده میکنیم. آنها به کمک ابزار روی سنگها علامتهایی حک میکردند.»
مشابه با روش ذخیرهسازی دادهها در DNA، یکی از مشکلات اصلی ذخیرهسازی دادهها به این روش سرعت نوشتن است. کازنسکی میگوید تیم او اکنون میتواند با سرعت ۵۰۰ کیلوبایت بر ثانیه بنویسد درحالیکه هدف آزمایش اولیه که یک دهه پیش انجام شد، حداکثر ۰/۱ کیلوبایت بر ثانیه بود. او میگوید: «برای اینکه کاربردی باشد، نیاز است که سرعت شما حداقل هزار کیلوبایت در ثانیه باشد.» مانع دیگر خواندن دادهها است که درحالحاضر باید به شکل دستی و به کمک میکروسکوپ نوری انجام شود. او میگوید باید دستگاهی ساخته شود که روی نمونه حرکت کند و اطلاعات حکشده روی آن را بخواند.
دستگاه کنونی مورد استفاده برای حکاکی یک اتاق را پر میکند و از لیزر ۱۱۲ هزار دلاری استفاده میکند، اگرچه کازنسکی معتقد است که اندازه و هزینه آن میتواند کاهش پیدا کند.
درحالیکه DNA قرار گرفته در حفاظ شیشهای، دربرابر دما و تشعش مقاوم است، محصور کردن خود شیشه در مادهای قوی ممکن است ایده خوبی برای کسی باشد که میخواهد از ماندگاری آن اطمینان حاصل کند، زیرا شیشه بهراحتی با سنگ شکسته میشود. زلینسکی میگوید: «فکر میکنم که روش حکاکی نسبتبه شرایط محیطی حساسیت کمتری دارد. درحالیکه این روش به اندازه دیانای متراکم نیست، همچنان راه بسیار کارآمدی برای ذخیرهسازی دادههای حیاتی است و مطمئناً میتوانید خیلی کمتر درمورد آن نگران باشید. هر دستگاهِ ذخیرهسازی فرصتها، مزیتها و معایب خود را دارد و فکر میکنم که دیانای میتواند یکی از روشهای مکمل باشد.»
پژوهشگران دیگر گزینههای مولکولی غیر دیانای را برای رمزگذاری دادهها دنبال میکنند، مانند روشهایی که از زنجیرههایی از سایر مولکولهای مصنوعی استفاده میکنند که ساخت آنها راحتتر و ارزانتر است. برای مثال، کد میتواند ازطریق کنترل کردن جرم مولکولها تولید شود و جرمهای متفاوت نشاندهنده ترکیبهای مختلف صفرها و یکها باشد.
درحالحاضر این توانایی را داریم که دادههای دیجیتال را در DNA رمزگذاری کنیم و آن را محصور کنیم و برای صدها یا هزاران سال از آن محافظت کنیم. مسئله مهمی که در اینجا وجود دارد این است که کدام دادهها را برای این کار انتخاب کنیم یا چگونه بر تنگنای سنتز دیانای غلبه کنیم تا بتوانیم حجم عظیمتری از دادهها را ذخیره کنیم. یونکوف میگوید: «درمورد استفاده از DNA برای ذخیرهسازی دادهها هیجانزدهام، اما فکر میکنم ۲۰ سال دیگر نیاز داریم تا به آنجا برسیم.» اگرچه او خاطرنشان میکند که برخی شرکتها بر این باورند که طی پنج سال آینده به محصول موفقیتآمیزی دست پیدا میکنند.
زلینسکی معتقد است که انسانها طی پنج تا ده سال آینده استفاده از DNA را برای ذخیرهسازی دادههای سردی مانند سوابق مالی یا دادههای تاریخی که لازم نیست بهطور مکرر به آنها دسترسی داشت، شروع میکنند. او در پاسخ به این پرسش که آیا میتوانیم روزی DNA خودمان را روی دستگاهی در خانه چاپ کنیم، میگوید که فکر میکند بالاخره این اتفاق خواهد افتاد.