حافظه مبتنی بر DNA چیست و چرا میلیونها برابر بهینهتر از هارد درایو به حساب میآید؟
وقتی فضاپیماهای وویجر ناسا در سال ۱۹۷۷ به فضا فرستاده شدند تا به پژوهش روی محدودیتهای منظومه شمسی ما بپردازند، با خود دو فایل حمل میکردند که شامل تصاویر و اصواتی بودند که حیات زمینی را ترسیم میکردند. اما در آینده، بهترین کنسول فضایی نسل بعدی را میتوان درون بدن ما انسانها یافت.
این بدان خاطر است که دیانای، در ذخیرهسازی داده میلیونها برابر بهینهتر از هارد درایو مغناطیسی موجود در لپتاپ یا کامپیوتر شما عمل میکند. از آنجایی که دادههایی به مراتب متراکمتر از آنچه روی سیلیکون امکانپذیر است را میتوان در دیانای ذخیرهسازی کرد، اساسا قادر به جای دادن تمام دادههای جهان درون تنها چند گرم دیانای هستید.
ایلیا فینکلشتاین، دستیار پروفسور زیستشناسی مولکولی در دانشگاه تگزاس میگوید: «از آنجایی که دیانای از سوی تمام گونههای حیات به عنوان اصلیترین مدیوم ذخیرهسازی اطلاعات انتخاب شده، اساسا با سیستمی بسیار قدرتمند روبهرو هستیم. مدتهای طولانی بعد از اینکه حافظههای مغناطیسی ما شکلی منسوخ به خود بگیرند، طبیعتا همچنان در حال استفاده از دیانای خواهد بود».
فینکلشتاین عضو تیمی در دانشگاه تگزاس شهر آستین است که میخواهد بیشترین استفاده ممکن را از متدهای ذخیرهسازی مبتنی بر دیانای ببرد. اگرچه این حوزه حداقل از دهه ۱۹۸۰ میلادی نقطهای تلاقی میان زیستشناسی مولکولی و علوم کامپیوتر بوده، محققان تا به امروز به سختی قادر به برطرفسازی خطاهایی بودهاند که دیانای مداوما به وجود میآورد.
در مقالهای که اخیرا در ژورنال Proceedings of the National Academy of Science منتشر شده، فینکلشتاین و اعضای دیگر تیم به ارائه جزییات مربوط به متد تصحیح خطای جدید خود پرداختهاند. آنها توانستهاند تمام رمان جادوگر شهر اُز را به زبان اسپرانتو و با دقت بیشتری نسبت به متدهای مبتنی بر دیانای پیشین ذخیره کردهاند. به این ترتیب ما در مسیر دستیابی به متدهای آتی ذخیرهسازی داده قرار گرفتهایم.
تاریخچهای کوتاه از ذخیرهسازی مبتنی بر دیانای
محققان دانشگاه تگزاس به طور یقین نخستین دانشمندانی نیستند که در صدد انکد یک اثر هنری درون رشتههای دیانای برآمدهاند.
سابقه ذخیرهسازی مبتنی بر دیانای در واقع به سال ۱۹۸۸ میلادی و آزمایشی در دانشگاه هاروارد بازمیگردد. محققین این دانشگاه توانستند تصویری متعلق به یکی از آثار هنری جو دیویز را درون یک رشته دیانای اشریشیا کلی ذخیرهسازی کنند. هنگام دیکد، این تصویر ماتریکسی ۵ در ۷ به وجود آورد.
تا سال ۲۰۱۱ میلادی، محققان انستیتوی بیوانفورماتیک اروپا در بریتانیا هم رویکردی مشابه در پیش گرفتند. نیک گلدمن، تکنیسین بیوانفورماتیک، مشغول صحبت با همکاران خود راجع به این بود که چطور میتوان رشتههای ژنومی که جهان مقادیری بسیار فراوان از آنها را تولید کرده را یکی پس از دیگری روی هم ذخیره کرد. این بحثی بود که به عنوان شوخی شروع شد.
خودش به نشریه Nature میگوید: «با خودمان فکر کردیم چه چیزی جلوی ما را گرفته که از دیانای برای ذخیرهسازی اطلاعات استفاده نکنیم؟». دو سال بعد، این گروه توانسته بود با موفقیت، ۵ فایل مختلف را درون رشتههای دیانای انکد کند، از جمله سخنرانی معروف «من رویایی دارم» مارتین لوتر کینگ جونیور و غزلهایی از شکسپیر.
در ماه نوامبر ۲۰۱۶، یکی از شرکتهای زیرمجموعه انستیتوی تکنولوژی ماساچوست به نام Catalog، توانست ۱۴۴ کلمه از شهر معروف «راه نرفته» از رابرت فراست را در رشتههای دیانای ذخیره کند. این فایل حدودا یک کیلوبایت حجم داشت.
در همان سال، تیمی از محققین مایکروسافت و دانشگاه واشنگتن توانستند ۲۰۰ مگابایت داده را درون رشتهای طولانی از دیانای جای دهند، بخشی از این داده، رمان شهیر جنگ و صلح بود. در ماه مارس ۲۰۱۹، همین تیم حتی توانست به توسعه نخستین سیستم ذخیرهسازی و بازیابی اتوماتیک داده بپردازند که از مواد ژنتیکی ساخته شده.
امروز بسیاری از شرکتهای بزرگ تکنولوژی وارد این حوزه شدهاند و از جمله آنها میتوان به IBM و گوگل اشاره کرد. حتی سازمان فوق سری «پروژههای فعالیت تحقیقاتی پیشرفته اطلاعاتی» ایالات متحده -که همتای دولتی دارپا به حساب میآید، اما برای جاسوسها- هم به سرمایهگذاری در این حوزه پرداخته است. محققان تمام این شرکتها و سازمانها آیندهای را متصور شدهاند که در آن میتوانیم ارزشمندترین دادههایمان را درون ویالهای دیانای ذخیرهسازی کنیم و هر زمان که لازم بود، آنها را از آزمایشگاههای تاریک و خنک بیرون بکشیم.
حافظه مبتنی بر دیانای چطور کار میکند؟
هارد درایو مغناطیسی یکی از محبوبترین متدها برای ذخیرهسازی داده در کامپیوترهای امروزی به حساب میآید. درون این حافظهها، یک جفت دیسک گردان به نام «دیس» یا «Platter» خواهید یافت که شبیه به یک سیدی هستند. این دیسها، دادهها را در قالب ۰ و ۱ (یا کد باینتری) روی سطوح خود ذخیره میکنند. با تعبیه شدن روی یک محور، دیس به گردش میافتد و یک جریان الکترونیکی، داده را روی سطح مینویسد یا از روی آن میخواند. قطعات الکترونیکی نیز به تمام عملیات قوت میرسانند.
به صورت مشابه، حافظه مبتنی بر دیانای نیازمند تدابیر انکد و دیکد است. در این مورد خاص، محققان به صورت شیمیایی به تولید دیانای مصنوعی با خواصی مشخص میسازند که بر مبنای چهار نوکلئوتید به دست میآیند: آدنین (A)، کیتوزین (C)، گوانین (G) و تیمین (T). این نوکلئوتیدها هستند که ساختار حلزونی و نردبانی مواد ژنتیکی را میسازند.
از آنجایی که دیانای چهار بلوک سازنده دارد، به جای استفاده از ۰ و ۱ های باینری در هارد درایوهای مغناطیسی، متد حافظه ژنتیکی به مراتب متراکمتر است. این را جان هاوکینز، یکی از نویسندگان مقاله اخیر میگوید. «یک قاشق غذاخوری دیانای حاوی مقادیری از اطلاعات است که به صورت معمول برای ذخیرهسازی آنها با تکنولوژیهای کنونی، به دیتاسنترهایی هماندازه ۱۰ سوپرمارکت والمارت نیاز خواهید داشت. یا آنطور که برخی مردم ترجیح میدهند بیانش کنند، میتوانید تمام اینترنت را در یک جعبه کفش جای دهید».
نهتنها این، بلکه دیانای آیندهای تضمین شده دارد. هاوکینز زمانی را به یاد میآورد که طی دهه ۱۹۹۰ میلادی، سیدیها اصلیترین متد ذخیرهسازی داده بودند و این وعده به ما داده شده بود که داده تا ابد روی سیدی باقی میماند، چرا که پلاستیک عمری بسیار طولانی دارد. داده ذخیره شده روی دیانای از طرف دیگر میتواند صدها هزار سال باقی بماند. در واقع یک شاخه علمی کامل به نام باستانشناسی ژنتیکی داریم که با بررسی طول عمر دیانای، در صدد درک گذشته باستان برآمده است.
فراتر از این، دیانای بعد از ذخیرهسازی داده نیاز به هیچگونه نگهداری و رسیدگی ندارد. هرچه نباشد فسیلهای بعد از سپری کردن میلیونها سال در زیر زمین، کماکان رشتههای دیانای را در خود نگه داشتهاند. حافظه دیانای نیازی به هیچگونه انرژی هم ندارد و صرفا باید در جایی تاریک و خنک نگهداری شود تا بالاخره یک نفر یک روز تصمیم به استفاده از دادههای درون آن بگیرد. اما هاوکینز میگوید بزرگترین مزیت اینست که خواندن داده از روی دیانای و نوشتن آن هیچوقت شلی منسوخ به خود نخواهد گرفت.
«اگر من بخواهم مقالهای که در کودکی نوشتهام را بخونم، باید نخست به یک موزه رفته و کامپیوتری سالم و متعلق به آن دوران را بیابم. و من تازه در دهه چهارم زندگیام به سر میبرم. اما دیانای به شکلی منحصر به فرد آیندهای تضمین شده دارد، زیرا خود ما از آن ساخته شدیم. تا زمانی که انسانها از دیانای ساخته شده باشند، همواره ماشینهایی دم دست خواهیم داشت که قادر به خواندن اطلاعات هستند.
عبور از خطاها
اما مثل تمام متدهای ذخیرهسازی داده، دیانای نواقص و مشکلات خودش را نیز دارد. برجستهترین چالش در استفاده از این متد، هزینه است. هاوکینز میگوید که متدهای کنون از نظر هزینه مشابه Apple Hard Disk 20 در دهه ۱۹۸۰ میلادی هستند. در آن زمان، حدودا ۲۰ مگابایت فضای ذخیرهسازی -معادل با میزان دادهای که برای دانلود یک ویدیوی ۱۵ دقیقهای نیاز دارید- حدودا ۱۵۰۰ دلار هزینه به همراه میآورد.
گذشته از این، دیانای محکوم به خطا است. بیایید دوباره راجع به نوکلئوتیدهایی که نردبان دیانای را میسازند صحبت کنیم. به صورت میانگین، به ازای هر ۱۰۰ الی ۱۰۰۰ نوکلئوتید، یک خطا درون دیانای رخ میدهد و این خطاها میتوانند به سه شکل بروز پیدا کنند: جایگزینی، جاگذاری و حذف.
در یک جهش جایگزینی، یک حرف واحد درون رشتهای از نوکلئوتید ممکن است جای خود را به حرفی دیگر بدهد. مثلا ممکن است کیتوزین جایگزین تیمین شود، هرچند که طول رشتههای دیانای یکسان باقی میماند. در جاگذاری و حذف اما دیانای یک پایه نوکلئوتیدی اضافه به دست میآورد یا یک پایه را حذف میکند. اما برخلاف ارورهای موجود در کدهای کامپیوتری، شاهد هیچگونه فضای خالی در جایی که پایه حذف شده قبلا وجود داشته نخواهید بود. بنابراین هنگام دیکد داده ذخیره شده درون دیانای، این موضوع خیلی سریع تبدیل به مشکلی بزرگ میشود.
هاوکینز به مقایسه این موضوع با کلمات انگلیسی میپردازد: «با حذف یک حرف L، عبارت World تبدیل به Word میشود. حالا اگر یک S در این عبارت جاگذاری شود، کلمه Sword به دست میآید. خواندن ورژن صحیح Sword که قرار بوده World باشد شکلی دشوار به خود میگیرد، زیرا Sword کماکان یک کلمه واقعی در زبان انگلیسی است. اما حروف تغییر مکان دادهاند.»
در دیگر فرمهای حافظه دیانای، با تکرار کردن ۱۰ یا ۱۵ باره کد میتوان از این ارورها عبور کرد، اما چنین کاری به معنای اتلاف فضای ذخیرهسازی نیز هست. در متد تازهای که محققان در مقاله اخیر خود به آن پرداختهاند، داده را به صورت مشبک درون دیانای قرار دادهاند و هر بیت داده، داده بعدی را تقویت میکند و به این ترتیب لازم است تنها یکبار خوانده شود.
آنها ضمنا به توسعه الگوریتمی پرداختهاند که به صورت یکجا به ارورهای جاگذاری، حذف و جایگزینی رسیدگی میکند و حافظه دیجیتالی مبتنی بر دیانای شکلی بهینهتر به خود میگیرد. به همین خاطر بوده که تیم مورد نظر توانسته به آسانی جادوگر شهر از را درون رشتههای دیانای جای دهد و در این مسیر نیازمند تکرار ترکیبهای A و C و T و G بهصورت پیدرپی نبوده است.
تصویری از آینده
با حرکت به سمت آینده، پتانسیل حافظههای مبتنی بر دیانای عملا نامحدود خواهد بود. فینکلشتاین تصویری از آیندهای را ترسیم میکند که در آن، میتوانیم از دیانای حاوی داده درون مواد دیگر استفاده کنیم.
او میگوید در یک مثال، محققان یک تکه پلاستیک چاپ سهبعدی شده را به رشتههای دیانای حاوی فایلهای طراحی همان پلاستیک چاپ شده مجهز کردند. همینطور که تکه پلاستیکی از درون پرینتر عبور میکند، قادر به رها کردن دیانای است تا بازتولید فایل در پروسهای دائمی صورت بگیرد.
یا می توانید از حافظه داده مبتنی بر دی ان ای به عنوان راهی برای به دست آوردن اطلاعات راجع به اشیای ثباتی که ماده ژنتیکی مخصوص به خود را ندارند استفاده کنید. فرض میکنیم که یک هواپیما را با مادهای که حاوی دیانای است میپوشانید و دستورالعمل کامل ساخت هواپیما را درونش تعبیه میکنید. اگر مشکلی پیش آید و هواپیما در دریا سقوط کند، دیانای تعبیه شده در لایه رویی به خاطر اشعههای فرابنفش خورشید تجزبه میشود.
این روند تجزیه میتواند راهی برای جمعآوری اطلاعات راجع به اتفاقی که برای هواپیما افتاده باشد. حتی اگر تنها یک تکه از لاشه هواپیما کشف شود هم دانشمندان میتوانند دیاندی ذخیره شده و میزان تجزیه را تحلیل کرده و بفهمند هواپیما برای چه مدت در دریا گم شده بوده است.
اما حتی با دستاوردهای مهمی که فینکلشتاین و تیمش داشتهاند هم حافظه دیجیتالی مبتنی بر دیانای هنوز مسیری طولانی در پیش دارد. او میگوید: «به نظرم در موارد بسیار خاص بزودی قادر به استفاده از چنین حافظههای هستیم. اما فکر نمیکنم که تا یک دهه دیگر یا حتی بیشتر شاهد عرضه آن به بازار به عنوان محصولی عمومی باشیم».
اما هر زمان که چنین چیزی امکانپذیر شود، حافظه مبتنی بر دیانای بزرگترین گامی خواهد بود که بشر تاکنون در زمینه ذخیرهسازی داده برداشته است.