حافظه مبتنی بر DNA چیست و چرا میلیون‌ها برابر بهینه‌تر از هارد درایو به حساب می‌آید؟

9 جولای 2021

26 زمان تقریبی مطالعه 7 دقیقه

وقتی فضاپیماهای وویجر ناسا در سال ۱۹۷۷ به فضا فرستاده شدند تا به پژوهش روی محدودیت‌های منظومه شمسی ما بپردازند، با خود دو فایل حمل می‌کردند که شامل تصاویر و اصواتی بودند که حیات زمینی را ترسیم می‌کردند. اما در آینده، بهترین کنسول فضایی نسل بعدی را می‌توان درون بدن ما انسان‌ها یافت.

این بدان خاطر است که دی‌ان‌ای، در ذخیره‌سازی داده میلیون‌ها برابر بهینه‌تر از هارد درایو مغناطیسی موجود در لپ‌تاپ یا کامپیوتر شما عمل می‌کند. از آن‌جایی که داده‌هایی به مراتب متراکم‌تر از آنچه روی سیلیکون امکان‌پذیر است را می‌توان در دی‌ان‌ای ذخیره‌سازی کرد، اساسا قادر به جای دادن تمام داده‌های جهان درون تنها چند گرم دی‌ان‌ای هستید.

ایلیا فینکلشتاین، دستیار پروفسور زیست‌شناسی مولکولی در دانشگاه تگزاس می‌گوید: «از آن‌جایی که دی‌ان‌ای از سوی تمام گونه‌های حیات به عنوان اصلی‌ترین مدیوم ذخیره‌سازی اطلاعات انتخاب شده، اساسا با سیستمی بسیار قدرتمند روبه‌رو هستیم. مدت‌های طولانی بعد از اینکه حافظه‌های مغناطیسی ما شکلی منسوخ به خود بگیرند، طبیعتا همچنان در حال استفاده از دی‌ان‌ای خواهد بود».

فینکلشتاین عضو تیمی در دانشگاه تگزاس شهر آستین است که می‌خواهد بیشترین استفاده ممکن را از متدهای ذخیره‌سازی مبتنی بر دی‌ان‌ای ببرد. اگرچه این حوزه حداقل از دهه ۱۹۸۰ میلادی نقطه‌ای تلاقی میان زیست‌شناسی مولکولی و علوم کامپیوتر بوده، محققان تا به امروز به سختی قادر به برطرف‌سازی خطاهایی بوده‌اند که دی‌ان‌ای مداوما به وجود می‌آورد.

در مقاله‌ای که اخیرا در ژورنال Proceedings of the National Academy of Science منتشر شده، فینکلشتاین و اعضای دیگر تیم به ارائه جزییات مربوط به متد تصحیح خطای جدید خود پرداخته‌اند. آن‌ها توانسته‌اند تمام رمان جادوگر شهر اُز را به زبان اسپرانتو و با دقت بیشتری نسبت به متدهای مبتنی بر دی‌ان‌ای پیشین ذخیره کرده‌اند. به این ترتیب ما در مسیر دستیابی به متدهای آتی ذخیره‌سازی داده قرار گرفته‌ایم.

تاریخچه‌ای کوتاه از ذخیره‌سازی مبتنی بر دی‌ان‌ای

محققان دانشگاه تگزاس به طور یقین نخستین دانشمندانی نیستند که در صدد انکد یک اثر هنری درون رشته‌های دی‌ان‌ای برآمده‌اند.

سابقه ذخیره‌سازی مبتنی بر دی‌ان‌ای در واقع به سال ۱۹۸۸ میلادی و آزمایشی در دانشگاه هاروارد بازمی‌گردد. محققین این دانشگاه توانستند تصویری متعلق به یکی از آثار هنری جو دیویز را درون یک رشته دی‌ان‌ای اشریشیا کلی ذخیره‌سازی کنند. هنگام دیکد، این تصویر ماتریکسی ۵ در ۷ به وجود آورد.

تا سال ۲۰۱۱ میلادی، محققان انستیتوی بیوانفورماتیک اروپا در بریتانیا هم رویکردی مشابه در پیش گرفتند. نیک گلدمن، تکنیسین بیوانفورماتیک، مشغول صحبت با همکاران خود راجع به این بود که چطور می‌توان رشته‌های ژنومی که جهان مقادیری بسیار فراوان از آن‌ها را تولید کرده را یکی پس از دیگری روی هم ذخیره کرد. این بحثی بود که به عنوان شوخی شروع شد.

خودش به نشریه Nature می‌گوید: «با خودمان فکر کردیم چه چیزی جلوی ما را گرفته که از دی‌ان‌ای برای ذخیره‌سازی اطلاعات استفاده نکنیم؟». دو سال بعد، این گروه توانسته بود با موفقیت، ۵ فایل مختلف را درون رشته‌های دی‌ان‌ای انکد کند، از جمله سخنرانی معروف «من رویایی دارم» مارتین لوتر کینگ جونیور و غزل‌هایی از شکسپیر.

در ماه نوامبر ۲۰۱۶، یکی از شرکت‌های زیرمجموعه انستیتوی تکنولوژی ماساچوست به نام Catalog، توانست ۱۴۴ کلمه از شهر معروف «راه نرفته» از رابرت فراست را در رشته‌های دی‌ان‌ای ذخیره‌ کند. این فایل حدودا یک کیلوبایت حجم داشت.

در همان سال، تیمی از محققین مایکروسافت و دانشگاه واشنگتن توانستند ۲۰۰ مگابایت داده را درون رشته‌ای طولانی از دی‌ان‌ای جای دهند، بخشی از این داده،‌ رمان شهیر جنگ و صلح بود. در ماه مارس ۲۰۱۹، همین تیم حتی توانست به توسعه نخستین سیستم ذخیره‌سازی و بازیابی اتوماتیک داده بپردازند که از مواد ژنتیکی ساخته شده.

امروز بسیاری از شرکت‌های بزرگ تکنولوژی وارد این حوزه شده‌اند و از جمله آن‌ها می‌توان به IBM و گوگل اشاره کرد. حتی سازمان فوق سری «پروژه‌های فعالیت تحقیقاتی پیشرفته اطلاعاتی» ایالات متحده -که همتای دولتی دارپا به حساب می‌آید، اما برای جاسوس‌ها- هم به سرمایه‌گذاری در این حوزه پرداخته است. محققان تمام این شرکت‌ها و سازمان‌ها آینده‌ای را متصور شده‌اند که در آن می‌توانیم ارزشمندترین داده‌هایمان را درون ویال‌های دی‌ان‌ای ذخیره‌سازی کنیم و هر زمان که لازم بود، آن‌ها را از آزمایشگاه‌های تاریک و خنک بیرون بکشیم.

حافظه مبتنی بر دی‌ان‌ای چطور کار می‌کند؟

هارد درایو مغناطیسی یکی از محبوب‌ترین‌ متدها برای ذخیره‌سازی داده در کامپیوترهای امروزی به حساب می‌آید. درون این حافظه‌ها، یک جفت دیسک گردان به نام «دیس» یا «Platter» خواهید یافت که شبیه به یک سی‌دی هستند. این دیس‌ها، داده‌ها را در قالب ۰ و ۱ (یا کد باینتری) روی سطوح خود ذخیره می‌کنند. با تعبیه شدن روی یک محور، دیس به گردش می‌افتد و یک جریان الکترونیکی، داده را روی سطح می‌نویسد یا از روی آن می‌خواند. قطعات الکترونیکی نیز به تمام عملیات قوت می‌رسانند.

به صورت مشابه، حافظه مبتنی بر دی‌ان‌ای نیازمند تدابیر انکد و دیکد است. در این مورد خاص، محققان به صورت شیمیایی به تولید دی‌ان‌ای مصنوعی با خواصی مشخص می‌سازند که بر مبنای چهار نوکلئوتید به دست می‌آیند: آدنین (A)، کیتوزین (C)، گوانین (G) و تیمین (T). این نوکلئوتیدها هستند که ساختار حلزونی و نردبانی مواد ژنتیکی را می‌سازند.

از آن‌جایی که دی‌ان‌ای چهار بلوک سازنده دارد، به جای استفاده از ۰ و ۱ های باینری در هارد درایوهای مغناطیسی، متد حافظه ژنتیکی به مراتب متراکم‌تر است. این را جان هاوکینز، یکی از نویسندگان مقاله اخیر می‌گوید. «یک قاشق غذاخوری دی‌ان‌ای حاوی مقادیری از اطلاعات است که به صورت معمول برای ذخیره‌سازی آن‌ها با تکنولوژی‌های کنونی، به دیتاسنترهایی هم‌اندازه ۱۰ سوپرمارکت والمارت نیاز خواهید داشت. یا آنطور که برخی مردم ترجیح می‌دهند بیانش کنند، می‌توانید تمام اینترنت را در یک جعبه کفش جای دهید».

نه‌تنها این، بلکه دی‌ان‌ای آینده‌ای تضمین شده دارد. هاوکینز زمانی را به یاد می‌آورد که طی دهه ۱۹۹۰ میلادی، سی‌دی‌ها اصلی‌ترین متد ذخیره‌سازی داده بودند و این وعده به ما داده شده بود که داده تا ابد روی سی‌دی باقی می‌ماند، چرا که پلاستیک عمری بسیار طولانی دارد. داده ذخیره‌ شده روی دی‌ان‌ای از طرف دیگر می‌تواند صدها هزار سال باقی بماند. در واقع یک شاخه علمی کامل به نام باستان‌شناسی ژنتیکی داریم که با بررسی طول عمر دی‌ان‌ای، در صدد درک گذشته باستان برآمده است.

فراتر از این، دی‌ان‌ای بعد از ذخیره‌سازی داده نیاز به هیچ‌گونه نگهداری و رسیدگی ندارد. هرچه نباشد فسیل‌های بعد از سپری کردن میلیون‌ها سال در زیر زمین، کماکان رشته‌های دی‌ان‌ای را در خود نگه داشته‌اند. حافظه دی‌ان‌ای نیازی به هیچ‌گونه انرژی هم ندارد و صرفا باید در جایی تاریک و خنک نگهداری شود تا بالاخره یک نفر یک روز تصمیم به استفاده از داده‌های درون آن بگیرد. اما هاوکینز می‌گوید بزرگ‌ترین مزیت اینست که خواندن داده از روی دی‌ان‌ای و نوشتن آن هیچوقت شلی منسوخ به خود نخواهد گرفت.

«اگر من بخواهم مقاله‌ای که در کودکی نوشته‌ام را بخونم، باید نخست به یک موزه‌ رفته و کامپیوتری سالم و متعلق به آن دوران را بیابم. و من تازه در دهه چهارم زندگی‌ام به سر می‌برم. اما دی‌ان‌ای به شکلی منحصر به فرد آینده‌ای تضمین شده دارد، زیرا خود ما از آن ساخته شدیم. تا زمانی که انسان‌ها از دی‌ان‌ای ساخته شده باشند، همواره ماشین‌هایی دم دست خواهیم داشت که قادر به خواندن اطلاعات هستند.

عبور از خطاها

اما مثل تمام متدهای ذخیره‌سازی داده، دی‌ان‌ای نواقص و مشکلات خودش را نیز دارد. برجسته‌ترین چالش در استفاده از این متد، هزینه است. هاوکینز می‌گوید که متدهای کنون از نظر هزینه مشابه Apple Hard Disk 20 در دهه ۱۹۸۰ میلادی هستند. در آن زمان، حدودا ۲۰ مگابایت فضای ذخیره‌سازی -معادل با میزان داده‌ای که برای دانلود یک ویدیوی ۱۵ دقیقه‌ای نیاز دارید- حدودا ۱۵۰۰ دلار هزینه به همراه می‌آورد.

گذشته از این، دی‌ان‌ای محکوم به خطا است. بیایید دوباره راجع به نوکلئوتیدهایی که نردبان دی‌ان‌ای را می‌سازند صحبت کنیم. به صورت میانگین، به ازای هر ۱۰۰ الی ۱۰۰۰ نوکلئوتید، یک خطا درون دی‌ان‌ای رخ می‌دهد و این خطاها می‌توانند به سه شکل بروز پیدا کنند: جایگزینی، جاگذاری و حذف.

در یک جهش جایگزینی، یک حرف واحد درون رشته‌ای از نوکلئوتید ممکن است جای خود را به حرفی دیگر بدهد. مثلا ممکن است کیتوزین جایگزین تیمین شود، هرچند که طول رشته‌های دی‌ان‌ای یکسان باقی می‌ماند. در جاگذاری و حذف اما دی‌ان‌ای یک پایه نوکلئوتیدی اضافه به دست می‌آورد یا یک پایه را حذف می‌کند. اما برخلاف ارورهای موجود در کدهای کامپیوتری، شاهد هیچ‌گونه فضای خالی در جایی که پایه حذف شده قبلا وجود داشته نخواهید بود. بنابراین هنگام دیکد داده ذخیره‌ شده درون دی‌ان‌ای، این موضوع خیلی سریع تبدیل به مشکلی بزرگ می‌شود.

هاوکینز به مقایسه این موضوع با کلمات انگلیسی می‌پردازد: «با حذف یک حرف L، عبارت World تبدیل به Word می‌شود. حالا اگر یک S در این عبارت جاگذاری شود، کلمه Sword به دست می‌آید. خواندن ورژن صحیح Sword که قرار بوده World باشد شکلی دشوار به خود می‌گیرد، زیرا Sword کماکان یک کلمه واقعی در زبان انگلیسی است. اما حروف تغییر مکان داده‌اند.»

در دیگر فرم‌های حافظه دی‌ان‌ای، با تکرار کردن ۱۰ یا ۱۵ باره کد می‌توان از این ارورها عبور کرد، اما چنین کاری به معنای اتلاف فضای ذخیره‌سازی نیز هست. در متد تازه‌ای که محققان در مقاله اخیر خود به آن پرداخته‌اند، داده را به صورت مشبک درون دی‌ان‌ای قرار داده‌اند و هر بیت داده، داده بعدی را تقویت می‌کند و به این ترتیب لازم است تنها یک‌بار خوانده شود.

آن‌ها ضمنا به توسعه الگوریتمی پرداخته‌اند که به صورت یک‌جا به ارورهای جاگذاری، حذف و جایگزینی رسیدگی می‌کند و حافظه دیجیتالی مبتنی بر دی‌ان‌ای شکلی بهینه‌تر به خود می‌گیرد. به همین خاطر بوده که تیم مورد نظر توانسته به آسانی جادوگر شهر از را درون رشته‌های دی‌ان‌ای جای دهد و در این مسیر نیازمند تکرار ترکیب‌های A و C و T و G به‌صورت پی‌درپی نبوده است.

تصویری از آینده

آزمایش DNA

با حرکت به سمت آینده، پتانسیل حافظه‌های مبتنی بر دی‌ان‌ای عملا نامحدود خواهد بود. فینکلشتاین تصویری از آینده‌ای را ترسیم می‌کند که در آن، می‌توانیم از دی‌ان‌ای حاوی داده درون مواد دیگر استفاده کنیم.

او می‌گوید در یک مثال، محققان یک تکه پلاستیک چاپ سه‌بعدی شده را به رشته‌های دی‌ان‌ای حاوی فایل‌های طراحی همان پلاستیک چاپ شده مجهز کردند. همینطور که تکه پلاستیکی از درون پرینتر عبور می‌کند، قادر به رها کردن دی‌ان‌ای است تا بازتولید فایل در پروسه‌ای دائمی صورت بگیرد.

یا می توانید از حافظه داده مبتنی بر دی ان ای به عنوان راهی برای به دست آوردن اطلاعات راجع به اشیای ثباتی که ماده ژنتیکی مخصوص به خود را ندارند استفاده کنید. فرض می‌کنیم که یک هواپیما را با ماده‌ای که حاوی دی‌ان‌ای است می‌پوشانید و دستورالعمل کامل ساخت هواپیما را درونش تعبیه می‌کنید. اگر مشکلی پیش آید و هواپیما در دریا سقوط کند، دی‌ان‌ای تعبیه شده در لایه رویی به خاطر اشعه‌های فرابنفش خورشید تجزبه می‌شود.

این روند تجزیه می‌تواند راهی برای جمع‌آوری اطلاعات راجع به اتفاقی که برای هواپیما افتاده باشد. حتی اگر تنها یک تکه از لاشه هواپیما کشف شود هم دانشمندان می‌توانند دی‌ان‌دی ذخیره شده و میزان تجزیه را تحلیل کرده و بفهمند هواپیما برای چه مدت در دریا گم شده بوده است.

اما حتی با دستاوردهای مهمی که فینکلشتاین و تیمش داشته‌اند هم حافظه دیجیتالی مبتنی بر دی‌ان‌ای هنوز مسیری طولانی در پیش دارد. او می‌گوید: «به نظرم در موارد بسیار خاص بزودی قادر به استفاده از چنین حافظه‌های هستیم. اما فکر نمی‌کنم که تا یک دهه دیگر یا حتی بیشتر شاهد عرضه آن به بازار به عنوان محصولی عمومی باشیم».

اما هر زمان که چنین چیزی امکان‌پذیر شود، حافظه مبتنی بر دی‌ان‌ای بزرگ‌ترین گامی خواهد بود که بشر تاکنون در زمینه ذخیره‌سازی داده برداشته است.

9 جولای 2021

26 زمان تقریبی مطالعه 7 دقیقه