Internet Archive یک تریلیون وبسایت را ثبت کرد

Internet Archive یک تریلیون وبسایت را ثبت کرد
این موفقیت، نقطه عطفی در تاریخ حفاظت از دادههای دیجیتال بهشمار میآید؛ بهویژه در زمانی که اینترنت هم به بخشی جداییناپذیر از زندگی روزمره تبدیل شده و هم به دلیل تغییرات سریع و ناپایداریهای فزاینده، پیمایش و دسترسی به آن دشوارتر شده است.
به گزارش دیتاسنتر من و به نقل از Popular Science، محتوای دیجیتال، ماهیتی زودگذر دارد و دوام آن معمولاً وابسته به علاقه و تلاش کسانی است که قصد حفظ آن را دارند. نمونهای از این گذرا بودن دادهها را میتوان در سال ۲۰۱۹ مشاهده کرد؛ زمانی که وبسایت مایاسپیس، یکی از محبوبترین شبکههای اجتماعی اولیه، اعلام کرد خطای پیشبینینشدهای در انتقال سرورها، باعث حذف تصادفی تمام محتوای آپلودشده کاربران بین سالهای ۲۰۰۳ تا ۲۰۱۵ شده است. بر اساس برآوردها، در عرض یک شب، حدود ۵۰ میلیون آهنگ از ۱۴ میلیون هنرمند از فضای دیجیتال ناپدید شدند.
علیرغم اهمیت Internet Archive برای آرشیویستها، روزنامهنگاران، محققان دانشگاهی و کاربران کنجکاو، این سازمان با چالشهای جدی از سوی محیط دیجیتال سریع و در حال تحول روبهرو است. شرکتهای فناوری که در زمینه آموزش سیستمهای هوش مصنوعی و مدلهای زبانی بزرگ رقابت میکنند، به دنبال مجموعه دادههای گسترده و تازه برای استفاده در هوش مصنوعی هستند؛ مجموعه دادههایی که اغلب در چارچوبهای قانونی نامشخص قرار دارند. در نتیجه، بسیاری از شرکتهای بزرگ رسانهای مانند نیویورک تایمز، گاردین و یواسای تودی/گانت، محتوای جدید خود را از دسترس بایگانی دور نگه میدارند تا آن را از بهرهبرداری توسط هوش مصنوعی مولد محافظت کنند.
اگرچه روشن است که چارچوب مشخصی برای جبران مناسب فعالیتهای این شرکتها و نویسندگانشان وجود ندارد، اما این مسئله نگهداری و حفظ یکی از حساسترین اکوسیستمهای اطلاعاتی تاریخ بشر را بسیار دشوار کرده است. امید است که همه طرفها درک کنند این بایگانی، فراتر از ثبت یک تریلیون وبسایت، نقش حیاتی در حفاظت از اطلاعات دیجیتال برای نسلهای آینده ایفا میکند.
مجله خبری mydtc





