رمزگشایی از صداهای نهنگ‌ عنبر: آیا در آستانه گفت‌وگو با نهنگ‌ها قرار داریم؟

3 نوامبر 2021

24 زمان تقریبی مطالعه 10 دقیقه

مایکل برونشتاین می‌گوید: «چیز زیادی درمورد نهنگ‌ها نمی‌دانم. هرگز در زندگی‌ام نهنگی ندیده‌ام.» برونشتاین که دانشمند علوم کامپیوتری است که در کالج سلطنتی لندن تدریس می‌کند، ممکن است کاندیدای ایدئالی برای پروژه‌ای که می‌خواهد ارتباط صوتی بین نهنگ‌های عنبر را بررسی کند، به‌نظر نرسد. باوجوداین، مهارت‌های او به‌عنوان متخصص یادگیری ماشین می‌تواند کلیدی باشد برای تلاش بلندپروازانه‌ای که رسما در مارس ۲۰۲۰ آغاز شد: گروهی از پژوهشگران رشته‌های علمی مختلف می‌خواهند در قالب پروژه‌ای به نام CETI از هوش مصنوعی (AI) برای رمزگشایی زبان این پستانداران دریایی استفاده کنند.

اگر پروژه CETI موفق شود، اولین‌باری است که واقعا متوجه می‌شویم حیوانات درمورد چه چیزی صحبت می‌کنند و شاید حتی بتوانیم با آن‌ها گفت‌وگو کنیم. این پروژه از سال ۲۰۱۷ و زمانی شروع شد که گروهی بین‌المللی از دانشمندان در قالب بورسیه‌ی رادکلیف یک سال را باهم در دانشگاه هاروارد در کمبریج ماساچوست گذراندند. برنامه‌ی بورسیه‌ی رادکلیف فرصتی برای دورشدن از روال‌های معمول ارائه می‌دهد.

روزی، شافی گلدواسر، دانشمند کامپیوتر و متخصص رمزنگاری، به دفتر دیوید گروبر، متخصص زیست‌شناسی دریا در دانشگاه شهری نیویورک رفت. گلدواسر که به‌تازگی به‌عنوان مدیر جدید مؤسسه‌ی نظریه‌ی محاسبات سیمونز دانشگاه کالیفرنیا در برکلی انتخاب شده بود، صداهایی را شنیده بود که او را به یاد نویزی که مدار الکترونیکی معیوب ایجاد می‌کند یا کد مورس می‌انداخت. گروبر به او گفت این صدای نهنگ‌های عنبر است که با همدیگر صحبت می‌کنند. گولدواسر تعریف می‌کند: «من گفتم شاید باید پروژه‌ای انجام دهیم که در آن صداهای نهنگ‌ها را به چیزی تبدیل کنیم که به‌عنوان انسان بتوانیم آن را درک کنیم. هرگز فکر نمی‌کردم که او حرف مرا جدی بگیرد.»

بورسیه‌ی رادکلیف فرصتی برای جدی‌گرفتن ایده‌های دور از ذهن بود. در مهمانی شام، گلدواسر و گروبر ایده‌ی خود را برای برونشتاین توضیح دادند. برونشتاین پیشرفت‌های اخیر در پردازش زبان‌های طبیعی (NLP) را دنبال می‌کرد. پردازش زبان‌های طبیعی شاخه‌ای از هوش مصنوعی است که روی تجزیه‌و‌تحلیل خودکار گفت‌وگوی نوشتاری و گفتاری کار می‌کند و تاکنون فقط روی زبان‌های انسانی استفاده شده است.

برونشتاین معتقد بود صداهای نهنگ‌های عنبر که codas نامیده می‌شود، ساختاری دارد که آن‌ها را برای این نوع تجزیه‌و‌تحلیل مناسب می‌سازد. خوشبختانه گروبر زیست‌شناسی به نام شین گرو را می‌شناخت که از سال ۲۰۰۵، در آب‌های اطراف جزیره دومینیکا در دریای کارائیب، صداهای نهنگ‌های عنبر را ضبط کرده بود. برونشتاین برخی از الگوریتم‌های یادگیری ماشین را روی داده‌ها اعمال کرد. او می‌گوید: «به‌نظر می‌رسید که آن‌ها حداقل با برخی از وظایف نسبتا ساده بسیار خوب کار کنند.» بااین‌حال، این کار چیزی بیش از اثبات مفهوم نبود. برای تجزیه‌و‌تحلیل عمیق‌تر، الگوریتم‌ها به میلیون‌ها صدای نهنگ نیاز دارند.

آیا حیوانات اصلا زبان دارند؟ این سؤال برای مدت طولانی بین دانشمندان بحث‌برانگیز بوده است. برای بسیاری افراد، زبان یکی از آخرین سنگرهایی بوده است که در زمینه‌ی منحصربه‌فردبودن انسان به آن پناه برده‌اند.

مقاله‌های مرتبط:

کنراد لورنتس، زیست‌شناس اتریشی و یکی از پیش‌گامان علم رفتار حیوانات که در کتاب سال ۱۹۴۹ خود با عنوان «انگشتر پادشاه سلیمان» درمورد ارتباطات خود با حیوانات نوشت، گفت حیوانات ارتباط برقرار می‌کنند؛ اما حرف نمی‌زنند. لورنتس نوشت: «حیوانات زبان به‌معنایی که در تصور ما وجود دارد، ندارند.» کارستن برنسینگ، دانشمند آلمانی زیست‌شناسی دریا که کتاب‌های متعددی درمورد ارتباطات حیوانات نوشته است، می‌گوید: «به‌نظر من، هنوز با دقت کافی این موضوع را بررسی نکرده‌ایم.»

برنسینگ معتقد است که گفته‌های بسیاری از حیوانات را می‌توان قطعا زبان نامید. این فقط صدای واق‌واق سگ نیست؛ چندین شرط باید وجود داشته باشد.

اول از همه، زبان معناشناسی دارد. این بدان‌معنا است که صداهای خاص معنای ثابتی دارند که تغییر نمی‌کند. برای مثال، جیجاق سیبری (نوعی پرنده) واژگانی با حدود ۲۵ صدا دارند که برخی از آن‌ها معنای ثابتی دارند.

شرط دوم، دستور زبان (گرامر) است: قوانینی برای نحوه‌ی ساخت جملات. برای مدت طولانی، دانشمندان متقاعد شده بودند که صداهای حیوانات فاقد هرگونه ساختار جمله‌ای است؛ اما در سال ۲۰۱۶، پژوهشگران ژاپنی مطالعه‌ای را در مجله‌ی Nature Communications درمورد صداسازی چرخ‌ریسک بزرگ منتشر کردند. در برخی موقعیت‌ها، این پرندگان دو آوای متفاوت را باهم ترکیب می‌کنند تا به یکدیگر هشدار بدهند که شکارچی در حال نزدیک‌شدن است. آن‌ها همچنین زمانی که پژوهشگران این ترتیب صدا را برای آن‌ها پخش کردند، واکنش نشان دادند. اگرچه وقتی ترتیب صداها برعکس شد، پرندگان واکنش بسیار کمتری نشان دادند. برنسینگ می‌گوید: «این دستور زبان است.»

معیار سوم: صداسازی‌های یک گونه در‌صورتی‌که کاملا ذاتی باشند، زبان نامیده نمی‌شود. لورنتس معتقد بود حیوانات با مجموعه‌ای از صداها به‌دنیا می‌آیند و در طول زندگی خود چیز زیادی یاد نمی‌گیرند. لورنتس نوشت صداهای حیوانات با زبان گفتاری ما قابل‌مقایسه نیست؛ بلکه فقط با حالاتی مانند خمیازه‌کشیدن و چروک‌کردن ابرو و لبخند قابل‌مقایسه هستند.

ثابت شده است که چندین گونه جانوری صدا را یاد می‌گیرند، واژگان جدیدی به‌دست می‌آورند، گویش ایجاد می‌کنند و همدیگر را با نام می‌شناسند. برخی از پرندگان حتی یاد می‌گیرند که از آهنگ‌های زنگ تلفن تقلید کنند. دلفین‌ها سوت‌های فردی را به‌دست می‌آورند که به‌نوعی مانند نام مشخص‌کننده‌ی هویت آن‌ها است.

نهنگ عنبر / sperm whale

_{نهنگ‌های عنبر در اعماق اقیانوس شیرجه می‌زنند و ازطریق سیستم آوایی خاصی (صدای کلیک یا بشکن) از فواصل دور باهم ارتباط برقرار می‌کنند.}

صداهای نهنگ عنبر که به‌شکل کلیک یا بشکن توصیف می‌شود، کاندیداهای ایدئالی برای تلاش برای رمزگشایی معانی آن‌ها هستند. علت آن است برخلاف صداهای پیوسته‌ای که گونه‌های دیگر نهنگ تولید می‌کنند، ترجمه‌ی آن‌ها به صفر و یک آسان است. دلیل دیگر آن است که این حیوانات در عمیق‌ترین بخش‌های اقیانوس شیرجه می‌زنند و از فواصل دور باهم ارتباط برقرار می‌کنند. بنابراین، نمی‌توانند از زبان بدن و حالات چهره استفاده کنند که ابزارهای مهمی برای ارتباط برقرارکردن برای حیوانات دیگر است.

برونشتاین می‌گوید: «واقع‌بینانه است که فرض کنیم ارتباط نهنگ‌ها عمدتا صوتی است.» نهنگ‌های عنبر در سلسله‌ی جانوران بزرگ‌ترین مغزها را دارند و اندازه‌ی مغز آن‌ها شش برابر اندازه‌ی مغز ما است. وقتی دو نهنگ عنبر برای مدت طولانی باهم حرف می‌زنند، نباید از خود بپرسیم که آیا چیزی برای گفتن به همدیگر دارند؟ آیا درمورد بهترین مناطق صید ماهی باهم حرف می‌زنند؟ آیا نهنگ‌های مادر مانند همتایان انسانی خود داستان‌هایی درمورد بزرگ‌کردن فرزندانشان به‌هم می‌گویند؟ پژوهشگران پروژه‌ی ستی می‌گویند تلاش برای پی‌بردن به این موضوع ارزش دارد.

اگر چیزی مانند سنگ روزتا وجود داشته باشد، یادگیری زبان ناشناخته آسان‌تر است. این لوح سنگی که در سال ۱۷۹۹ کشف شد، حاوی متن یکسانی به سه زبان است و کلید رمزگشایی هیروگلیف مصری بود؛ البته چنین چیزی برای سلسله‌ی حیوانات وجود ندارد. ما نه فرهنگ لغت انسان‌نهنگ داریم و نه کتابی با قواعد دستور زبان نهنگ عنبر.

راه‌های دیگری نیز برای درک این موضوع وجود دارد. بدیهی است که کودکان زبان مادری خود را بدون این ابزارها و تنها با مشاهده‌ی زبانی که اطرافشان صحبت می‌شود، یاد می‌گیرند. پژوهشگران به این نتیجه رسیده‌اند که این نوع یادگیری اساسا آماری است: کودک به‌یاد می‌آورد که واژه‌ی سگ وقتی که آن حیوان پشمالو وارد اتاق می‌شود، غالبا به‌کار می‌رود و واژه‌های خاصی اغلب در ارتباط با موارد دیگر استفاده می‌شوند و توالی خاصی از کلمات محتمل‌تر از توالی دیگر است.

در ۱۰ سال گذشته، روش‌های یادگیری ماشین از این نوع یادگیری تقلید کرده‌اند. پژوهشگران شبکه‌های عصبی بزرگ را با حجم عظیمی از داده‌های زبان تغذیه کردند. این شبکه‌ها توانستند از مشاهدات آماری ساختارهایی را در زبان پیدا کنند، بدون اینکه به آن‌ها اطلاعاتی درمورد محتوا داده شود. یکی از این نمونه‌ها، مدل‌های زبانی است که یکی از معروف‌ترین آن‌ها GPT-3 است که شرکت OpenAI توسعه داده است.

مدل‌های زبانی ماشین‌های تکمیل‌کننده هستند. برای مثال، ابتدای یک جمله به GPT-3 داده می‌شود و آن را کلمه‌به‌کلمه کامل می‌کند، به روش مشابه اما بسیار پیچیده‌تر از پیشنهادهایی که تلفن هوشمند هنگام تایپ پیام‌های متنی ارائه می‌دهد.

مدل‌های زبانی با پردازش آماری حجم عظیمی از متن‌های استخراج‌شده از اینترنت نه‌تنها می‌دانند کدام کلمات غالبا باهم ظاهر می‌شود؛ بلکه قواعد ترکیب جملات را نیز یاد می‌گیرند. آن‌ها جملاتی بسیار باکیفیت می‌سازند، می‌توانند درمورد موضوع خاصی اخبار کاذب بنویسند، متن‌های حقوقی پیچیده را به‌شکل ساده‌ای خلاصه کنند و حتی بین دو زبان ترجمه کنند.

البته این شاهکارها هزینه‌ای دارند: حجم عظیمی از داده‌ها نیاز است. برنامه‌نویسان شبکه‌ی عصبی GPT-3 را با حدود ۱۷۵ میلیاد کلمه آموزش دادند. درمقابل، در پروژه‌ی نهنگ عنبر تاکنون کمتر از ۱۰۰ هزار صدای نهنگ عنبر جمع‌آوری شده است.

اولین کار پروژه پژوهشی جدید، گسترش این مجموعه است؛ به‌طوری‌که درنهایت ۴ میلیارد کلمه جمع‌آوری شود؛ اگرچه هنوز کسی نمی‌داند کلمه در زبان نهنگ عنبر چیست. اگر ایده‌ی برونشتاین موفق باشد، ایجاد سیستمی مشابه مدل‌های زبانی انسانی که بتوان گفته‌های نهنگ صحیح ازنظر دستور زبان را تولید کند، کاملا واقع‌بینانه است. گام بعدی ساخت ربات سخن‌گوی تعاملی است که سعی می‌کند با نهنگ‌های آزاد وارد گفت‌وگو شود. البته درحال‌حاضر هیچ‌کس نمی‌تواند بگوید که آیا این حیوانات آن را به‌عنوان شریک گفت‌وگو قبول می‌کنند یا نه. برونشتاین می‌گوید: «شاید آن‌ها فقط پاسخ دهند: از این حرف‌های مزخرف دست بردار!»

پروژه رمزگشایی از ارتباطات صوتی میان نهنگ های عنبر

_{پژوهشگران امیدوار هستند هوش مصنوعی به آن‌ها کمک کند تا ارتباط میان نهنگ‌های عنبر را درک کنند}

حتی اگر این ایده کارساز باشد، ضعف تمام مدل‌های زبانی این است که چیزی درمورد محتوای زبانی که به آن گفت‌وگو می‌کنند، نمی‌دانند. خنده‌دار است که پژوهشگران رباتی را بسازند که بتواند به‌راحتی با نهنگ حرف بزند؛ اما آن‌ها حتی یک کلمه از آن را متوجه نشوند. به‌همین‌دلیل، آن‌ها می‌خواهند صداهای ضبط‌شده را با اطلاعاتی درمورد رفتار حیوانات حین آن صدا حاشیه‌نویسی کنند: حیوانات کجا بودند، چه کسی با چه کسی صحبت می‌کرد، واکنش چه بود؟

چالش پیدا‌کردن روش خودکاری است که حداقل مقداری از این میلیون‌ها مورد حاشیه‌نویسی را انجام دهد. هنوز فناوری زیادی باید توسعه پیدا کند: حسگرهایی برای ثبت نهنگ‌ها به‌صورت انفرادی و نظارت بر مکان آن‌ها تا بتوان هر صدا را به حیوانی خاص نسبت داد. پروژه‌ی اودیشس (Audacious) که سازمان کنفرانس تد آن را اداره می‌کند، از پروژه‌ی ستی حمایت مالی می‌کند. چندین سازمان ازجمله انجمن نشنال جئوگرافیک و آزمایشگاه علوم کامپیوتر و هوش مصنوعی مؤسسه‌ی فناوری ماساچوست (MIT) بخشی از این پروژه هستند.

پژوهشگران ستی اولین کسانی نبودند که ایده‌ی استفاده از تکنیک‌های یادگیری ماشین را درمورد زبان‌های حیوانات مطرح کردند. آزا راسکین، فیزیک‌دان، طراح و کارآفرین سابق که به منتقد این فناوری تبدیل شد، در سال ۲۰۱۳ زمانی که درمورد زبان پیچیده بابون‌های گلادا آفریقایی شنید، ایده‌ی مشابهی داشت. او به این فکر می‌کرد که آیا می‌توانیم از فناوری NLP که برای پردازش زبان‌های انسانی توسعه یافته است، برای صداسازی‌ها حیوانات استفاده کنیم؟ راسکین با هدف انجام این کار به تأسیس Earth Species Project کمک کرد. در آن زمان، این فناوری در مراحل ابتدایی خود بود و ۴ سال دیگر طول کشید تا به روش خودآموزی برای ترجمه‌ی خودکار بین زبان‌ها تبدیل شد.

تکنیک جاسازی کلمات همه‌ی کلمات یک زبان را درون کهکشانی چندبعدی قرار می‌دهد که در آن کلماتی که غالبا باهم استفاده می‌شوند، نزدیک به‌هم قرار می‌گیرند و این ارتباطات با خطوط نشان داده می‌شود. برای مثال، کلمه «شاه» به «مرد» مربوط می‌شود و کلمه «ملکه» به «زن». مشخص شده است که نقشه‌های دو زبان انسانی را می‌توان باهم تطابق داد؛ حتی اگر هر کلمه‌ای از یک زبان همتای دقیقی در زبان دیگر نداشته باشد. امروزه این تکنیک امکان ترجمه‌ی بین دو زبان انسانی را در متن نوشتاری فراهم می‌کند و به‌زودی می‌توان از آن در فایل‌های صوتی بدون متن نیز استفاده کرد.

آیا قابل‌تصور است که بتوانیم نقشه‌های زبان انسان و حیوان را روی هم قرار دهیم؟ راکسین بر این باور است که این موضوع حداقل ازنظر تئوری امکان‌پذیر است. او می‌گوید: «مطمئنا مجموعه‌ی تجربیات مشترکی وجود دارد؛ خصوصا با پستانداران دیگر. آن‌ها هم نفس می‌کشند و غذا می‌خورند و از مرگ فرزندان خود غمگین می‌شوند.»

در‌عین‌حال، راسکین معتقد است که مناطق زیادی وجود خواهد داشت که در آن نقشه‌ها روی هم قرار نمی‌گیرند. راسکین می‌گوید: «نمی‌دانم چه چیزی جذاب‌تر خواهد بود، بخش‌هایی که بتوانیم به‌طور مستقیم ترجمه کنیم یا بخش‌هایی که چیزی وجود ندارد که مستقیما به تجربیات انسانی قابل‌ترجمه باشد. وقتی حیوانات با خودشان صحبت می‌کنند و بتوانیم آن را گوش کنیم، می‌توانیم لحظه فرهنگی واقعا دگرگون‌کننده‌ای را داشته باشیم.»

نهنگ مادر و فرزندش / sperm whales

_{بدون شک این نهنگ عنبر مادر و فرزند باهم ارتباط برقرار می‌کنند؛ اما پژوهشگران کنجکاوند که آن‌ها به‌هم چه می‌گویند.}

مطمئنا این امیدها کمی جلوتر از پژوهش است. برخی از دانشمندان شک دارند که مجموعه‌داده‌های پروژه‌‌ی ستی حاوی چیز جالبی باشد. استیون پینکر، زبان‌شناس مشهور و نویسنده کتاب «غریزه زبان»، درمورد این پروژه تردید دارد. او می‌گوید: «کنجکاوم که ببینم آن‌ها چه چیزی پیدا می‌کنند.» او امید کمی دارد که بتوانیم محتوا و ساختار غنی را در صداهای نهنگ عنبر پیدا کنیم. او می‌گوید: «گمان می‌کنم این چندان فراتر از چیزی نباشد که از قبل می‌دانیم. اگر نهنگ‌ها می‌توانند پیام‌های پیچیده را به‌هم منتقل کنند، چرا نمی‌بینیم که مانند انسان از آن برای انجام کارهای پیچیده با هم، استفاده کنند؟»

دایانا ریس، پژوهشگر کالج هانتر در دانشگاه شهری نیویورک، با این موضوع مخالف است. او در مصاحبه‌ای ویدئویی می‌گوید: «اگر مردم درست همین لحظه به من و شما نگاه کنند، ما کار زیادی انجام نمی‌دهیم. بااین‌حال، داریم مسائل معنادار زیادی را به‌هم منتقل می‌کنیم.» به‌همین‌ترتیب، او فکر می‌کند که چیز زیادی درمورد آنچه نهنگ‌ها ممکن است به یکدیگر بگویند، نمی‌دانیم و درواقع درمورد آن بی‌اطلاع هستیم.

ریس سال‌ها با دلفین‌ها کار کرده است و از صفحه‌کلید ساده‌ای زیر آب برای برقراری ارتباط با آن‌ها استفاده می‌کند. او گروهی به نام Interspecies Internet را تأسیس کرد که راه‌های ارتباط مؤثر با حیوانات را بررسی می‌کند. ازجمله بنیان‌گذاران همراه او، پیتر گابریل، موسیقی‌دان و وینتون سرف، یکی از توسعه‌دهندگان اینترنت و نیل جرشنفلد، مدیر مرکز بیت‌ها و اتم‌ها در مؤسسه فناوری ماساچوست هستند. ریس از بلندپروازی‌های CETI و خصوصا رویکرد میان‌رشته‌ای آن استقبال می‌کند.

پژوهشگران پروژه‌ی ستی قبول دارند که جست‌وجو به‌دنبال معنا در صدای نهنگ‌ها ممکن است نتیجه‌ی جالبی حاصل نکند. گروبر، سرپرست برنامه می‌گوید: «درک می‌کنیم که یکی از بزرگ‌ترین خطرات می‌تواند این باشد که نهنگ‌ها بسیار خسته‌کننده باشند.» البته طبق نظر شخصی او، این‌گونه نخواهد بود: «در تجربه‌ام به‌عنوان زیست‌شناس، هرگاه واقعا چیزی را از نزدیک بررسی کردم، زمانی نبوده است که تحت‌تأثیر حیوانات قرار نگرفته باشم.»

نام پروژه‌ی CETI تداعی‌گر نام SETI و «جست‌وجو برای هوش فرازمینی» است که از دهه‌ی ۱۹۶۰ آسمان را برای سیگنال‌های رادیویی تمدن‌های بیگانه اسکن کرده است و تاکنون حتی یک پیام هم پیدا نکرده است. برونشتاین بر این باور است ازآنجاکه هیچ نشانه‌ای از هوش فرازمینی پیدا نشده است، باید سعی کنیم مهارت‌های رمزگشایی خود را روی سیگنال‌هایی که روی زمین می‌توانیم تشخیص دهیم، امتحان کنیم. به‌جای اینکه آنتن‌های خود را به‌سمت فضا بگیریم، می‌توانیم فرهنگ موجود در اقیانوس را استراق‌سمع کنیم که حداقل برای ما بیگانه است.

برونشتاین می‌گوید: «فکر می‌کنم بسیار متکبرانه باشد که فکر کنیم انسان خردمند تنها موجود باهوش و باادراک روی زمین است. اگر کشف کنیم که اساسا تمدن کاملی درست جلو چشم ما وجود دارد، شاید این مسئله به تغییراتی در نحوه‌ی رفتار ما با محیط‌زیست منجر شود یا سبب شود احترام بیشتری برای دنیای زنده قائل شویم.»

3 نوامبر 2021

24 زمان تقریبی مطالعه 10 دقیقه