رمزگشایی از صداهای نهنگ عنبر: آیا در آستانه گفتوگو با نهنگها قرار داریم؟
مایکل برونشتاین میگوید: «چیز زیادی درمورد نهنگها نمیدانم. هرگز در زندگیام نهنگی ندیدهام.» برونشتاین که دانشمند علوم کامپیوتری است که در کالج سلطنتی لندن تدریس میکند، ممکن است کاندیدای ایدئالی برای پروژهای که میخواهد ارتباط صوتی بین نهنگهای عنبر را بررسی کند، بهنظر نرسد. باوجوداین، مهارتهای او بهعنوان متخصص یادگیری ماشین میتواند کلیدی باشد برای تلاش بلندپروازانهای که رسما در مارس ۲۰۲۰ آغاز شد: گروهی از پژوهشگران رشتههای علمی مختلف میخواهند در قالب پروژهای به نام CETI از هوش مصنوعی (AI) برای رمزگشایی زبان این پستانداران دریایی استفاده کنند.
اگر پروژه CETI موفق شود، اولینباری است که واقعا متوجه میشویم حیوانات درمورد چه چیزی صحبت میکنند و شاید حتی بتوانیم با آنها گفتوگو کنیم. این پروژه از سال ۲۰۱۷ و زمانی شروع شد که گروهی بینالمللی از دانشمندان در قالب بورسیهی رادکلیف یک سال را باهم در دانشگاه هاروارد در کمبریج ماساچوست گذراندند. برنامهی بورسیهی رادکلیف فرصتی برای دورشدن از روالهای معمول ارائه میدهد.
روزی، شافی گلدواسر، دانشمند کامپیوتر و متخصص رمزنگاری، به دفتر دیوید گروبر، متخصص زیستشناسی دریا در دانشگاه شهری نیویورک رفت. گلدواسر که بهتازگی بهعنوان مدیر جدید مؤسسهی نظریهی محاسبات سیمونز دانشگاه کالیفرنیا در برکلی انتخاب شده بود، صداهایی را شنیده بود که او را به یاد نویزی که مدار الکترونیکی معیوب ایجاد میکند یا کد مورس میانداخت. گروبر به او گفت این صدای نهنگهای عنبر است که با همدیگر صحبت میکنند. گولدواسر تعریف میکند: «من گفتم شاید باید پروژهای انجام دهیم که در آن صداهای نهنگها را به چیزی تبدیل کنیم که بهعنوان انسان بتوانیم آن را درک کنیم. هرگز فکر نمیکردم که او حرف مرا جدی بگیرد.»
بورسیهی رادکلیف فرصتی برای جدیگرفتن ایدههای دور از ذهن بود. در مهمانی شام، گلدواسر و گروبر ایدهی خود را برای برونشتاین توضیح دادند. برونشتاین پیشرفتهای اخیر در پردازش زبانهای طبیعی (NLP) را دنبال میکرد. پردازش زبانهای طبیعی شاخهای از هوش مصنوعی است که روی تجزیهوتحلیل خودکار گفتوگوی نوشتاری و گفتاری کار میکند و تاکنون فقط روی زبانهای انسانی استفاده شده است.
برونشتاین معتقد بود صداهای نهنگهای عنبر که codas نامیده میشود، ساختاری دارد که آنها را برای این نوع تجزیهوتحلیل مناسب میسازد. خوشبختانه گروبر زیستشناسی به نام شین گرو را میشناخت که از سال ۲۰۰۵، در آبهای اطراف جزیره دومینیکا در دریای کارائیب، صداهای نهنگهای عنبر را ضبط کرده بود. برونشتاین برخی از الگوریتمهای یادگیری ماشین را روی دادهها اعمال کرد. او میگوید: «بهنظر میرسید که آنها حداقل با برخی از وظایف نسبتا ساده بسیار خوب کار کنند.» بااینحال، این کار چیزی بیش از اثبات مفهوم نبود. برای تجزیهوتحلیل عمیقتر، الگوریتمها به میلیونها صدای نهنگ نیاز دارند.
آیا حیوانات اصلا زبان دارند؟ این سؤال برای مدت طولانی بین دانشمندان بحثبرانگیز بوده است. برای بسیاری افراد، زبان یکی از آخرین سنگرهایی بوده است که در زمینهی منحصربهفردبودن انسان به آن پناه بردهاند.
مقالههای مرتبط:
کنراد لورنتس، زیستشناس اتریشی و یکی از پیشگامان علم رفتار حیوانات که در کتاب سال ۱۹۴۹ خود با عنوان «انگشتر پادشاه سلیمان» درمورد ارتباطات خود با حیوانات نوشت، گفت حیوانات ارتباط برقرار میکنند؛ اما حرف نمیزنند. لورنتس نوشت: «حیوانات زبان بهمعنایی که در تصور ما وجود دارد، ندارند.» کارستن برنسینگ، دانشمند آلمانی زیستشناسی دریا که کتابهای متعددی درمورد ارتباطات حیوانات نوشته است، میگوید: «بهنظر من، هنوز با دقت کافی این موضوع را بررسی نکردهایم.»
برنسینگ معتقد است که گفتههای بسیاری از حیوانات را میتوان قطعا زبان نامید. این فقط صدای واقواق سگ نیست؛ چندین شرط باید وجود داشته باشد.
اول از همه، زبان معناشناسی دارد. این بدانمعنا است که صداهای خاص معنای ثابتی دارند که تغییر نمیکند. برای مثال، جیجاق سیبری (نوعی پرنده) واژگانی با حدود ۲۵ صدا دارند که برخی از آنها معنای ثابتی دارند.
شرط دوم، دستور زبان (گرامر) است: قوانینی برای نحوهی ساخت جملات. برای مدت طولانی، دانشمندان متقاعد شده بودند که صداهای حیوانات فاقد هرگونه ساختار جملهای است؛ اما در سال ۲۰۱۶، پژوهشگران ژاپنی مطالعهای را در مجلهی Nature Communications درمورد صداسازی چرخریسک بزرگ منتشر کردند. در برخی موقعیتها، این پرندگان دو آوای متفاوت را باهم ترکیب میکنند تا به یکدیگر هشدار بدهند که شکارچی در حال نزدیکشدن است. آنها همچنین زمانی که پژوهشگران این ترتیب صدا را برای آنها پخش کردند، واکنش نشان دادند. اگرچه وقتی ترتیب صداها برعکس شد، پرندگان واکنش بسیار کمتری نشان دادند. برنسینگ میگوید: «این دستور زبان است.»
معیار سوم: صداسازیهای یک گونه درصورتیکه کاملا ذاتی باشند، زبان نامیده نمیشود. لورنتس معتقد بود حیوانات با مجموعهای از صداها بهدنیا میآیند و در طول زندگی خود چیز زیادی یاد نمیگیرند. لورنتس نوشت صداهای حیوانات با زبان گفتاری ما قابلمقایسه نیست؛ بلکه فقط با حالاتی مانند خمیازهکشیدن و چروککردن ابرو و لبخند قابلمقایسه هستند.
ثابت شده است که چندین گونه جانوری صدا را یاد میگیرند، واژگان جدیدی بهدست میآورند، گویش ایجاد میکنند و همدیگر را با نام میشناسند. برخی از پرندگان حتی یاد میگیرند که از آهنگهای زنگ تلفن تقلید کنند. دلفینها سوتهای فردی را بهدست میآورند که بهنوعی مانند نام مشخصکنندهی هویت آنها است.
نهنگهای عنبر در اعماق اقیانوس شیرجه میزنند و ازطریق سیستم آوایی خاصی (صدای کلیک یا بشکن) از فواصل دور باهم ارتباط برقرار میکنند.
صداهای نهنگ عنبر که بهشکل کلیک یا بشکن توصیف میشود، کاندیداهای ایدئالی برای تلاش برای رمزگشایی معانی آنها هستند. علت آن است برخلاف صداهای پیوستهای که گونههای دیگر نهنگ تولید میکنند، ترجمهی آنها به صفر و یک آسان است. دلیل دیگر آن است که این حیوانات در عمیقترین بخشهای اقیانوس شیرجه میزنند و از فواصل دور باهم ارتباط برقرار میکنند. بنابراین، نمیتوانند از زبان بدن و حالات چهره استفاده کنند که ابزارهای مهمی برای ارتباط برقرارکردن برای حیوانات دیگر است.
برونشتاین میگوید: «واقعبینانه است که فرض کنیم ارتباط نهنگها عمدتا صوتی است.» نهنگهای عنبر در سلسلهی جانوران بزرگترین مغزها را دارند و اندازهی مغز آنها شش برابر اندازهی مغز ما است. وقتی دو نهنگ عنبر برای مدت طولانی باهم حرف میزنند، نباید از خود بپرسیم که آیا چیزی برای گفتن به همدیگر دارند؟ آیا درمورد بهترین مناطق صید ماهی باهم حرف میزنند؟ آیا نهنگهای مادر مانند همتایان انسانی خود داستانهایی درمورد بزرگکردن فرزندانشان بههم میگویند؟ پژوهشگران پروژهی ستی میگویند تلاش برای پیبردن به این موضوع ارزش دارد.
اگر چیزی مانند سنگ روزتا وجود داشته باشد، یادگیری زبان ناشناخته آسانتر است. این لوح سنگی که در سال ۱۷۹۹ کشف شد، حاوی متن یکسانی به سه زبان است و کلید رمزگشایی هیروگلیف مصری بود؛ البته چنین چیزی برای سلسلهی حیوانات وجود ندارد. ما نه فرهنگ لغت انساننهنگ داریم و نه کتابی با قواعد دستور زبان نهنگ عنبر.
راههای دیگری نیز برای درک این موضوع وجود دارد. بدیهی است که کودکان زبان مادری خود را بدون این ابزارها و تنها با مشاهدهی زبانی که اطرافشان صحبت میشود، یاد میگیرند. پژوهشگران به این نتیجه رسیدهاند که این نوع یادگیری اساسا آماری است: کودک بهیاد میآورد که واژهی سگ وقتی که آن حیوان پشمالو وارد اتاق میشود، غالبا بهکار میرود و واژههای خاصی اغلب در ارتباط با موارد دیگر استفاده میشوند و توالی خاصی از کلمات محتملتر از توالی دیگر است.
در ۱۰ سال گذشته، روشهای یادگیری ماشین از این نوع یادگیری تقلید کردهاند. پژوهشگران شبکههای عصبی بزرگ را با حجم عظیمی از دادههای زبان تغذیه کردند. این شبکهها توانستند از مشاهدات آماری ساختارهایی را در زبان پیدا کنند، بدون اینکه به آنها اطلاعاتی درمورد محتوا داده شود. یکی از این نمونهها، مدلهای زبانی است که یکی از معروفترین آنها GPT-3 است که شرکت OpenAI توسعه داده است.
مدلهای زبانی ماشینهای تکمیلکننده هستند. برای مثال، ابتدای یک جمله به GPT-3 داده میشود و آن را کلمهبهکلمه کامل میکند، به روش مشابه اما بسیار پیچیدهتر از پیشنهادهایی که تلفن هوشمند هنگام تایپ پیامهای متنی ارائه میدهد.
مدلهای زبانی با پردازش آماری حجم عظیمی از متنهای استخراجشده از اینترنت نهتنها میدانند کدام کلمات غالبا باهم ظاهر میشود؛ بلکه قواعد ترکیب جملات را نیز یاد میگیرند. آنها جملاتی بسیار باکیفیت میسازند، میتوانند درمورد موضوع خاصی اخبار کاذب بنویسند، متنهای حقوقی پیچیده را بهشکل سادهای خلاصه کنند و حتی بین دو زبان ترجمه کنند.
البته این شاهکارها هزینهای دارند: حجم عظیمی از دادهها نیاز است. برنامهنویسان شبکهی عصبی GPT-3 را با حدود ۱۷۵ میلیاد کلمه آموزش دادند. درمقابل، در پروژهی نهنگ عنبر تاکنون کمتر از ۱۰۰ هزار صدای نهنگ عنبر جمعآوری شده است.
اولین کار پروژه پژوهشی جدید، گسترش این مجموعه است؛ بهطوریکه درنهایت ۴ میلیارد کلمه جمعآوری شود؛ اگرچه هنوز کسی نمیداند کلمه در زبان نهنگ عنبر چیست. اگر ایدهی برونشتاین موفق باشد، ایجاد سیستمی مشابه مدلهای زبانی انسانی که بتوان گفتههای نهنگ صحیح ازنظر دستور زبان را تولید کند، کاملا واقعبینانه است. گام بعدی ساخت ربات سخنگوی تعاملی است که سعی میکند با نهنگهای آزاد وارد گفتوگو شود. البته درحالحاضر هیچکس نمیتواند بگوید که آیا این حیوانات آن را بهعنوان شریک گفتوگو قبول میکنند یا نه. برونشتاین میگوید: «شاید آنها فقط پاسخ دهند: از این حرفهای مزخرف دست بردار!»
پژوهشگران امیدوار هستند هوش مصنوعی به آنها کمک کند تا ارتباط میان نهنگهای عنبر را درک کنند
حتی اگر این ایده کارساز باشد، ضعف تمام مدلهای زبانی این است که چیزی درمورد محتوای زبانی که به آن گفتوگو میکنند، نمیدانند. خندهدار است که پژوهشگران رباتی را بسازند که بتواند بهراحتی با نهنگ حرف بزند؛ اما آنها حتی یک کلمه از آن را متوجه نشوند. بههمیندلیل، آنها میخواهند صداهای ضبطشده را با اطلاعاتی درمورد رفتار حیوانات حین آن صدا حاشیهنویسی کنند: حیوانات کجا بودند، چه کسی با چه کسی صحبت میکرد، واکنش چه بود؟
چالش پیداکردن روش خودکاری است که حداقل مقداری از این میلیونها مورد حاشیهنویسی را انجام دهد. هنوز فناوری زیادی باید توسعه پیدا کند: حسگرهایی برای ثبت نهنگها بهصورت انفرادی و نظارت بر مکان آنها تا بتوان هر صدا را به حیوانی خاص نسبت داد. پروژهی اودیشس (Audacious) که سازمان کنفرانس تد آن را اداره میکند، از پروژهی ستی حمایت مالی میکند. چندین سازمان ازجمله انجمن نشنال جئوگرافیک و آزمایشگاه علوم کامپیوتر و هوش مصنوعی مؤسسهی فناوری ماساچوست (MIT) بخشی از این پروژه هستند.
پژوهشگران ستی اولین کسانی نبودند که ایدهی استفاده از تکنیکهای یادگیری ماشین را درمورد زبانهای حیوانات مطرح کردند. آزا راسکین، فیزیکدان، طراح و کارآفرین سابق که به منتقد این فناوری تبدیل شد، در سال ۲۰۱۳ زمانی که درمورد زبان پیچیده بابونهای گلادا آفریقایی شنید، ایدهی مشابهی داشت. او به این فکر میکرد که آیا میتوانیم از فناوری NLP که برای پردازش زبانهای انسانی توسعه یافته است، برای صداسازیها حیوانات استفاده کنیم؟ راسکین با هدف انجام این کار به تأسیس Earth Species Project کمک کرد. در آن زمان، این فناوری در مراحل ابتدایی خود بود و ۴ سال دیگر طول کشید تا به روش خودآموزی برای ترجمهی خودکار بین زبانها تبدیل شد.
تکنیک جاسازی کلمات همهی کلمات یک زبان را درون کهکشانی چندبعدی قرار میدهد که در آن کلماتی که غالبا باهم استفاده میشوند، نزدیک بههم قرار میگیرند و این ارتباطات با خطوط نشان داده میشود. برای مثال، کلمه «شاه» به «مرد» مربوط میشود و کلمه «ملکه» به «زن». مشخص شده است که نقشههای دو زبان انسانی را میتوان باهم تطابق داد؛ حتی اگر هر کلمهای از یک زبان همتای دقیقی در زبان دیگر نداشته باشد. امروزه این تکنیک امکان ترجمهی بین دو زبان انسانی را در متن نوشتاری فراهم میکند و بهزودی میتوان از آن در فایلهای صوتی بدون متن نیز استفاده کرد.
آیا قابلتصور است که بتوانیم نقشههای زبان انسان و حیوان را روی هم قرار دهیم؟ راکسین بر این باور است که این موضوع حداقل ازنظر تئوری امکانپذیر است. او میگوید: «مطمئنا مجموعهی تجربیات مشترکی وجود دارد؛ خصوصا با پستانداران دیگر. آنها هم نفس میکشند و غذا میخورند و از مرگ فرزندان خود غمگین میشوند.»
درعینحال، راسکین معتقد است که مناطق زیادی وجود خواهد داشت که در آن نقشهها روی هم قرار نمیگیرند. راسکین میگوید: «نمیدانم چه چیزی جذابتر خواهد بود، بخشهایی که بتوانیم بهطور مستقیم ترجمه کنیم یا بخشهایی که چیزی وجود ندارد که مستقیما به تجربیات انسانی قابلترجمه باشد. وقتی حیوانات با خودشان صحبت میکنند و بتوانیم آن را گوش کنیم، میتوانیم لحظه فرهنگی واقعا دگرگونکنندهای را داشته باشیم.»
بدون شک این نهنگ عنبر مادر و فرزند باهم ارتباط برقرار میکنند؛ اما پژوهشگران کنجکاوند که آنها بههم چه میگویند.
مطمئنا این امیدها کمی جلوتر از پژوهش است. برخی از دانشمندان شک دارند که مجموعهدادههای پروژهی ستی حاوی چیز جالبی باشد. استیون پینکر، زبانشناس مشهور و نویسنده کتاب «غریزه زبان»، درمورد این پروژه تردید دارد. او میگوید: «کنجکاوم که ببینم آنها چه چیزی پیدا میکنند.» او امید کمی دارد که بتوانیم محتوا و ساختار غنی را در صداهای نهنگ عنبر پیدا کنیم. او میگوید: «گمان میکنم این چندان فراتر از چیزی نباشد که از قبل میدانیم. اگر نهنگها میتوانند پیامهای پیچیده را بههم منتقل کنند، چرا نمیبینیم که مانند انسان از آن برای انجام کارهای پیچیده با هم، استفاده کنند؟»
دایانا ریس، پژوهشگر کالج هانتر در دانشگاه شهری نیویورک، با این موضوع مخالف است. او در مصاحبهای ویدئویی میگوید: «اگر مردم درست همین لحظه به من و شما نگاه کنند، ما کار زیادی انجام نمیدهیم. بااینحال، داریم مسائل معنادار زیادی را بههم منتقل میکنیم.» بههمینترتیب، او فکر میکند که چیز زیادی درمورد آنچه نهنگها ممکن است به یکدیگر بگویند، نمیدانیم و درواقع درمورد آن بیاطلاع هستیم.
ریس سالها با دلفینها کار کرده است و از صفحهکلید سادهای زیر آب برای برقراری ارتباط با آنها استفاده میکند. او گروهی به نام Interspecies Internet را تأسیس کرد که راههای ارتباط مؤثر با حیوانات را بررسی میکند. ازجمله بنیانگذاران همراه او، پیتر گابریل، موسیقیدان و وینتون سرف، یکی از توسعهدهندگان اینترنت و نیل جرشنفلد، مدیر مرکز بیتها و اتمها در مؤسسه فناوری ماساچوست هستند. ریس از بلندپروازیهای CETI و خصوصا رویکرد میانرشتهای آن استقبال میکند.
پژوهشگران پروژهی ستی قبول دارند که جستوجو بهدنبال معنا در صدای نهنگها ممکن است نتیجهی جالبی حاصل نکند. گروبر، سرپرست برنامه میگوید: «درک میکنیم که یکی از بزرگترین خطرات میتواند این باشد که نهنگها بسیار خستهکننده باشند.» البته طبق نظر شخصی او، اینگونه نخواهد بود: «در تجربهام بهعنوان زیستشناس، هرگاه واقعا چیزی را از نزدیک بررسی کردم، زمانی نبوده است که تحتتأثیر حیوانات قرار نگرفته باشم.»
نام پروژهی CETI تداعیگر نام SETI و «جستوجو برای هوش فرازمینی» است که از دههی ۱۹۶۰ آسمان را برای سیگنالهای رادیویی تمدنهای بیگانه اسکن کرده است و تاکنون حتی یک پیام هم پیدا نکرده است. برونشتاین بر این باور است ازآنجاکه هیچ نشانهای از هوش فرازمینی پیدا نشده است، باید سعی کنیم مهارتهای رمزگشایی خود را روی سیگنالهایی که روی زمین میتوانیم تشخیص دهیم، امتحان کنیم. بهجای اینکه آنتنهای خود را بهسمت فضا بگیریم، میتوانیم فرهنگ موجود در اقیانوس را استراقسمع کنیم که حداقل برای ما بیگانه است.
برونشتاین میگوید: «فکر میکنم بسیار متکبرانه باشد که فکر کنیم انسان خردمند تنها موجود باهوش و باادراک روی زمین است. اگر کشف کنیم که اساسا تمدن کاملی درست جلو چشم ما وجود دارد، شاید این مسئله به تغییراتی در نحوهی رفتار ما با محیطزیست منجر شود یا سبب شود احترام بیشتری برای دنیای زنده قائل شویم.»