سرور مجازی
zoomit

عینک مترجم واقعیت افزوده گوگل؛ پروژه‌ای واقعی یا خیالی؟

نمی‌دانم Google I/O امسال را تماشا کردید یا جمع‌بندی دیتاسنتر من از کل این رویداد را خواندید یا خیر. این مراسم که پس از دو سال از شروع همه‌گیری دوباره به روی صحنه مانتین‌ویو بازگشته بود، پربارتر و هیجان‌انگیزتر از سال‌های گذشته بود و درکنار خبرهای نرم‌افزاری و قابلیت‌های جدید جستجو، از Scene Exploration گرفته تا تشخیص هوشمند رنگ پوست، بخش زیادی را به معرفی محصولات سخت‌افزاری و کاربرمحور از جمله پیکسل 6a، پیکسل واچ و پیکسل تبلت اختصاص داد.

اما در پایان مراسم، گوگل سورپرایز دیگری را رو کرد که بلندپروازانه‌ترین و به‌نظرم، آینده‌نگرانه‌ترین و هیجان‌انگیزترین محصول معرفی‌شده گوگل در این رویداد بود؛ عینک مترجم!

مقاله‌ی مرتبط:

  • در رویداد Google I/O 2022 چه گذشت؛ از اندروید ۱۳ تا عینک مترجم [به‌همراه ویدئو]

گوگل در ویدئوی کوتاهی، از عینک واقعیت افزوده‌ای رونمایی کرد که تنها یک قابلیت دارد و آن نمایش ترجمه‌ی صحبت‌های افراد درست در گستره‌ی دید کاربری است که عینک به چشم دارد. در این ویدئوی احساسی که در پایین آن عبارت «نمایش شبیه‌سازی‌شده» درج شده بود، مادر و فرزندی را دیدیم که برای اولین بار توانستند حرف یکدیگر را بفهمند. همچنین فردی را دیدیم که داشت به زبان اشاره صحبت می‌کرد و ترجمه‌ی حرف‌هایش به زبان انگلیسی برای کسی که عینک گوگل را به چشم داشت،‌ به‌صورت واقعیت افزوده و زنده به‌نمایش در‌می‌آمد. مدیر محصول گوگل قابلیت ترجمه‌ی زنده این عینک را «زیرنویسی برای دنیا» توصیف و ما را برای مدت کوتاهی در تصور آینده‌ای زیباتر از آنچه معمولاً انتظارش را داریم‌، غرق کرد.

اما چقدر این تصور عملی است و چقدر با این آینده فاصله داریم؟ آنقدری که شاید به عمر ما نرسد یا زیر انبوه پروژه‌های رها‌شده‌ی گوگل دفن شود؟

همین که گوگل تصمیم گرفته این عینک را تنها به یک‌ قابلیت و آن هم قابلیتی که ۱۶ سال در حال بهبود آن است، مجهز کند، تصمیم بسیار هوشمندانه‌ای بوده و ما را کمی به آینده‌ی آن امیدوار می‌کند. بااین‌حال، گوگل ترنسلیت اگرچه ابزار بسیار کاربردی و حیرت‌انگیزی است که در مواقع اضطراری، به کمک‌مان آمده است، در عین حال به مراتب پیش آمده که اشتباهات خجالت‌آور زیادی در ترجمه انجام دهد. شاید در حد احوال‌پرسی و پرسیدن آدرس بتوان به ترجمه‌ی گوگل ترنسلیت اعتماد کرد، اما به‌هیچ‌وجه نمی‌توان از درستی ترجمه‌ی داستان‌های کلاسیک یا ضرب‌المثل‌ها و جملات پیچیده آن هم از زبان‌های غیراروپایی مطمئن بود.

گوگل عینک مترجم را زیرنویسی برای دنیا توصیف می‌کند

سال ۲۰۱۷ نیز گوگل زمانی که داشت برای نسل اول پیکسل بادز تبلیغ می‌کرد، روی قابلیت ترجمه‌ی زنده آن مانور زیادی داد. البته افرادی که تجربه‌ی استفاده از این هدفون را داشتند، قابلیت ترجمه‌ی زنده‌ی آن را ایده‌ای تحسین‌برانگیز اما با پیاده‌سازی تأسف‌بار توصیف کردند. ظاهراً توانایی این هدفون در ترجمه‌ی مکالمه‌ی افراد در حدی بود که احساس می‌کردید یک کودک پنج‌ساله در حال صحبت با شما است و این تجربه با آنچه گوگل آن زمان در ویدئوی تبلیغاتی پیکسل بادز نمایش داده بود، زمین تا آسمان تفاوت داشت.

مشکلات و چالش‌های گوگل در زمینه‌ی ترجمه به کنار، این شرکت وعده داده که ترجمه قرار است داخل عینک واقعیت افزوده صورت گیرد؛ حوزه‌ی دیگری که گوگل از سال ۲۰۱۲ همچنان با آن درگیر است و هنوز نتوانسته حتی ۱۰ درصد از آنچه را که در ویدئوی مفهومی گوگل گلس که آن زمان نشان داده بود، به واقعیت تبدیل کند. در این ویدئو، گوگل وعده‌های شگفت‌انگیز و بلندپروازنه‌ای می‌دهد؛ تماشا و تعامل با تمام اپلیکیشن‌های کاربردی گوشی‌های هوشمند مثل یادآوری‌ها، پیام‌ها، ساعت و گزارش آب‌و‌هوا، گزارش لحظه‌ای از وضعیت مترو و فلش‌های مسیریابی و تماس ویدئویی و ثبت عکس و آپلود آن در شبکه‌های اجتماعی، همه و همه درست در فضای جلوی چشمان کاربر و به‌کمک گوگل گلس انجام می‌شود. اما این پروژه به جایی نرسید و به یک شکست تمام‌عیار برای گوگل تبدیل شد، به‌طوری که تا چند سال سراغی از آن نگرفت.

البته عینک مترجم گوگل از پروژه‌ی نافرجام گلس متمرکزتر است و فقط قرار است یک کار را انجام دهد که این موضوع، وعده‌ی این شرکت بدسابقه را کمی باور پذیرتر می‌کند. چیزی که گوگل به ما نشان داد عینکی بود که فقط قرار است متن ترجمه‌شده را نمایش دهد نه اینکه تمام‌ کارهای یک گوشی هوشمند را یک‌جا به عهده بگیرد؛ اما انجام همین یک وظیفه چقدر امکان‌پذیر است، به‌خصوص در شرایطی که گوگل هنوز هیچ توضیحی درباره‌ی سازوکار این عینک ارائه نداده است؟

حقیقت این است که ساخت عینک‌های واقعیت افزوده اصلاً کار آسانی نیست. اگر در محیطی باشید که میزان نور فقط کمی زیاد باشد، نمی‌توانید به‌راحتی متن‌ها را بخوانید. حتی خواندن زیرنویس از روی نمایشگر تلویزیون وقتی نور مستقیم خورشید به آن تابیده است، بسیار چالش‌برانگیز می‌شود؛ چه برسد به اینکه بخواهیم این تجربه را روی نمایشگری چسبیده به صورت و آن هم زمانی که مشغول صحبت با کسی هستیم که زبانش را نمی‌فهمیم،‌ داشته باشیم.

البته این را هم باید قبول داشت که تکنولوژی با سرعت در حال پیشرفت است و گوگل ممکن است بتواند تا چند سال دیگر از پس چالش‌های کنونی برآید. اما این حقیقت هنوز پا بر جا است که گوگل ترنسلیت به حدی پیشرفت نکرده تا بتوان با آن ترجمه‌ی دقیق و کاملاً درستی از مکالمات انجام داد؛ چطور می‌توان انتظار ترجمه‌ای روان را در عینک واقعیت افزوده‌ی این شرکت داشت؟

البته همان‌طور که موقع صحبت کردن با الکسا، سیری یا گوگل اسیستنت از فرمان‌های صوتی مشخص و ساده‌تری استفاده می‌کنیم تا برای هوش ماشینی قابل فهم باشد، هنگام استفاده از ابزار ترجمه نیز ممکن است از جملات ساده‌ و واضح‌تری استفاده کنیم. اما در ساده‌ترین حالت هم عملکرد گوگل ترنسلیت در حد انتظار نبوده است. مثلاً یکی از افراد مسلط به زبان کره‌ای عنوان کرد که در ویدئوی شمارش معکوس رویداد I/O گوگل، از کلمه‌ای برای «خوش آمدید» استفاده شده بود که هیچ کره‌ای زبانی از آن استفاده نمی‌کند.

تازه این اشتباه پیش‌و‌پاافتاده‌ای است؛ زمانی که گوگل داشت با‌ آب‌و‌تاب از اضافه شدن ۲۴ زبان جدید به ترنسلیت صحبت می‌کرد، اشتباه بزرگ‌تر و نابخشودنی‌تری افتاد! در نمایشگر پشت سر سوندار پیچای، مدیر عامل گوگل، نام زبان‌هایی که با الفبای عربی نوشته‌ شده بودند، به‌صورت جدا از هم و برعکس و کاملاً نامفهوم تایپ شده بود. حتی یکی از کاربران عربی زبان در توییتر با منشن کردن پیچای، به گوگل طعنه انداخت و گفت: «استارتاپ‌های کوچک و مستقلی چون گوگل بودجه کافی برای استخدام کسی که سواد نوشتن به زبان عربی‌اش در حد دانش آموز دبستانی باشد، ندارند.» راستش ما توقع تجربه‌ای صددرصد بی‌عیب و نقص از محصولات گوگل نداریم؛ اما برای شرکتی که به‌سختی در تلاش است ما را قانع کند چیزی نمانده تا ترجمه‌ی زنده را به عینک‌های واقعیت افزوده بیاورد، پیش آمدن چنین اشتباهات خجالت‌آوری، باورپذیری ادعای گوگل را زیر سؤال می‌برد.

رویداد i/o گوگل

گوگل درحالی از اضافه شدن ۲۴ زبان جدید به ترنسلیت خبر داد که نام برخی از آن‌ها اشتباه نوشته شده بود.

واضح است که گوگل سعی در حل مشکلی بی‌نهایت پیچیده را دارد. ترجمه‌ی کلمات آسان است، فهم گرامر دشوار اما شدنی است؛ اما زبان و مکالمه بسیار پیچیده‌تر از کلمات و گرامر هستند. مثلاً افرادی که چند زبانه هستند، گاهی هنگام صحبت به یک زبان، از کلمات زبان دیگر استفاده می‌کنند. فکر می‌کنید عینک مترجم گوگل بتواند از پس ترجمه‌ی این مدل مکالمه برآید؟ تازه داستان زمانی که پای جملات نیمه‌کاره، دوپهلو، ضرب‌المثل‌ها و ارجاعات گنگ به میان می‌آید، پیچیده‌تر می‌شود.

البته گوگل در رقابت عینک‌های واقعیت افزوده تنها نیست. شرکت متا تاکنون میلیاردها دلار برای توسعه‌ی عینک‌های AR خرج کرده و تعداد کارمندان بخش سخت‌افزار و نرم‌افزار متاورسی آن به‌حدود ۱۸ هزار نفر افزایش یافته که فقط در سال گذشته بیش از ۱۰ میلیارد دلار برای این شرکت هزینه داشته است. نقشه‌ی راه متا برای عرضه‌ی این عینک‌ها که البته از عینک مترجم گوگل بلندپروازانه‌تر به‌نظر می‌رسند، از سال ۲۰۲۴ تا ۲۰۲۶ تعیین شده؛ اما بسیار بعید است تا چند سال دیگر شاهد تکنولوژی‌ای باشیم که بتواند فردی را به‌شکل هولوگرام جلوی ما بنشاند تا با هم شطرنج بازی کنیم.

با تمام این حرف‌ها، برنامه‌ گوگل برای عرضه‌ی عینک مترجم کاملاً تحسین‌برانگیز است و من بی‌صبرانه منتظر روزی هستم که تمام افراد بتوانند مانند مادر و فرزند ویدئوی گوگل، بدون هیچ مشکلی حرف همدیگر را بفهمند. اما تا رسیدن آن روز و فراگیر شدن استفاده از عینک‌های واقعیت افزوده، راه درازی در پیش است و بعید می‌دانم تلاش‌های اولیه‌ی گوگل برای عرضه‌ی این عینک به‌اندازه‌ی ویدئویی که در رویداد I/O تماشا کردیم، رضایت‌بخش باشد.

مجله خبری mydtc

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا