با راه‌اندازی رسمی "گوگل پادکست" در ماه ژوئن گذشته، این شرکت وعده‌ی قابلیت‌های هوش مصنوعی مانند ترجمه و رونویسی خودکار را داد. 

در اوایل سال (2024)، گوگل قابلیت دوم خود را برای برنامه اندروید فعال کرد تا کاربران بتوانند پادکست‌ها را به صورت متنی نیز بخوانند.

در حالی که این قابلیت به طور کامل کاربرمحور نیست، اما این عملکرد در حال حاضر برای جستجو در پس‌زمینه کار می‌کند. برای کسب اطلاعات بیشتر، پیشنهاد می‌کنیم مقاله گوگل پادکست چیست؟ و چه مزیتی برای خیریه‌ها دارد؟ از مجله پادکست نیک آوا را مطالعه کنید.

رونویسی خودکار پادکست‌ها

در آوریل گذشته، گوگل به طور مفصل برنامه‌های خود برای پادکست را با تمرکز بر هوش مصنوعی و یادگیری ماشینی تشریح کرد. با رونویسی خودکار پادکست‌ها، گوگل می‌تواند بدون تکیه صرف بر توضیحات و یادداشت‌های تولیدکنندگان پادکست، موضوع یک قسمت را درک کند.

این فناوری با Google Cloud Speech-to-Text انجام می‌شود و در حال حاضر برای رونویسی گفتگوی چهار یا چند سخنران با نویز پس زمینه به مدت بیش از دو ساعت رتبه بندی شده است. به گفته Android Police، به نظر می رسد این قابلیت در حال حاضر در حال استفاده است.

برای مطالعه:

فناوری هوش مصنوعی در خدمت تقویت ارتباطات خیریه

بر اساس تجربه‌ی وب که به تازگی کشف و تأیید شده، گوگل پادکست در حال رونویسی اپیزودها است. برخلاف دکمه‌ی زیرنویس پنهان (Closed Captioning) که در ژانویه در اندروید مشاهده کردیم، این ویژگی کاملاً کاربر محور نیست. بلکه، فقط با ابزارهای توسعه دهنده در کد منبع صفحه قابل دسترسی است.

به نظر می رسد این رونویسی برای بهبود نتایج جستجو استفاده می شود. قابلیت جستجوی داخلی - که به تازگی جستجوی اپیزود را اضافه کرده است - می تواند اصطلاحاتی را پیدا کند که فقط رونویسی شده‌اند، اما در هیچ جای دیگری در یادداشت‌های نمایش یا جزئیات پادکست گنجانده نشده‌اند.

اینکه آیا گوگل از رونویسی برای ارائه ویژگی‌های پیشرفته‌تر، مانند درک موضوعات یک پادکست به جای صرفاً یافتن تطابق‌های کلمه به کلمه استفاده می‌کند یا نه، هنوز مشخص نیست.!

رونویسی همچنین می‌تواند امکان افزودن تایم استمپ (Timestamp) و فهرست‌بندی را فراهم کند، به طوری که سازندگان دیگر نیازی به اضافه کردن دستی فصل‌ها نداشته باشند و کاربران بتوانند از طریق نتایج جستجو به بخش دقیقی از یک اپیزود دسترسی پیدا کنند. 

گوگل با استفاده از فناوری تبدیل متن به گفتار (Text-to-Speech) می‌تواند اپیزودها را ترجمه کند و آنها را در سطح جهانی در دسترس قرار دهد. در حال حاضر، اپلیکیشن اندروید گوگل پادکست در حال تست بر روی قابلیتی است که به کاربران اجازه می‌دهد در حین گوش دادن به پادکست، متن آن را بخوانند، این قابلیت در محیط های پر سر و صدا بسیار کاربردی است.

با توجه به اینکه درآمد اصلی گوگل همچنان تبلیغات است، رونویسی می‌تواند به این شرکت اجازه دهد تا با دانستن اینکه به تازگی چه چیزی را در یک اپیزود گوش داده‌اید، تبلیغات بهتری را ارائه دهد. به طور مثال، تبلیغات می‌تواند در پخش‌کننده پادکست ظاهر شوند یا مانند امروز، کاربران را در اینترنت دنبال کند.

منبع: ترجمه شده از سایت 9to5google.com