Нещодавно компанія Google повідомила про глобальне оновлення свого інструменту на базі штучного інтелекту NotebookLM. Йдеться про функцію аудіооглядів (Audio Overviews), яка відтепер доступна десяткам нових мовних спільнот по всьому світу. Ця функція дозволяє автоматично створювати подкасти або звукові резюме на основі завантажених користувачем документів. Наприклад, навчальних матеріалів, дослідницьких праць або юридичних текстів.
Про це розповідає Techcrunch.
Згідно з заявою Google, нова опція дозволяє користувачам самостійно обирати мову, якою буде згенеровано аудіоконтент — незалежно від основної мови акаунта. Це дозволяє легко створювати багатомовні подкасти, навчальні або ознайомчі матеріали.
Це відкриває додаткові можливості для викладачів, студентів, аналітиків та інших користувачів, які працюють із багатомовними документами. Наприклад, учитель може об’єднати інформацію з документів трьома мовами:
- Іспанською
- Англійською
- Португальською
І при тому ще створити єдиний узагальнений аудіоогляд однією мовою для учнів.
Вражаючий мовний список від японської до гаїтянської креольської
У повідомленні до видання TechCrunch компанія Google надала повний перелік мов, які тепер підтримуються функцією Audio Overviews. Серед них:
- Арабська
- Німецька
- Іспанська (різні варіанти)
- Французька
- Китайська (спрощена і традиційна)
- Українська
- Японська
Також мови регіонального значення: каннадська, майтхілі, пушту, сіндхі, галісійська, конкані, яванська тощо.
Таке мовне розмаїття підкреслює прагнення компанії зробити свої технології доступними для якомога ширшої аудиторії незалежно від географії чи мовної приналежності.
Розширення підтримки функції Audio Overviews є черговим кроком Google до інклюзивності у сфері штучного інтелекту. Компанія продовжує вдосконалювати інструменти, які допомагають користувачам не лише створювати контент, але й краще сприймати його. Незалежно від рівня володіння мовами чи наявності вільного часу для читання.
Нещодавно редакція сайту AI360 писала про те, як Google пришвидшив випуск моделей Gemini, які мають проблеми із прозорістю. Після запуску ChatGPT компанією OpenAI Google певний час залишалася осторонь активного змагання у сфері штучного інтелекту. Проте останні події свідчать про кардинальну зміну стратегії технологічного гіганта.
У березні Google представила свою новітню модель штучного інтелекту Gemini 2.5 Pro, яка, за результатами тестів, показала високі результати у сфері міркування, програмування та обчислень. Цей реліз став другим за три місяці, адже наприкінці 2024 року Google вже запускала модель Gemini 2.0 Flash.

