Згідно з повідомленнями, оновлена версія штучного інтелекту від Google, Gemini 1.5 Pro, тепер може розпізнавати та розуміти аудіофайли.
Про це пише ROOT NATION.
Чим більше ви подаєте данних штучному інтелекту, тим вище його ефективність. Початково моделі штучного інтелекту навчалися переважно за допомогою тексту – особливо це важливо для чат-ботів. Однак з часом вони здобули здатність аналізувати зображення, і зараз їх можна використовувати для реконструкції або створення цілком нових зображень за вашим запитом.

Штучний інтелект Gemini (раніше відомий як Bard) пройшов навчання в обробці зображень (хоча деякі експерименти з цим призвели до невеликих скандалів). Тепер він розширює свої можливості в аналізі аудіофайлів. Тестова версія Gemini 1.5 Pro, яка вміє це робити, перебуває на етапі випробувань і вважається навіть потужнішою за Gemini Ultra.
Успішне впровадження цієї функції розкриє перед користувачами безліч нових можливостей – наприклад, значну економію часу завдяки автоматичному створенню резюме довгих розмов, телефонних дзвінків, лекцій та інших подібних ситуацій. Для цього достатньо буде завантажити файл в Gemini. Існують інструменти для конспектування довгих розмов, але вони зазвичай спочатку транскрибують діалог, а потім генерують резюме. Але Gemini може просто прослухати розмову.

Звісно, є один нюанс – наразі ця функція не є загальнодоступною. Для доступу до неї користувачам потрібна платформа розробки Vertex AI від Google або AI Studio. В компанії кажуть, що в майбутньому вона стане загальнодоступною, але жодних конкретних термінів не називають.
У цілому, спостерігати за розвитком штучного інтелекту дуже цікаво. Він вже робить наше життя простішим і дає більше можливостей для творчого вираження, а з цією новою функцією також допомагає економити час. Проте, якщо ваше спілкування з чат-ботами зі штучним інтелектом раніше було неефективним, можливо, варто подумати про вдосконалення вашого підходу.
Google опублікувала посібник, який допомагає користувачам ефективно формулювати запити, щоб отримати максимальну користь від чат-бота, такого як Gemini. Посібник рекомендує завжди включати у запит якусь інформацію про себе, додавати деталі до завдання, запитувати про марковані списки. Окремі завдання краще розбивати на кілька запитів, додавати конкретні вимоги щодо списків або кількості символів, просити виконати завдання у певному стилі. Можна навіть запитати у чат-бота, чи має він які-небудь уточнюючі питання щодо вашого завдання.
Посібник додає, що запити повинні бути сформульовані природно, в повних реченнях, і “найефективніші запити в середньому містять 21 слово”.

