П’ятниця, 15 Травня, 2026
ГоловнаНовиниGoogle анонсував, що нова ШІ-модель Gemini матиме здатність аналізувати аудіозаписи
ГоловнаНовиниGoogle анонсував, що нова ШІ-модель Gemini матиме здатність аналізувати аудіозаписи

Google анонсував, що нова ШІ-модель Gemini матиме здатність аналізувати аудіозаписи

-

Згідно з повідомленнями, оновлена версія штучного інтелекту від Google, Gemini 1.5 Pro, тепер може розпізнавати та розуміти аудіофайли.

Про це пише ROOT NATION.

Чим більше ви подаєте данних штучному інтелекту, тим вище його ефективність. Початково моделі штучного інтелекту навчалися переважно за допомогою тексту – особливо це важливо для чат-ботів. Однак з часом вони здобули здатність аналізувати зображення, і зараз їх можна використовувати для реконструкції або створення цілком нових зображень за вашим запитом.

Штучний інтелект Gemini
Штучний інтелект Gemini

Штучний інтелект Gemini (раніше відомий як Bard) пройшов навчання в обробці зображень (хоча деякі експерименти з цим призвели до невеликих скандалів). Тепер він розширює свої можливості в аналізі аудіофайлів. Тестова версія Gemini 1.5 Pro, яка вміє це робити, перебуває на етапі випробувань і вважається навіть потужнішою за Gemini Ultra.

Успішне впровадження цієї функції розкриє перед користувачами безліч нових можливостей – наприклад, значну економію часу завдяки автоматичному створенню резюме довгих розмов, телефонних дзвінків, лекцій та інших подібних ситуацій. Для цього достатньо буде завантажити файл в Gemini. Існують інструменти для конспектування довгих розмов, але вони зазвичай спочатку транскрибують діалог, а потім генерують резюме. Але Gemini може просто прослухати розмову.

Gemini достатньо просто послухати розмову

Звісно, є один нюанс – наразі ця функція не є загальнодоступною. Для доступу до неї користувачам потрібна платформа розробки Vertex AI від Google або AI Studio. В компанії кажуть, що в майбутньому вона стане загальнодоступною, але жодних конкретних термінів не називають.

У цілому, спостерігати за розвитком штучного інтелекту дуже цікаво. Він вже робить наше життя простішим і дає більше можливостей для творчого вираження, а з цією новою функцією також допомагає економити час. Проте, якщо ваше спілкування з чат-ботами зі штучним інтелектом раніше було неефективним, можливо, варто подумати про вдосконалення вашого підходу.

Google опублікувала посібник, який допомагає користувачам ефективно формулювати запити, щоб отримати максимальну користь від чат-бота, такого як Gemini. Посібник рекомендує завжди включати у запит якусь інформацію про себе, додавати деталі до завдання, запитувати про марковані списки. Окремі завдання краще розбивати на кілька запитів, додавати конкретні вимоги щодо списків або кількості символів, просити виконати завдання у певному стилі. Можна навіть запитати у чат-бота, чи має він які-небудь уточнюючі питання щодо вашого завдання.

Посібник додає, що запити повинні бути сформульовані природно, в повних реченнях, і “найефективніші запити в середньому містять 21 слово”.

Максим Скляр
Максим Скляр
ШІ — зваблива тема. Ми зараз перебуваємо на порозі нової ери в історії людства, і це не пафосні слова. Свого часу світ змінили двигуни внутрішнього згоряння, літаки, конвеєри тощо — технології, які вивільняли час і сили людей для чогось більшого. Чи скористалися ми перевагами цих технологій? У багатьох аспектах — так. Але ШІ здатний вивільнити людей безпрецедентно значно. Ми отримаємо купу часу. На що ж людство витратить цей найцінніший ресурс? На творчість, прогулянки з сім'єю, подорожі?.. Чи ми просто перетворимося на залежний додаток до ШІ, атавізм, без якого світ зможе жити? Складні питання завжди супроводжують захопливі часи. Впевнений, людство здолає і приборкає технології, які саме ж і породило — так було і так буде, бо насправді шалений розвиток ШІ це про нас — людей, які здатні творити нове.

Схожі публікації

Вам сподобається

situs slot
slot dana
slot777
slot gacor hari ini