Усе більше технологічних компаній світу інвестують у розвиток голосових інтерфейсів для штучного інтелекту. Такі гіганти як Meta, Google, OpenAI та Anthropic вже дозволяють користувачам взаємодіяти з ботами природною мовою, використовуючи розпізнавання мовлення. Серед них з’явився гравець, який претендує на лідерство у цій сфері — стартап Wispr Flow.
Про це повідомляє Techcrunch.
Ця компанія розробила нову платформу, що поєднує простоту диктування з багатомовною підтримкою. Їх технологія перетворення мовлення на текст уже доступна для Windows та Mac, а тепер — і для пристроїв iOS. Причому додаток діє як клавіатура, дозволяючи використовувати голос для введення тексту в будь-якій програмі.
Попри велику кількість продуктів з голосовим введенням, розробка Wispr Flow відзначається високою якістю розпізнавання навіть у складних мовних умовах. Один із перших користувачів, журналіст індійського походження, поділився досвідом, зазначивши, що інші подібні програми часто помилялися у трансформації його акценту. Натомість Wispr Flow показав значно точніший результат, навіть без глибокого навчання.
Після кількох сесій використання, точність диктування зросла настільки, що користувач почав повністю покладатися на додаток у повсякденній роботі. Від електронної пошти до написання великих текстів, зокрема й цієї статті.
Унікальні функції: шепіт, офлайн-режим та словник
Додаток має низку фіч, які вирізняють його серед конкурентів. Наприклад, він дозволяє вводити текст шепотом, що зручно у публічних місцях. Також є можливість додавати власні слова або терміни до словника, що особливо важливо для користувачів з технічними чи вузькопрофільними завданнями.
Wispr Flow підтримує понад 100 мов і працює навіть у середовищах з поганим інтернетом. У мобільній версії передбачено повноцінну клавіатуру зі спецсимволами, а десктопна дозволяє запускати диктування за допомогою гарячої клавіші.
Наразі Wispr Flow доступний безкоштовно до 2000 слів на тиждень. Для активніших користувачів існує передплата:
- $12 – на місяць
- $144 – на рік
Передоплата на рік відкриває безлімітний доступ до функціоналу й ранні релізи нових функцій.
Фінансові показники стартапу вражають. Вже залучено $26 мільйонів від таких інвесторів, як NEA, Palo Alto Networks та 8VC. Співзасновник компанії Танай Котарі повідомив, що коефіцієнт конверсії передплат становить 19%, а щомісячне зростання доходів досягає 60%.
Плани на майбутнє: Android і корпоративні функції
Команда Wispr активно працює над версією для Android, запуск якої очікується цього року. Також у розробці знаходиться корпоративний модуль зі спільним контекстом. Додаток зможе “вивчати” термінологію певної команди чи компанії, що спростить колективну роботу.
Конкуренція у сфері диктування зростає, на ринку вже працюють такі додатки, як: Aqua, Talktastic, Superwhisper та Betterdication, але Котарі впевнений у перевазі Wispr Flow. На його думку, глибока інженерна експертиза та довгостроковий фокус на якість диктування стануть ключем до перемоги.

