«Тинькофф» продаёт корпоративным клиентам технологию синтеза и распознавания речи

С помощью Tinkoff VoiceKit можно создавать голосовых помощников, автоматизировать работу колл-центра и озвучивать видеоролики.

Группа «Тинькофф» начала продавать корпоративным клиентам собственную речевую технологию Tinkoff VoiceKit, с помощью которой можно преобразовывать голос в текст и синтезировать голос из текста. Об этом vc.ru рассказал представитель компании.

«Тинькофф» разрабатывает технологию распознавания речи с 2016 года, а технологию синтеза речи с 2018 года (на основе таких моделей, как WaveNet, Tacotron-2 и Deep Voice). Для обучения банк использует терабайты данных и десятки часов человеческой речи, объяснил представитель группы.

«У нас была блестящая команда разработчиков, 80 видеокарт, более 15 тысяч часов аудио из свободных источников, десятки тысяч часов звонков собственного колл-центра, суперкомпьютер «Колмогоров» и диктор, готовый пять месяцев записываться для синтеза речи. Мы работали три года, разметили за это время более 4,5 тысяч часов аудио и натренировали глубокие нейросетевые модели.» Вячеслав Цыганов, вице-президент «Тинькофф».

Заявку на подключение технологии клиенты могут оставить на сайте Tinkoff VoiceKit. Для образовательных учреждений и студентов «Тинькофф» обещает предоставлять технологию бесплатно. Для остальных тариф составляет 40-45 копеек за распознавание минуты двухканального аудио, в планах также ввести посекундную тарификацию. Стоимость синтеза речи банк пока не определил. Для сравнения, тариф на распознавание речи с помощью технологии SpeechKit от «Яндекса» составляет 60 копеек за минуту двухканального аудио.

«Тинькофф» использовал речевые технологии для создания голосового помощника «Олега», а также для анализа качества обработки обращений клиентов в колл-центр и борьбы с мошенничеством. По версии компании, Tinkoff VoiceKit можно использовать для:

  • Создания голосовых помощников.
  • Создания программных роботов для автоматизации работы колл-центра.
  • Записи аудиокниг и озвучка видеороликов.
  • Создания приложений для людей с ограниченными возможностями.
  • Перевода звуковых записей публичных выступлений в текстовый формат.

 

Источник: vc.ru

23 июля, 2019

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

11.02.2026
Не более 20 карт в одни руки. Россиянам установят лимит на «пластик»
11.02.2026
Санкции Евросоюза приобретают «ковровые» черты
11.02.2026
В России продолжают блокировать Telegram и YouTube (?)
10.02.2026
Протекшен Технолоджи и АМТ-ГРУП исключат утечку конфиденциальных данных
10.02.2026
Выбор криптошлюза нужной производительности станет проще, если условия тестирования приближены к реальным
10.02.2026
Подведены итоги 26-го Форума iFin-2026
10.02.2026
SECURITM: SGRC-система с сертификатом ФСТЭК России 4 уровня доверия
09.02.2026
В CISA намерены бороться с угрозами, исходящими от инсайдеров
09.02.2026
Объектов меньше, нарушений — больше. Какие цифры принесла ФСТЭК
09.02.2026
Портал PT Fusion внесён в единый реестр российского ПО

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных