Защита информации. «Тинькофф» продаёт корпоративным клиентам технологию синтеза и распознавания речи

С помощью Tinkoff VoiceKit можно создавать голосовых помощников, автоматизировать работу колл-центра и озвучивать видеоролики.

Группа «Тинькофф» начала продавать корпоративным клиентам собственную речевую технологию Tinkoff VoiceKit, с помощью которой можно преобразовывать голос в текст и синтезировать голос из текста. Об этом vc.ru рассказал представитель компании.

«Тинькофф» разрабатывает технологию распознавания речи с 2016 года, а технологию синтеза речи с 2018 года (на основе таких моделей, как WaveNet, Tacotron-2 и Deep Voice). Для обучения банк использует терабайты данных и десятки часов человеческой речи, объяснил представитель группы.

«У нас была блестящая команда разработчиков, 80 видеокарт, более 15 тысяч часов аудио из свободных источников, десятки тысяч часов звонков собственного колл-центра, суперкомпьютер «Колмогоров» и диктор, готовый пять месяцев записываться для синтеза речи. Мы работали три года, разметили за это время более 4,5 тысяч часов аудио и натренировали глубокие нейросетевые модели.» Вячеслав Цыганов, вице-президент «Тинькофф».

Заявку на подключение технологии клиенты могут оставить на сайте Tinkoff VoiceKit. Для образовательных учреждений и студентов «Тинькофф» обещает предоставлять технологию бесплатно. Для остальных тариф составляет 40-45 копеек за распознавание минуты двухканального аудио, в планах также ввести посекундную тарификацию. Стоимость синтеза речи банк пока не определил. Для сравнения, тариф на распознавание речи с помощью технологии SpeechKit от «Яндекса» составляет 60 копеек за минуту двухканального аудио.

«Тинькофф» использовал речевые технологии для создания голосового помощника «Олега», а также для анализа качества обработки обращений клиентов в колл-центр и борьбы с мошенничеством. По версии компании, Tinkoff VoiceKit можно использовать для:

Создания голосовых помощников.
Создания программных роботов для автоматизации работы колл-центра.
Записи аудиокниг и озвучка видеороликов.
Создания приложений для людей с ограниченными возможностями.
Перевода звуковых записей публичных выступлений в текстовый формат.

Источник: vc.ru

23 июля, 2019

Безопасникам

«Тинькофф» продаёт корпоративным клиентам технологию синтеза и распознавания речи

Группировка OilRig использует соцсеть LinkedIn для распространения вредоносов

Банки предупредили о сокращении числа терминалов Qiwi и других игроков

Россияне жалуются на незаконную обработку личных данных

Equifax выплатит до 700 млн долларов из-за утечки данных клиентов

Предустановку российского ПО хотят вменить в обязанность

5G усложнит прослушку телефонов преступников

«Второй Сноуден» получил 9 лет за кражу секретных документов

Правительство назначит избранных производителей электроники

ФСБ заказала разработку софта для деанонимизации пользователей Tor

Безопасная разработка

Читалка

ФСТЭК России опубликовал документ от 25.11.2025 «Методика анализа защищённости информационных систем»

ФСТЭК России опубликовал документ от 25.11.2025 «Методика анализа защищённости информационных систем»

ФСТЭК России опубликовал «Рекомендации по базовой настройке механизмов безопасности почтовых сервисов от атак, связанных с подменой отправителя (спуфинг-атак)»

ФСТЭК России опубликовал «Рекомендации по базовой настройке механизмов безопасности почтовых сервисов от атак, связанных с подменой отправителя (спуфинг-атак)»

Календарь мероприятий

Наши медиауслуги

Новый номер

Подписаться на новости BIS Journal / Медиа группы Авангард

Стать автором BIS Journal