«Тинькофф» продаёт корпоративным клиентам технологию синтеза и распознавания речи

С помощью Tinkoff VoiceKit можно создавать голосовых помощников, автоматизировать работу колл-центра и озвучивать видеоролики.

Группа «Тинькофф» начала продавать корпоративным клиентам собственную речевую технологию Tinkoff VoiceKit, с помощью которой можно преобразовывать голос в текст и синтезировать голос из текста. Об этом vc.ru рассказал представитель компании.

«Тинькофф» разрабатывает технологию распознавания речи с 2016 года, а технологию синтеза речи с 2018 года (на основе таких моделей, как WaveNet, Tacotron-2 и Deep Voice). Для обучения банк использует терабайты данных и десятки часов человеческой речи, объяснил представитель группы.

«У нас была блестящая команда разработчиков, 80 видеокарт, более 15 тысяч часов аудио из свободных источников, десятки тысяч часов звонков собственного колл-центра, суперкомпьютер «Колмогоров» и диктор, готовый пять месяцев записываться для синтеза речи. Мы работали три года, разметили за это время более 4,5 тысяч часов аудио и натренировали глубокие нейросетевые модели.» Вячеслав Цыганов, вице-президент «Тинькофф».

Заявку на подключение технологии клиенты могут оставить на сайте Tinkoff VoiceKit. Для образовательных учреждений и студентов «Тинькофф» обещает предоставлять технологию бесплатно. Для остальных тариф составляет 40-45 копеек за распознавание минуты двухканального аудио, в планах также ввести посекундную тарификацию. Стоимость синтеза речи банк пока не определил. Для сравнения, тариф на распознавание речи с помощью технологии SpeechKit от «Яндекса» составляет 60 копеек за минуту двухканального аудио.

«Тинькофф» использовал речевые технологии для создания голосового помощника «Олега», а также для анализа качества обработки обращений клиентов в колл-центр и борьбы с мошенничеством. По версии компании, Tinkoff VoiceKit можно использовать для:

  • Создания голосовых помощников.
  • Создания программных роботов для автоматизации работы колл-центра.
  • Записи аудиокниг и озвучка видеороликов.
  • Создания приложений для людей с ограниченными возможностями.
  • Перевода звуковых записей публичных выступлений в текстовый формат.

 

Источник: vc.ru

23 июля, 2019

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

29.06.2026
«Цифра» поможет в борьбе с рецидивизмом
29.06.2026
ИИ-законопроект сфокусировался на фундаментальных моделях
29.06.2026
Servicepipe подписала соглашение о сотрудничестве с НИУ «МЭИ» для подготовки ИБ-кадров
29.06.2026
НИУ ВШЭ: Самый острый дефицит ИИ-навыков — у ИКТ-специалистов
29.06.2026
Пятёрка стран Европы стала главной мишенью программ-вымогателей
29.06.2026
CISA поможет ведомствам осознать плюсы «нулевого доверия»
26.06.2026
Интерпол — о действиях скамеров в Азиатско-Тихоокеанском регионе
26.06.2026
Приложение VK удалили из App Store
26.06.2026
ЛК: Загрузка APK-файлов из сторонних источников связана с повышенными рисками
26.06.2026
SentinelOne: Обнаружен ИИ-газлайтер!

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных