Мы запускаем инновационные продукты для ритейла с целью улучшать эффективность взаимодействия потребителей и производителей. Используются технологии в области CV & Speech-to-Text с последующей обработкой и визуализацией данных.
Что предстоит делать:
Создавать архитектуру и алгоритмы обработки для акустической и языковой моделей распознавания речи;
Ресерчить алгоритмы, которые помогут улучшить качество распознавания в шумной среде;
Экспериментировать с параметрическими моделями для синтеза речи;
Улучшать качество Keyword Spotting;
Генерировать гипотезы, ставить эксперименты и доносить результаты;
Изучать и реализовывать SOTA алгоритмы.
Что мы ждем от вас:
Практический опыт работы Data Scientist'ом не менее 1 года;
Уверенные знания Python;
Понимание базовых структур данных и алгоритмов работы с ними;
Знание принципов работы современных ML и DL алгоритмов;
Хорошая математическая подготовка и знание прикладной статистики;
Опыт использования DL фреймворков: Tensorflow, Pytorch, Keras;
Желание самостоятельно изучать научные статьи и ставить эксперименты на их основе.
Будет плюсом:
опыт работы с известными фреймворками для распознавания речи, такими, как Kaldi, sphinx, deepspeech, wavenet, espnet и подобными;
опыт работы с методами синтеза речи; наличие статей, патентов.
Требования