В стенах Пермского национального исследовательского политехнического университета (ПНИПУ) разрабатывается технология, которая позволит роботам считывать эмоции людей. И не только считывать, но и воспроизводить их в своей механической речи.
Эмоции – особый вид психических процессов, посредством которых человек выражает отношение к другим людям, объектам окружающей среды и к самому себе, считают исследователи. Поверить эту гармонию средствами алгебры и научить робота воспроизводить эмоциональную речь достаточно сложно.
Это многоэтапный процесс, который включает в себя анализ человеческой речи и обнаружение эмоций во всех фразах, а затем синтез речи робота с необходимыми дополнительными оттенками в тон или в противоположность высказыванию говорящего человека. И каждый из этих шагов характеризуется неопределенностью результата. Чтобы подступиться к решению такой проблемы, исследователям понадобилось не только владение последним словом технологий, но и знание… педагогики.
– Чтобы добавить эмоции к голосу робота, мы использовали метод прямого обучения, – поясняет доцент кафедры автоматики и телемеханики ПНИПУ, кандидат технических наук Юрий Липин. – Он позволяет нейросети запоминать интонации и в дальнейшем корректировать неэмоциональную фразу с помощью математической модели эмоций. Таким образом, с помощью новой технологии робот, генерируя один и тот же текст фразы, может изменять интонацию ее произнесения.
Ученые провели эксперимент, в котором участвовали и гуманитарии – студенты Пермского института культуры. Молодые люди записали восемь голосовых роликов с выражением тех или иных эмоций, а первая запись была в нейтральном тоне. Далее были разработаны математические модели интонаций. И удалось синтезировать изменения голоса.
Построенный далее алгоритм позволил создать несколько фраз, которые у робота звучали достаточно естественно. В дальнейших планах разработчиков – создание полноценной языковой модели для распознавания и воссоздания эмоций, поскольку вариативность речи в зависимости от высказываемых эмоций во многом зависит от языка.
Результаты исследования представлены в англоязычном журнале ElConRus (IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering, 18+, Москва – Петербург).