
Изследователите тестват своята роботизирана система, която може да идентифицира и имитира човешки емоции в тяхната лаборатория в Ухан, провинция Хубей. China Daily
Инженери от Университета за наука и технологии Huazhong в Ухан, провинция Хубей, разработиха революционна роботизирана система, способна да идентифицира и имитира сложни човешки емоции, значителен скок към преодоляване на комуникационната пропаст между хора и машини.
Изследването, ръководено от професор Ю Ли, използва високопрецизни алгоритми за декодиране на „визуалния език“ на човешкото лице. Чрез идентифициране на различни лицеви „единици за действие“ – фините движения на мускулите на очите, носа и устата – системата може да разпознае седем основни емоции със среден процент на точност от 95 процента в сценарии от реалния свят. Основните емоции са гняв, отвращение, страх, щастие, тъга, изненада и неутрални.
Докато съществуващият изкуствен интелект често се бори с нюансите, алгоритъмът на екипа на HUST може да идентифицира 15 „сложни“ израза – емоции, съставени от две или повече чувства, като „щастливо изненадан“ или „ужасно отвратен“. Системата може да се похвали със 70 процента точност в тези сложни категории, число, което екипът описва като „рядко срещано“ в текущата област.
„Човешкото лице е разделено на десетки единици за действие, всяка от които съответства на мускулните движения на специфични области като очите, носа, устата и веждите“, каза Ю. „Например, щастието обикновено се представя от повдигнати бузи, обърнати ъгли на устата и отворена уста, докато гневът включва сбръчкани вежди, стегнати клепачи и напрегната уста.“
Чрез улавяне на детайлните движения, алгоритъмът позволява на роботите да определят съответната емоционална категория, като елиминират влиянието, причинено от присъщите характеристики на индивида.
Предишните технологии се борят да разложат точно първичните и вторичните емоции в сложни изрази и също така са склонни да пропускат фини, мимолетни движения като микроизрази.
Екипът на Ю се справи с предизвикателството, като създаде логика за първо идентифициране на доминиращата емоция, по-добро улавяне на фините движения и оптимизиране на модела чрез обучение върху масивни набори от данни.
„В сценарии от реалния свят емоцията на омразата често се формира от комбинацията от множество основни емоции като гняв и отвращение“, каза тя. „Повечето системи на пазара, при откриване на сигнали като намръщени или свити клепачи, обикновено директно ги класифицират като гняв.
„За разлика от това, нашият алгоритъм може не само да идентифицира силни компоненти на гнева, но и да улови фините движения на лицето, като леко повдигане на долната устна, като по този начин възприема основното отвращение. Това позволява по-дълбоко разбиране на човешките емоционални състояния“, добави Ю.
Според данни от Gaogong Industry Research Institute продажбите на произведени в Китай хуманоидни роботи се очаква да достигнат 18 000 единици през 2025 г., което е скок от над 650 процента в сравнение с предходната година. Предвижда се вътрешните доставки да се покачат до 62 500 единици през 2026 г.
Естествени усмивки
Пробивът се простира отвъд цифровото разпознаване във физическа мимикрия. Традиционните роботи често са ограничени до прости движения на устата „отваряне и затваряне“, което води до неестествен „сегментиран“ вид.
Роботите, разработени от екипа на Ю, са способни да генерират широка гама от основни и сложни изражения на лицето. Лицето на робота има 20 подвижни точки, които могат свободно да се комбинират в различни движения според механичната му структура. Това се постига чрез прецизен контрол върху всички ключови компоненти на лицето, включително очите, клепачите, носа, устата и шията.
„Например повдигнатите вежди и извитата устна, участващи в емоция на „отвратително изненадана“, могат да бъдат възпроизведени с висока точност“, каза Джао Хуиджуан, докторант и член на изследователския екип.
Чрез специализирана механична трансмисионна система роботът може да движи устните си в три измерения – напред, назад, наляво-надясно и кръгово. Това позволява на машината да възпроизвежда 46 фонеми и близо 20 различни форми на устата, включително съгласни звуци като „b“ и „p“, които изискват сложна обструкция на въздушния поток.
Екипът също така е надградил механизмите за свързване на носните ули, бузите и маларните области. Използвайки прецизно механично предаване, тези области могат да произведат фини и специфични изражения като смях и плач, преодолявайки неестественото „сегментирано движение“, често наблюдавано в традиционните лица на роботи.
Гласови и визуални сигнали в реално време се подават в модел за разпознаване на емоции, който не само определя емоционалната категория, която трябва да бъде изразена, но по-важното, изчислява интензивността на движенията на всяка лицева единица за действие под тази емоция.
Ю каза, че една наистина естествена експресивна връзка не е просто задействане на изрази, а по-скоро координация на разбирането на езика, емоционалната преценка и генерирането на изрази.
Роботът трябва не само да разбира какво се казва, но и контекста, ритъма на разговора и намерението на говорещия, за да реши кога да кимне, кога да остане неутрален и кога да направи фини емоционални промени, добави тя.
Практическо приложение
„Ключовите технологии и приложения на възприемането на действията на лицето и разбирането на емоциите за сложно взаимодействие между човек и робот“ на екипа взеха втора награда в категорията за награда за технологични изобретения в състезание в провинция Хубей в началото на януари.
Технологията вече се премества от лабораторията към полето. Пилотен проект, ръководен от Централния комитет на Комунистическата младежка лига на Китай, внедри тази система за цифрово взаимодействие в десетки училища в Китай. Системата действа като психологически консултант, „изслушвайки“ оплакванията на учениците и коригирайки обратната връзка въз основа на изражението на лицето им.
В жилищните общности роботите се тестват като придружители на възрастни хора, живеещи сами. Като осигуряват „естествени, достоверни и удобни“ емоционални взаимодействия, машините предлагат подкрепа в сценарии, при които членове на семейството не могат да присъстват.
Екипът очаква технологията да се разшири в търговски центрове, банки и метавселената в близко бъдеще.
Ю обаче предупреди, че разбирането на емоциите не означава, че самият робот има емоции, добавяйки, че технологията може да осигури функции за грижа и подкрепа, но никога не трябва да замества човешкия социален обмен.
Свържете се с авторите на [email protected]
Нашия източник е Българо-Китайска Търговско-промишлена палaта