ChatGPT-roboten har ett ansikte och kan prata

Forskare har skapat en robotbyst som kombinerar GPT-3.5-teknik, som används i ChatGPT, med ett system för ansiktsuttryck som styrs av ett humanoidt robothuvud. Teamet, bestående av medlemmar från Heriot-Watt University och Alana AI, designade den för att kommunicera med användare och ge information i specifika sammanhang.

ChatGPT-roboten har ett ansikte och kan prata

För de som har bråttom:

  • Robotbyst med AI: Forskare har skapat en robotbyst som kombinerar GPT-3.5-tekniken, som används i ChatGPT, med ett system för ansiktsuttryck som styrs av ett humanoidt robothuvud;
  • Systemets funktionalitet: Systemet integrerar GPT-3.5-modellen för att generera svar och ansiktsuttryck, som kommuniceras av Furhat-roboten både verbalt och fysiskt.
  • FurChat i praktiken: FurChat har testats på Storbritanniens National Robotarium där den interagerar med besökare och tillhandahåller information om anläggningen, forskningsinsatser och kommande evenemang;
  • Första experimentets resultat: Det första experimentet visade på effektivitet i kommunikation med användare, vilket antyder att denna teknik skulle kunna tillämpas på offentliga platser och andra miljöer i framtiden.

Konversationsaspekten hanteras av FurChat, medan ansiktsuttrycken styrs av Furhat, det humanoida robothuvudet. Information om projektet finns publicerad i en förpublicerad artikel på arXiv och rapporterad på Tech Xplores webbplats.

Robot med ChatGPT och ansikte

Huvudsyftet med teamets arbete var att tillämpa specifika kontextuella samtal med hjälp av stora språkmodeller (LLM). Forskaren Oliver Lemon och hans kollegor ville även testa dessa modellers förmåga att generera ansiktsuttryck som överensstämmer med vad roboten eller avataren kommunicerar eller svarar på.

“Vi ville utforska olika aspekter av inbäddad AI för naturlig interaktion med människor. Vi var särskilt intresserade av att kombinera de allmänna ‘öppna domänkonversationer’ som man kan ha med LLMs som ChatGPT, med mer specifika och användbara informationskällor, som till exempel information om en byggnad eller organisation,” förklarade Oliver Lemon för Tech Xplore.

Svaren och ansiktsuttrycken som genereras av teamets inbäddade samtalsagent skapas av GPT-3.5-modellen och kommuniceras både verbalt och fysiskt av Furhat-roboten.

Enligt Lemon är detta “det första systemet vi känner till som kombinerar LLM för både allmänna samtal och specifika informationskällor med automatiska, uttrycksfulla robotanimationer.”

Testet

För att utvärdera FurChats prestanda genomförde forskarna ett test med mänskliga användare, där de ombads dela med sig av sin feedback efter interaktionen.

Forskarna installerade roboten vid Storbritanniens National Robotarium i Skottland, där den interagerade med besökare och erbjöd information om anläggningen, dess forskningsinsatser, kommande evenemang med mera.

I teamets första verkliga experiment visade det sig att FurChat-systemet var effektivt för att kommunicera med användare på ett smidigt och informativt sätt. Studien kan i framtiden uppmuntra till införandet av liknande LLM-baserade inbäddade AI-agenter på offentliga platser eller vid evenemang som museer och festivaler.