Mesterséges intelligencia a kutya ugatásának lefordítására

June 16, 2024 Geronimo

A kutyák ugatását lefordítani képes mesterséges intelligencia-algoritmust mutatott be a Michigani Egyetem tudóscsoportja. Ez az algoritmus nem teszi lehetővé, hogy emberi beszélgetést folytassunk kutyáinkkal. Ehelyett képes lefordítani az ugatást és értelmezni az üzenetet. Megmondja nekünk például, hogy boldogok, szomorúak vagy félnek-e. Kevés olyan szó van, amelyet ki lehet nyerni. Inkább az érzelmekről van szó. De ettől még nem lesz kevésbé hasznos és érdekes.

Fontos, hogy a tanulmány szakértői véleményezésre vár. Ez azt jelenti, hogy amíg a kutatáson kívül álló tudósok nem ellenőrzik, hogy minden rendben van-e, addig az eredményeket érdemes fenntartásokkal kezelni. Egyelőre tegyük fel, hogy a jövőben talán képesek leszünk beszélni a kutyáinkkal. Legalábbis bizonyos mértékig.

Az állatokkal való kommunikáció a mesterséges intelligencián keresztül úgy tűnhet, mintha a sci-fi lenne. Valójában már évek óta láthattuk ezt olyan filmekben és sorozatokban, mint a SeaQuest, amelynek egyik főszereplője Darwin volt, egy delfin, aki képes beszélgetni emberi társaival. Beszélni persze nem tudott. Egy futurisztikus mesterséges intelligencia algoritmusának köszönhetően azonban füttyeit és kattogásait szavakká tudta lefordítani. Így a tudósok a delfinek ismert intelligenciáját arra használták fel, hogy Darwint bölcs tanácsadóként használják.

Sok tudós felvetette annak lehetőségét, hogy ezt a mesterséges intelligenciával valósággá tegyék. A delfinek tanácsadója helyett nagy érték lenne, ha háziállatokkal, például macskákkal és kutyákkal tudnánk beszélgetni. Ezért a Michigani Egyetem tudósai az ugatás lefordításával akarták kezdeni.

Az AI-algoritmus kifejlesztéséhez a tudósok 74 különböző fajtájú kutyát vontak be, bár a kutyák mintegy fele chihuahua volt.

Felvételeket készítettek az állatok által kibocsátott hangokról olyan helyzetekben, amelyeket a kutatók bizonyos érzelmek kiváltására kényszerítettek. A kutatók például játszottak velük, vagy úgy tettek, mintha bántanák emberi társaikat.

14 különböző típusú ugatást, morgást, vonyítást és nyüszítést tudtak azonosítani, pozitív, negatív vagy semleges konnotációval. Ezeket érzelmekre fordítanák le, nem pedig tényleges szavakra, de talán a jövőben, a realisztikusabbá tétel érdekében, kifejezéseket lehetne használni. Például: “Szomorú vagyok”, mint a szomorúságot jelző üvöltés fordítása.

A legérdekesebb dolog ebben a mesterséges intelligencia algoritmusban az, hogy emberi beszédfelvételek segítségével lett előtanítva. Ez azt jelenti, hogy emberi beszélgetések adatait és azok jelentését táplálták be, hogy a mesterséges intelligencia össze tudja egyeztetni az üzeneteket és a hanglejtéseket. Ezután a vizsgálat első szakaszában rögzített kutyahangokkal képezték ki. Végül pedig véletlenszerű kutyafelvételeket vezettek be, hogy teszteljék, a gép képes-e lefordítani az ugatásokat. Érdekes módon, amikor az algoritmust emberi beszéddel előtanították, 62,2%-os sikerességi arányt értek el, ami néhány speciális hangadás-típus esetében 90% fölé emelkedett. Ezzel szemben emberi előképzés nélkül a siker valószínűsége sokkal kisebb volt.

Mesterséges intelligencia az ugatás fordítására és a fajták azonosítására

A kutatás másik érdekessége, hogy az ugatás lefordítása mellett az algoritmus 75%-os sikeraránnyal képes volt a kutyafajták azonosítására is. Úgy tűnik, mindegyiknek megvan a maga akcentusa.

Amíg a tanulmányt nem bírálják el, nem lehetünk biztosak ezekben az eredményekben. De egyelőre elég érdekesek ahhoz, hogy beszéljünk róluk. Ha beigazolódik, ez a mesterséges intelligencia nagy forradalom lesz.

FORRÁS