A beszélt és írott nyelv informatikai feldolgozásában történt előrelépés a Pécsi Tudományegyetemen

A beszélt és írott magyar szöveg feldolgozását lehetővé tevő - informatikában használatos - nyelvi modellt hoztak létre a Pécsi Tudományegyetemen (PTE) a Microsoft technológiájának segítségével - közölte a Microsoft Magyarország csütörtökön az MTI-vel.

A közleményben a fejlesztés indokai között azt írták: mindenki szívesebben használja az anyanyelvét chat és más automatizált alkalmazásokban, mivel azonban a magyar nyelvet viszonylag kevesen beszélik, a cégek számára gyakran nem éri meg kifejleszteni a feldolgozásához szükséges szoftvereket.     A PTE Alkalmazott Adattudományi és Mesterséges Intelligencia csapata felismerte ezt a problémát, és a nagy mennyiségű magyar nyelvű adat kezelését megkönnyítendő természetes nyelvfeldolgozási módszerek kutatásába fogott.     A megoldást egy magyar nyelvű, úgynevezett "BERT" modell létrehozása jelentette. A BERT a Google órásvállalat egyik nyílt forráskódú technológiája, amely a természetes nyelvfeldolgozását hivatott segíteni.     Az új modell - amelyet a PTE munkatársai kevesebb mint 200 munkaóra és 1000 euró befektetéssel hoztak létre - segíti a számítógépet a többféleképpen értelmezhető szövegrészek megértésében oly módon, hogy a szövegkörnyezetből kontextust épít.

fotó:origo.hu

Műsorajánló

Tekintse meg a HÍD TV legfrissebb videóit!

Gorján Method - egy életmód, mely generációkat inspirál

Képújság

Legfrissebb hirdetéseink!