Megvizsgálta a magyar médiát a mesterséges intelligencia, orosz befolyást talált
2023. november 21. 18:18
Egy friss, mesterséges intelligenciára támaszkodó amerikai kutatás szerint az orosz agresszor narratívája már hónapokkal az Ukrajna elleni támadás megindulása előtt megjelent a magyar nyilvánosságot uraló közmédiában.
Amerikai kutatók mesterséges intelligencia segítségével elemezték a magyar médiában megjelent tartalmakat, és azt találták, hogy az orosz narratívák már hónapokkal a totális ukrajnai invázió előtt befolyásolták a magyar nyilvánosság álláspontját, írja a Dark Reading egy ősszel bemutatott kutatásra hivatkozva.
Benjamin Novak, a Johns Hopkins Egyetem doktorandusza, a The New York Times korábbi magyarországi tudósítója és Martin Wendiggensen politológus, szintén a Johns Hopkins Egyetem doktorandusza a magyar médiában 2021 ősze és 2022 tavasza között megjelent több ezer cikk tartalmát elemzték egy erre a célre kifejlesztett mélytanulásra képes, mesterséges intelligenciát alkalmazó szoftverrel. Kutatásuk eredményéről a szeptember végén tartott LABScon kiberbiztonsági konferencián számoltak be.
A kutatás egyik fő megállapítása, hogy az Ukrajna elleni támadás megindulása előtti néhány hónapban a fegyverszállítások, az Európai Uniós szankciók és az ukrajnai etnikai kisebbségek volt az a három témakor, amivel a magyar média a leggyakrabban foglalkozott.
Az orosz célkitűzéseket támogató üzenetek már 2021 szeptember közepén megjelentek a magyar lapokban, internetes híroldalakon, hónapokkal azelőtt, hogy az orosz csapatok ténylegesen megszállták volna Ukrajnát. A kutatók elemzése szerint ezzel párhuzamosan a magyar közvélemény hangulata is megváltozott.
„Csak találgatni tudunk, hogy innentől mi motiválhatta a magyar médiát abban, hogy egyre nagyobb teret adott az orosz propagandának” – nyilatkozta Wendiggensen a Dark Readingnek.
2021 őszétől nemcsak a fenti három témakört lefedő cikkek száma nőtt gyorsan, de ettől kezdve mindig ugyanazokat a narratív mintákat követték: a fegyverszállítás rossz, mert elhúzódik miatta a háború, Ukrajna rosszul bánik az etnikai kisebbségekkel, az Európai Unió szankciói pedig rosszat tesznek a magyar gazdaságnak.
Míg Benjamin Novak hagyományos tartalomelemzési módszerekkel vizsgálta a cikkek tartalmát, Martin Wendiggensen egy meglévő gépi tanulási modellt fejlesztett tovább a cikkek elemzésére. Kutatásukban az a rendkívüli, hogy az emberi és a gépi módszer előzetes egyeztetés nélkül ugyanarra az eredményre jutott. Ebből az következhet, hogy a mesterséges intelligencia megbízható eszköz lehet a dezinformációs kampányok azonosítására.
Wendiggensen megtanította a gépet, hogy nemcsak egyes szavak, hanem egyes témakörök gyakoriságát vizsgálja, és elemezze azok befolyását a közhangulatra. Az első lépésben a szoftver önállóan, emberi beavatkozás nélkül elemezte az összes korábban letöltött sajtócikket, és olyan összetevőkre bontotta azokat, mint a címsor, a dátum és a törzsszöveg. Az alkalmazás ezután az összegyűjtött 26 millió szó mindegyikét egy többdimenziós vektorhoz társította. A kifejezések közötti kapcsolatokat a vektorok elhelyezésének szögei és a vektorok közötti távolságok alapján állapították meg, mondta Wendiggensen.
A kapcsolatok pontosságának növelése érdekében a szoftver több száz dimenzión keresztül követte a vektorokat.
Így egy idő után a modell felismerte, hogy például a »szankciók«, a »Brüsszel« és a »rossz« kifejezések szorosan összefüggenek"
– magyarázta Wendiggensen.
Wendiggensen szerint még ma is a fentebb felsorolt három téma – a fegyverszállítások, az Európai Uniós szankciók és az ukrajnai etnikai kisebbségek kérdésköre – a domináns. A kutató szerint annak, hogy az oroszbarát üzenetek ennyire meggyökereztek a magyar médiában, az az oka, hogy Magyarországon nincs igazán médiapluralizmus. A jelenlegi kormány közvetlenül és közvetve is ellenőrzése alatt tartja a magyar sajtó nagy részét: az állami tulajdonú MTVA médiaholding működteti az összes közszolgálati adót, a megyei lapok kormánybarát cégek tulajdonában vannak, és egy központi holding koordinálja a kormánypárti médiavállalatokat.
A kutatók a következő lépésben a magyar tévék híradásait is szeretnék feldolgozni. Már bő 8000 órányi mozgóképük van, szoftveresen átírt szkriptekkel. Ezzel 60 millióval nőtt a szógyűjteményük. „Végső célunk egy olyan adatkészlet létrehozása, amelyet más kutatók tetszés szerint elemezhetnek” – mondta Wendiggensen.
Nyitókép (illusztráció): Mohai Balázs/Bloomberg via Getty Images