"A Wikipédia a legjobb dolog a világon. A világon bárki bármit írhat rajta bármilyen témáról, így biztos lehetsz benne, hogy a lehető legjobb információt kapod." - szól a The Office című amerikai sorozat mémmé vált aranyköpése, amely egy zseniális poénként foglalja össze, hogy mi is a gond a szabadon szerkeszthető online lexikon szavahihetőségével.
A nyílt platform szócikkei persze ettől függetlenül még remek kiindulási alapok lehetnek, ám aki biztosra akar menni, az a beágyazott hivatkozásokat is ellenőrzi, amelyek között sajnos elég gyakran találni elavult, elérhetetlen, vagy egyenesen hamis forrásokat. Ezen segíthet a Facebook és az Instagram mögött álló Meta legújabb technológiája.
Mark Zuckerberg cége ugyanis előállt egy algoritmussal, amely képes tömegesen megvizsgálni a szócikkek hivatkozásainak hitelességét. Emberi moderátorokkal ez sajnos szinte lehetetlen feladat, hiszen havonta kb. 17 ezer bejegyzéssel gazdagodik a Wikipedia 6,5 millió cikk felett járó adatbázisa.
A Meta mesterséges intelligenciára épülő technológiája viszont nemcsak a hivatkozásokból eredeztetett idézetek pontosságát ellenőrzi, hanem alternatív forrást is ajánl, ha jobbat talál az eredetinél. Ezt a természetes nyelvi megértés (Natural Language Understanding, NLU) modell teszi lehetővé, amely a szavak és kifejezések különböző kapcsolatait igyekszik megérteni a mondatokon belül. Ehhez a Meta több mint 134 millió weboldalból álló Sphere adatbázisa szolgál segítségül, az ellenőrzést végző algoritmus pedig arra törekszik, hogy az adott mondat minden állítását egyetlen forrásra tudja visszavezetni.
A technológia képességeit a feketeláb-indiánok katonai szövetségéről (Blackfoot Confederacy) szóló szócikkel demonstrálták. Ennek egyik idézete azt állítja, hogy a népcsoport egyik képviselője, Joe Hipp volt az első amerikai őslakos, aki ringbe lépett a WBA bokszbajnokság nehézsúlyú övéért. Csakhogy az idézethez csatolt hivatkozás nem említi sem Hippet, sem az ökölvívást. Ekkor jött a Meta algoritmusa, és előásott egy 2015-ös cikket, amely hiánytalanul alátámasztja az állítást. Az pedig külön figyelemre méltó, hogy az új forráscikkben még csak nem is szerepelt a "boksz" kifejezés, a WBA említése viszont elég volt a nyelvi modellnek, hogy felismerje a témát.
Egyelőre azonban még nem kell attól tartani, hogy Mark Zuckerberg rászabadul a Wikipediára, a Meta hivatalos közleménye ugyanis kiemeli, hogy a vállalat nem lépett partnerségre az online lexikont üzemeltető alapítvánnyal, így - egyelőre - nem is várható az új fegyver éles bevetése:
"A Wikimedia és a Meta nem partnerek ebben a projektben. A projekt még a kutatási szakaszban van, és nem használják a Wikipédia bármely tartalmának automatikus frissítésére."
A technológia viszont végső soron a Facebook és az Instagram tartalomellenőrzését is hatékonyabbá teheti, ami kapóra jönne a platformjain terjedő álhírek miatt gyakran magyarázkodni kényszerülő vállalatnak.