A Wikimedia Foundation az utóbbi hónapokban példátlan kihívással szembesül: az AI-modellek képzésére használt automata botok tömegesen pásztázzák a Wikipedia és más Wikimedia-oldalak tartalmát. A szervezet szerint 2024 januárja óta 50%-kal nőtt a multimédiás tartalmak letöltéséhez felhasznált sávszélesség, ám ennek nem az emberi olvasók megnövekedett érdeklődése az oka.
Az olyan AI-modellek, mint a ChatGPT vagy a Google Gemini, hatalmas mennyiségű adatot igényelnek a tanuláshoz. Ezért ezek az algoritmusok folyamatosan bejárják a webet, köztük a Wikipedia cikkeinek, képeinek és videóinak teljes archívumát is letöltve. Ez a gyakorlat több problémát is felvet, hiszen az AI-botok miatt egyre lassabban töltődnek be az oldalak, főleg ha egy adott témára hirtelen megnövekedik a kereslet. Bár a Wikipedia infrastruktúrája képes kezelni a nagy érdeklődést kiváltó események forgalmát - például egy híres személy halálakor -, a botok által generált, szokatlanul nagy és véletlenszerű forgalom túlterhelheti a rendszert.
A Wikimedia Foundation nemcsak a technikai problémák miatt aggódik, hanem az anyagiak miatt is. A Wikipedia optimalizálva van az emberi olvasók számára: a legnépszerűbb cikkeket gyorsítótárazza a felhasználókhoz legközelebbi adatközpontokban, hogy a kiszolgálás gyors és olcsó legyen. Az AI-botok viszont rengeteg ritkán látogatott oldalt kérnek le, amelyeket az alapadatközpontból kell kiszolgálni - ez pedig növeli az üzemeltetési költségeket. A nonprofit szervezet adományokból tartja fenn magát, így minden extra költség veszélyeztetheti a hosszú távú fenntarthatóságot.
A Wikipedia számára a legnagyobb probléma az, hogy az AI-vállalatok gyakran nem tüntetik fel, honnan származik a tudásuk. A Wikimedia Foundation szerint ez hátráltatja az új olvasók bevonását és az adománygyűjtést, amely a nonprofit szervezet fennmaradásának alapja. A fejlesztők hónapok óta próbálják blokkolni az AI-botokat, de hosszú távú megoldásra is szükség van. A szervezet most fenntarthatóbb módszereket keres arra, hogy az AI-fejlesztők hivatalosan hozzáférjenek a tartalomhoz - akár valamilyen licencelési megállapodás vagy fizetett API-hozzáférés formájában.
A helyzet továbbra is alakul, de egy biztos: a Wikipedia előtt álló kihívás az internetes információszolgáltatás és a mesterséges intelligencia egyre mélyebb összefonódásának egyik legjobb példája.