Mindenkinek feltűnhetett már, hogy új szelek fújnak: a mesterséges intelligencia lett a felkapott téma. Már hosszabb ideje velünk van, manapság mégis sokkal többet foglalkozik vele minden és mindenki, aminek és akinek kicsit is köze van az digitális világhoz. A mostani fellángolás a nyelvi modelleknek köszönhető, amelyek a mesterséges intelligenciát a hétköznapi emberek számára is fogyasztható formába csomagolják. A nyelvi modellek teszik alkalmassá a mesterséges intelligenciás motorokat arra, hogy az emberi beszédet pontosan úgy értelmezzék, mint ahogyan az emberek tennék, de persze mindez a másik irányba is működik, így az általuk generált adatokat is olyan formában tudják tálalni, mintha csak egy másik ember tenné azt. Ahogyan arra például a legismertebb kliens, a ChatGPT neve is utal, az egészet úgy kell elképzelni, mintha csak chatelnénk - azzal a különbséggel, hogy a másik oldalon ezúttal nem barát, rokon vagy ismerős, hanem maga a "gép" áll. A nyelvi modellek fejlettségét jól mutatja, hogy az általuk generált válaszokat sok esetben nem lehet megkülönböztetni az ember alkotta válaszoktól.
A szakértők többsége egyetért abban, hogy nincs is visszaút: a mesterséges intelligencia az életünk része lesz, akár tetszik ez valakinek, akár nem. Érdemes így inkább kihasználni a benne rejlő lehetőségeket. Na de hogyan? A helyzet az, hogy jelenleg még nem tartunk ott, hogy egy generatív mesterséges intelligencia minden feladatra bevethető legyen - egy-egy megoldásra viszont kiváló alternatívát nyújthat. A ChatGPT például a klasszikus keresést turbózza fel, valamint szövegek, programkódok készítésében is jeleskedik, a DALL-E pedig hátborzongatóan jó fotókat állít elő, ha megfelelő instrukciókkal látják el. De akadnak olyan alkalmazások is, amelyek meglévő videókat turbóznak fel, és akár olyanok is, amelyek a semmiből állítanak elő mozgóképes tartalmat. A teljesség igénye nélkül mutatunk pár feladatot, amelynél a mesterséges intelligencia remek szolgálatot tehet.
ChatGPT
A mesterséges intelligenciát igazán a ChatGPT tette fogyaszthatóvá, de nemcsak ezért számít a legnépszerűbb modellnek jelenleg, hanem azért is, mert tavaly november óta gyakorlatilag bárki kipróbálhatja - sőt, most már OpenAI fiók sem feltétlenül szükséges hozzá, hiszen a Microsoft integrálta az Edge-be. A ChatGPT mindenben jó, ami szöveg: keres neked az interneten, összefoglalja egy hosszabb szöveg tartalmát, segít fogalmazást készíteni, vagy ha szeretnéd, akár a semmiből kreál számodra egy hosszabb-rövidebb történetet. Nagyon jó továbbá néhány specifikus területen; programkódokat például szintén pillanatok alatt flottul meg tud írni. Teljesen ingyenes, igaz, az OpenAI által mindenki számára rendelkezésre bocsátott felület nem az aktuális nyelvi modellt (ami a GPT-4 lenne), hanem az eggyel korábbi változatot használja (GPT-3). De így is félelmetesen jó.
LyricStudio
Kezdő dalszerzők munkáját is könnyebbé teheti a mesterséges intelligencia. Sokféle program létezik erre a célra; a LyricStudio például a versek befejezésében is jó, de segít megtalálni a legjobb rímeket - a mesterséges intelligenciának hála ráadásul olyanokat, amelyek jelentése nem teljesen idegen a szöveg tartalmától. Többféle javaslat közül választhatod ki azt, amelyik a legjobban tetszik. A szolgáltatás ingyen kipróbálható, ezt követően viszont havidíjas csomagban érhető el - a kedvező ár mellett plusz pont, hogy a szerzői jogok mindvégig a felhasználót illetik meg.
Supertone
Nemcsak a szövegekkel, hanem a hanggal is lehet bűvészkedni, nem is kicsit. A Supertone tökéletes emberi hangokat generál, és nemcsak beszéltetni, hanem énekeltetni is tudja azokat - többféle nyelven és többféle stílusban, akár híres emberek hangját utánozva is.
This person does not exist
Ez a véletlenszerű arcgenerátor régi motoros, már akkor létezett, amikor a mesterséges intelligenciáról szinte senki nem beszélt. Három paraméter (nem, életkor és rassz) alapján egyetlen gombnyomással készíthető portrékép véletlenszerű háttér előtt. A modell annyira kiforrott, hogy lehetetlen megkülönböztetni a mesterséges intelligencia által generált arcot egy olyantól, amely élő embert ábrázol. A képeket alacsony felbontásban akár ingyen is letöltheted, ha szeretnéd.
Cleanvoice
Készítettél egy hangfelvételt, de sok benne a zavaró háttérzaj? Semmi gond, a Cleanvoice pillanatok alatt, és ami még fontosabb, a felvétel eredeti minőségének megtartása mellett távolítja el azokat.
FontJoy
Aki készített már weboldalt, az tudja, hogy a betűtípus kiválasztása nem kis feladat. Már egy olyan betűkészletet is nehéz találni, amely mindenben megfelel az igényeknek, de ha valaki követné az ajánlást, amely szerint a címekhez és egyéb kiemelésekhez egy második szett dukál, akkor kezdődnek csak igazán a problémák - merthogy összeillő típusokat kell(ene) találni. A Fontjoy leveszi a terhet a fejlesztők válláról azzal, hogy mesterséges intelligencia segítségével találja meg az összeillő párokat.
Synthesia
Ma már ott tartunk, hogy simán legyártható egy élőszereplős prezentációs videó akkor is, ha nincs hozzá alany. A Synthesia egy olyan szolgáltatás, amely a begépelt szöveg alapján készít videókat. A változatosságot garantálja, hogy 130-nál is több avatár közül választhatsz narrátort, akik 120-nál is több nyelven és hangon tudnak megszólalni - a magyar nyelv is támogatott! A szolgáltatás ingyen kipróbálható, de ebben az esetben a felmondott szöveg legfeljebb 180 karakteres lehet, és avatárt sem tudsz választani. Ha ennél többet szeretnél, akkor havi előfizetésben gondolkodhatsz, amely 30 dollártól indul, ezért cserébe pedig 10 percnyi videó készíthető.
Runway
Videós tartalmakban utazik a Runway is, amely azonban a mesterséges intelligenciát nemcsak arra használja fel, hogy szinte a semmiből generáljon tartalmat, hanem arra is, hogy meglévő videókat, képeket turbózzon fel és/vagy módosítson. Ha nem tetszik valami vagy valaki a képen, akkor a mesterséges intelligencia pillanatok alatt leszedi neked, de az sem probléma számára, ha macska helyett kutyát szeretnél. Vagy van pár képed, amit egy mozdulatsorról készítettél? A Runway elkészíti neked a teljes mozdulatsort egy videóban, ha szeretnéd. Tekintettel a szolgáltatások sokféleségére, azokat kredit alapon tudod használni. A próba természetesen ingyenes, de ilyenkor korlátozásokkal és vízjellel is számolnod kell. Az előfizetés havi 12 dollárról indul.
Topaz Video AI
Rövid távon nem a legolcsóbb alternatíva a 200 dolláros Topaz Video AI, de vedd figyelembe, hogy ez egy letölthető, telepíthető alkalmazás, amelynek nincs havidíja. A videószerkesztésben veheted nagy hasznát, hiszen elsősorban felskálázásra és zajszűrésre találták ki - vagyis pont azt a két fontos dolgot tudja, amivel a rosszul beállított vagy a régebbi felvételekbe tudsz egy kis életet lehelni. A mesterséges intelligencia szerepe a Topaz Video AI esetében a minőség növelése azáltal, hogy a szoftver a normál megoldásokhoz képest jóval alaposabb elemzést tud készíteni. A mesterséges intelligencia azzal, hogy nemcsak az adott képkockát vizsgálja meg, hanem több, korábbi és későbbi képkoca adatait is felhasználja, úgy tud jobb eredményt adni, hogy közben a videó természetes is marad.
DALL-E 2
A mesterséges intelligencia természetesen nemcsak videókat, hanem fotókat is elő tud állítani. Ehhez ugyanúgy csak egy leírásra van szükség - az eredmény pedig - ha a leírás profi - lélegzetelállító. És nem arról van szó, hogy az MI rajzol valami szépet, hanem arról, hogy a mesterséges intelligencia (az esetek többségében) azt rajzolja le, amit szeretnél, olyan hangulatban és olyan stílusban, ahogyan szeretnéd. Kérhetsz olyat, hogy gyerekrajz szülessen, de akár azt is, hogy az eredmény festményszerű vagy valósághű legyen - és a helyzet az, hogy a végeredményt sokszor nagyon nehéz megkülönböztetni a valódi fotóktól. Hiszen a mesterséges intelligencia adott esetben némi képzajt is használ, és kromatikus aberrációt is elhelyez az általa kreált fotókra. Ezen a területen jelenleg a DALL-E 2 a legnépszerűbb, amely éppen úgy az OpenAI-hoz tartozik, mint a mesterséges intelligenciás őrületet elindító ChatGPT. Népszerűsége nem véletlen: az egyik, ha nem a legjobb minőségű fotókat generálja. A szolgáltatás meglévő fotók szerkesztésére is tökéletes - ebben az esetben is csak le kell írni, hogy mit szeretnénk, a mesterséges intelligencia pedig szépen teszi a dolgát. A DALL-E ingyenesen kipróbálható, feltéve ha tudsz fiókot regisztrálni (ez a lehetőség cikkünk készítésekor például pont nem volt elérhető), innentől kezdve pedig havi 15 kreditet kapsz. Ez nem sok, mindössze pár kép előállításához elég, de természetesen bármikor lehet további kreditet vásárolni a játszadozáshoz.
HitPaw
Egy fotó sikerülhet rosszul, ha nem a jó pillanatot kapod el, de akkor is, ha a tökéletes pillanatban kattintottál, csak éppen a technika ördöge közbeszól. Utóbbi esetet jelzik a bemozdult fotók, a túl zajos felvételek és az alacsony felbontás - csak néhány azok közül a hibák közül, amelyeket a mesterséges intelligencia ma már sokszor hatékonyabban tud kijavítani, mint bármilyen manuális módszer. A HitPaw csak az egyike az automatikus képjavító szoftvereknek, a neten tengernyi alternatívát találhatsz. Hátrányuk, hogy sajnos mind fizetősek.
Autodraw
Az Autodraw egy ügyes kis rajzprogram, amely az odafirkantott vonalak alapján nagyon jó hatékonysággal kitalálja, hogy mit szerettél volna rajzolni, és többféle javaslatot is ad a munka folytatásához. Ha kiválasztottad a legjobb javaslatot, ki is színezheted az ábrát, illetve szöveget is elhelyezhetsz rajta, alatta, mellette.
Magic Eraser
Ha nem utasítások alapján szeretnél fotót létrehozni a semmiből, hanem egy meglévő képről tüntetnél el pár elemet, akkor tegyél egy próbát a Magic Eraserrel is. Ez a szolgáltatás teljesen ingyenes, és elég jó minőségben dolgozik - de persze a képtől és az eltávolítandó terület nagyságától is függ, hogy a mesterséges intelligencia mennyire tud meggyőző lenni. A szolgáltatás kezelőfelülete nagyon egyszerű, a kijelölést pedig nagyítás funkció is segíti. Mint a mesterséges intelligenciához kapcsolódó szolgáltatásoknál szinte mindig, a munka nem a felhasználó gépén, hanem a felhőben zajlik.
Mindenhol ott van
A cikkben szereplő alkalmazások sokszínűségéből kiderül, hogy a mesterséges intelligencia ma már sok feladatra bevethető - ha valaki veszi a fáradságot, akkor szinte bármire megtaníthatja az MI-t. Az eredmény a legtöbb esetben jó, sokszor tökéletes. De sok múlik azon, hogy mekkora adatbázis állt rendelkezésre a tanuláshoz, és azon is, hogy mi a pontosan elvégzendő feladat. Könnyen előfordulhat például, hogy ugyanaz az algoritmus egy fotóról tökéletesen le tudja venni a betolakodó biciklist, míg egy másikkal nem boldogul. A cikkben szereplő alkalmazások és szolgáltatások csak a jéghegy csúcsát jelentik; amellett, hogy minden feladatra akár tucatnyi alternatíva lelhető fel, rengeteg más feladatba is bevonható a mesterséges intelligencia. Érdemes egyébként több alkalmazást is kipróbálni ugyanarra a feladatra, mert bőven lehetnek különbségek a teljesítményeikben.
A mesterséges intelligencia már most olyan minőségben képes elvégezni egy sor feladatot, hogy az problémát jelenthet az élet számos területén. Gondolj csak bele: ha nem lehet egyértelműen megmondani egy képről, hogy ember vagy gép alkotta, ha egy szöveg szerzőjéről nem lehet biztosan állítani, hogy hús-vér ember, ha egy felvételről nem lehet megállapítani, hogy belenyúltak-e, akkor nem nehéz belátni, hogy ez élet sok területén nehézséget jelenthet.
Emellett gond az is, hogy a társadalom egyelőre nincs felkészülve arra, hogy a mesterséges intelligenciát kezelje. Eddig ha valaki meg akart találni egy információt az interneten, azt kellett tudnia, hogyan kell keresni. Ez már a múlt, elég csak kérdezni, és máris jön a válasz - azt viszont senki sem garantálja, hogy a válasz pontos. Mostantól tehát azt kell megtanulni, hogyan ellenőrizzük a mesterséges intelligencia által adott információkat.