Csevegésen túl a tudomány szolgálatában

Újabb fejezetéhez érkezett a mesterséges intelligenciák fejlesztésének története, Mark Zuckerberg a Facebookon bejelentette, hogy egy új, csúcstechnológiát képviselő mesterséges intelligenciát (MI) adnak ki LLaMA néven, ami tudományos kutatók munkáját fogja hatékonyabbá tenni. Húsz nyelvre képezték ki, és nem azért hozták létre, hogy a Facebookban vagy az Instagramban jelenjen meg, ez a nyelvi modell tehát nem a felhasználókat, hanem a kutatókat fogja segíteni.

A Meta igazgatója hozzáteszi, a nagy nyelvi modellek (LLM) már eddig is számos területen tűntek ígéretesnek, így például hatékonyan állítanak elő szövegeket, folytatnak párbeszédeket, foglalnak össze írott anyagokat, és végeznek el olyan komplikált feladatokat, mint matematikai problémák megoldása, bonyolult fehérjemolekulák struktúrájának kiderítése, leírása. ,,A Meta elkötelezett ez iránt a nyílt kutatási modell iránt, és elérhetővé teszi új modelljét a kutatói közösség számára” - írta tömör közleményében. Ebből az is következik, hogy a Facebook (Meta) egyelőre nem száll bele abba a piaci küzdelembe, amit az elmúlt hetekben a Microsoft és a Google indított a mestersége intelligencia területén. Ezek azok az alkalmazások, amelyek a hétköznapi felhasználók számára tették, teszik hamarosan elérhetővé a keresőikbe épített MI-t: a ChatGPT-3-at és a LaMDA-t. (lásd keretes írásunk)

De mi az a nagy nyelvi modell (Large Language Model, LLM), amelynek segítségével működnek a mesterséges intelligenciák, és mire képesek?

A BERT és a GPT-3 a legismertebb nagy nyelvi modellek, miközben egyre újak és újak jelennek meg. Egy olyan technológiát használnak, melyet 2017-ben találtak fel, a transzformátor nyelvi modellt. Vagyis kapnak egy kisebb szövegösszefüggést, ami alapján a modell megpróbálja megjósolni, hogy a következő szó vagy kifejezés mi lesz, ami megjelenhet abban a szövegegységben. A gondolkodó gép tanítása a helyes javaslatok jutalmazásával, a rossz javaslatok büntetésével történik. Mint a nevéből is kitűnik, a nagy nyelvi modellek hatalmas mennyiségű adatból tanulnak, ez a nagy adathalmaz együtt növekszik a mesterséges intelligenciával, lényegében mindent magába foglal, ami az idők során írott formában megjelent az interneten. Hatalmas mennyiségű adatot táplálnak be a mesterséges intelligenciába ,,felügyelet nélküli tanulás” útján, azaz nem adnak instrukciókat, saját magának kell eldöntenie, hogy a megtanult szavakat milyen összefüggésben, hogyan kell értelmeznie: például saját magának kell megtanulnia a fogoly szó két jelentését. Azután, ahogyan egy ember is el tudja képzelni az előzmények alapján, hogyan fog alakulni egy mondat, mik lesznek a következő szavak, a nyelvi modell is határozhat: tudása alapján javasolhat és megfogalmazhat szövegeket. (Igaz, ma még ezek elég sutára is tudhatnak sikerülni.) Az MI tudását ezen túl lehet személyre szabni, speciálissá tenni, ha például molekuláris és fehérjestruktúra adatbázisokból tanult, akkor képes lehet új vegyületek kigondolására, amelyek segítségére lehetnek a tudósoknak úttörő vakcinák, kezelések kidolgozásában.

Vagyis a ChatGPT csevegőrobot csak az egyik alkalmazási lehetősége a nagy nyelvi modellnek, ami rengetegféle célra használható. Például a keresőmotorok sokkal emberibb kifejezéseket, pontosabb találatokat tudhatnak adni. A kereskedők, a szolgáltatók is használhatnak dinamikus csevegőrobotokat (képeket, további tartalomra való kattintási lehetőségeket is felkínálnak) és MI-asszisztenst az ügyfelek jobb tájékoztatására. Az élettan tudósai kiképezhetik a nyelvi modelleket, hogy megértsék a molekulákat, fehérjéket, a DNS-t, az RNS-t. A fejlesztők segítségükkel programokat írhatnak és fizikai feladatokat taníthatnak meg robotoknak. A pénzügyi tanácsadók összefoglaltathatják a negyedéves vállalati pénzügyi beszámolókat és más fontos értekezleteket az MI-vel. A kártyakibocsátó cégek érzékelhetik a csalásokat, anomáliákat, így megvédhetik ügyfeleiket. A jogi csapatok törvények kifejtéséhez, írásához használhatják.

A fejlődés tehát folyamatos, de a nagy nyelvi modellek kiképzése hónapokba és millió dollárokba kerül, ráadásul a fejlesztőknek és a vállalatoknak kihívást jelenthet a megfelelően nagy méretű adatbázis megtalálása.

Keresők és a ChatGPT

Az adatok némi szórást mutatnak, de megegyeznek abban, hogy a legtöbben, globálisan 97-98 százalékban, négymilliárdnál is többen, a Google oldalán ütik be az erre szolgáló mezőbe keresőszavaikat azok, akik valamit meg szeretnének tudni a háló segítségével. A második helyen áll a Microsoft Bingje, amely már csak két-három százalékos részesedést tudhat magáénak, és van még néhány kevésbé használt termék. A Microsoft február 8-án jelentette be új fejlesztését a ChatGPT-4-gyel kiegészített keresőjét, és a Google is jelezte, saját fejlesztésű technológiájuk, a LaMDA lassan készen áll a bevetésre, amely gyakorlatilag ugyanazt ígéri, mint a ChatGPT. Vagyis az új keresők, illetve motorjaik nem egyszerűen átfésülik kulcsszavak alapján a netet, hanem jóval okosabbak lesznek mint eddig: visszakérdeznek, pontosítanak, megértenek és részben tanulni próbálnak, összefoglalják a tudnivalókat, és azt közlik a felhasználókkal.

Csevegésen túl a tudomány szolgálatában

Rózsaszínes tánc az éjjellátó kamerákon