Hogyan segíthet a mesterséges intelligencia a látássérült embereknek

(Három érdekes, új videó a SVOE SMART csatornáján)

A mesterséges intelligencia a mindennapi élet egyre több területén válik megkerülhetetlen tényezővé. Közreműködésével szövegeket írhatunk, fordíthatunk, zenét komponálhatunk csupán néhány röpke perc leforgása alatt. Ami számomra talán még ennél is döbbenetesebb: a mesterséges intelligencia bizonyos programokon, alkalmazásokon keresztül a látássérült embereket is képes támogatni a vizuális információk összegyűjtésében, értelmezésében.

Csák Attila kollégánk ez utóbbi témakört járta körül nagy alapossággal

Három, egymással bizonyos értelemben összefüggő videót készített a mesterséges intelligencia látást segítő, pótló funkcióiról. Ezeket a SVOE SMART csatornáján tette mindenki számára elérhetővé. A videók lekötik a figyelmet, de rendkívül sok információt is tartalmaznak. Attila azonban, figyelmes szerkesztő lévén, azt is szem előtt tartotta, hogy ne terhelje túl a hallgatók/nézők mentális kapacitását. Időnként adott lehetőséget egy kis lazításra, és – stílusosan – ehhez is a mesterséges intelligencia (MI) segítségét vette igénybe.

Az adások közben felcsendülnek azok a dalok, amelyeket Attila az MI használatával komponált a legkülönfélébb stílusokban. A szövegek témája a SVOE SMART csatornája és az, hogy a technika, az informatika miként lehet a vak és látássérült emberek hasznos segítőtársa a mindennapokban. Dalszövegből kétféle született: egyikben csak néhány kulcsszót adott meg, nagyobb teret engedve a gépnek a kreativitásra. Ezzel szemben a másikban több információt bocsátott az MI rendelkezésére.

Az első adás ezt a címet viseli: „Helyettünk lát a mesterséges intelligencia”

Ebben a Seeing AI nevű okostelefonos alkalmazás működését mutatja be. Az applikáció funkcióit ún. „csatornákra” osztották, amelyek az alábbiak:

  • rövid szöveg;
  • dokumentum (akár egy A4-es, nyomtatott oldal, amihez utána további oldalakat adhatunk);
  • termék (vonalkód alapján);
  • jelenet (fényképek áttekintése, jelenleg kísérleti fázisban tart);
  • személy (arcfelismerés, nevek hozzárendelésével is);
  • pénznem (kísérleti fázisban levő pénzfelismerő);
  • világ (még ez is kísérleti jellegű, de lehetővé teszi legfontosabb személyes tárgyaink felismertetését majd környezetünkben való megtalálását, illetve beltéri útvonalak rögzítését, hangokon keresztüli navigációt);
  • szín;
  • világos (a környezetünkben érzékelhető fény erősségének mérése).

A teljes felvétel az alábbi linkre kattintva nézhető meg:
https://www.youtube.com/watch?v=bPYh5Gl15a8&t=36s

A második videó címe: „A mesterséges intelligencia napjainkban”

Ez a terjedelmes, ám rendkívül érdekes műsor két részre tagolható. Az első felében Attila és Keleti Arthur kiberbiztonsági szakértő, jövőkutató beszélgetését hallgathatjuk meg. Arra, hogy mennyire „képlékeny”, formálódó terület is a mesterséges intelligencia témaköre, jól rámutat a fogalom definiálásának nehézsége. – Konkrétan mit nevezünk mesterséges intelligenciának? – tette fel a kérdést Attila. Arthur szerint bármilyen definíciót adunk is neki, az nem lesz igazán helyes. Talán úgy lehetne a legjobban megközelíteni, hogy amit mi intelligenciának gondolunk, természetesnek, emberinek, ez annak egy gépi verziója. Ebből is látszik, hogy rendkívül összetett, sokféle feladat megoldására képes, érti az összefüggéseket és érvelni is tud.

Ma még az is kérdéses, hogy milyen társadalmi változásokat generálhat a jövőben

Nem véletlen az sem, hogy bizonyos értelemben félünk tőle. Az ember természetének része, hogy hatalomra törekszik és ehhez megpróbál erőforrásokat koncentrálni. Ha van hatalmunk, úgy érezzük: jó helyen vagyunk és tudunk fejlődni. A mesterséges intelligencia is éppen ilyen, hiszen ezt tanulta tőlünk. Kedvezőtlen hír, hogy napjainkban még erre sincs birtokunkban a jó megoldás. Az interjúból több, izgalmas kérdés mellett megtudhatjuk, mi lesz a jövőben a művészet sorsa.

Mennyiben marad az ember, vagy kerül a gép „kezébe” az alkotási folyamat?

Arthur elmondja, milyen jogi természetű kérdéseket vet fel a mesterséges intelligencia megléte a szerzői jogok, vagy épp az önműködő autók által okozott balesetek tekintetében. Az MI az oktatás struktúrájában is változásokat eredményez: a diákoknak meg kell tanulniuk jól kommunikálni vele.

Ezt követően Attila megmutatta, milyen kapcsolat van a mesterséges intelligencia és a JAWS for Windows képernyőolvasó program között

Ez az ún. „Intelligens képfelismerés” funkció. Ennek keretében különböző chatbotokat használ a képernyőolvasó, tőlük kér le információkat. Így elemzi az általunk megismerni kívánt képeket, legyenek azok akár a dokumentumaink között, a vágólapon, vagy számítógépünk képernyőjén.

Az adás vége tartogat még egy bravúros fordulatot: Attila ugyanis a műsor lezárását is a mesterséges intelligenciára bízta. Az így elkészült szöveget pedig a JAWS képernyőolvasóval tette számunkra is hallhatóvá. Egy rövid összegzést kaptunk így, melyből kiderült: a műsor vendége Keleti Arthur volt, aki az MI jelen állapotáról és jövőbeni kilátásairól beszélt. A záró rész visszautalt a képernyőolvasó szoftverekben elérhető, intelligens képfelismerésre és a mesterséges intelligencia által megírt zenékre is.

Megmosolyogtat, ugyanakkor elgondolkodtat az a mód, ahogyan Attila elköszönt a nézőktől: „Jövő szerdán jövök… – ha még egyáltalán szükség lesz rám”! A sorozat második epizódja az alábbi linkre kattintva hallgatható/nézhető meg:

https://www.youtube.com/watch?v=k_qpBvwT0VY

A harmadik rész a beszédes „Mesterséges Intelligencia, légy a szemem!” címet viseli

Itt Attilának műsorvezetőtársa is volt, a látássérült emberek körében népszerű „Gépház” c. műsorból jól ismert Rauch Róberttel közösen tárták fel előttünk a „Be My Eyes” (magyarul: Légy a Szemem!) nevű okostelefonos alkalmazás működését. Először kicsit jobban megismerhettük Robit, a technikához, informatikához fűződő viszonyát. Utána mesélt nekünk arról a viszonylag új, 2023-ban ismertté vált jelenségről, amit generatív mesterséges intelligenciának nevezünk. Beszélt arról is, miként lehet ez hasznos segítségére a vak és látássérült embereknek, és milyen társadalmi változásokat idézhet elő. Megtudhattuk, milyen aggályokat és jogi kérdéseket szül ez a különböző tartalomgyártók (főleg a zenével foglalkozók) körében.

A felvezetés után a két műsorvezető beavat minket a Be My Eyes rejtelmeibe

Végig visznek a letöltés folyamatán, elmagyarázzák a kezdéskor felugró adatvédelmi tájékoztató lényegét. Szemléltetik a regisztráció folyamatát, a kezdő beállításokat. Hívást indítanak, ahol a vonal másik végén jelentkező önkéntestől Robi megkérdezi, milyen gombok találhatók a nála levő távirányítón. Végül kipróbálják az alkalmazásba épített, “BE My AI (Légy a mesterséges intelligenciám) nevű új funkciót. Ebben a telefon kamerájával kell képet készítenünk, amiről utána beszéd általi leírást kapunk. Szükség esetén további információkat is kérhetünk, ekkor üzenetet kell begépelni, amire a MI szintén írásban válaszol. Előfordulhat, hogy azt javasolja: készítsünk újabb képet, mert az előzőn nem tudta tisztán kivenni, amire rákérdeztünk. A kép rögzítésére szolgáló gombot ugyanakkor minden esetben nekünk kell megnyomni.

Bámulatos az a mód, ahogyan összefüggéseket keres az általunk rögzített fotók között

Fontos tudni, hogy amíg egy adott témakörben “beszélgetünk” a MI-vel, nem érdemes törölni a korábbi előzményeket (fotókat és kérdéseket), éppen az összefüggések keresése miatt. Ha viszont már alaposan kitárgyaltunk egy adott témát, a következő felvetése előtt javasolt megnyomni a “Beszélgetés vége (And chat)” gombot.

A következőkben Robi és Attila a “LetSeeApp” elnevezésű alkalmazás használatára is megtanít minket

Ebben van fénymérő (ami lényegében ugyanazt tudja, mint a Seeing AI “Világos” menüpontja). Van kártyafelismerő is benne, ennek használatához először rögzítenünk kell memóriájába a nálunk levő kártyákat (bankkártya, személyi igazolvány, vásárlási kedvezményekre jogosító kártya, stb). Cikkem végéhez közeledve időszerűnek tartom, hogy egy kis kulisszatitkot is megosszak a Kedves Olvasóval! A második rész frappáns lezárásán felbuzdulva Attila úgy döntött: a SMART csatorna augusztusi adásait a mesterséges intelligencia vezeti majd, ismert képernyőolvasók hangján. Ezekben többek között kiemelkedő szerepet kapnak az eddig a műsorokat aláfestő zenékként színesítő dallamok is. További információ (teljes adás) az alábbi linken:

https://www.youtube.com/watch?v=QbzBJHXtSbM&t=190s

(A cikket írta: Taskovics Adél)