Az idei Google I/O 2025 konferencia újabb mérföldkő az MI és XR technológiák világában: a Google messzemenően megerősíti pozícióját a mesterséges intelligencia és kiterjesztett valóság terén. Az eseményen bemutatott innovációk, mint a Gemini 2.5 AI-modellek, az új AI mód a Google Keresőben, az Android XR platform, a Google Beam 3D videóhívás, vagy az együttműködés a Volvo autógyártóval, egyértelműen arról szólnak, hogy a jövő digitális élménye egyre inkább multimodális, személyre szabott és valós idejű lesz.
Gemini 2.5: Mélyebb gondolkodás és többmodalitás
A Google új zászlóshajó AI-modellje, a Gemini 2.5 Pro, bevezeti a Deep Think módot, amely párhuzamos érvelési folyamatokkal képes bonyolult problémák, például összetett matematikai vagy kódolási feladatok megoldására. A LMArena kódolási versenyek világelső megoldása nemcsak gyorsabb, de profibb is lett a korábbi kiadásokhoz képest. Ráadásul natív audio-kimenettel, illetve egyszerre képes szövegek, képek és hangok feldolgozására, ami a multimodális mesterséges intelligencia új dimenzióját nyitja meg. Ezzel párhuzamosan a Gemini 2.5 Flash modell hatékonyabb és gyorsabb válaszadást kínál kisebb ráfordítással, így akár mobil vagy beágyazott rendszerekbe is könnyen integrálható.
Új korszak a Google Keresőben: AI mód és mély keresés
A keresési élmény is jelentős átalakuláson megy keresztül az "AI mód" bevezetésével, ahol egy beszélgetéshez hasonló felületen dolgozza fel a Gemini 2.5 a lekérdezéseket. A query fan-out technika segítségével egyetlen kérdés többszörös al-keresésekre bomlik, és ezek eredményeiből aggregált, szakértői szintű riportot kapunk. Továbbá a Deep Search akár száz, párhuzamos keresést is el tud végezni, és ezeket vizualizált diagramokkal, grafikonokkal rendszerezi – remekül támogatva például a kutatói vagy üzleti döntéseket.
Az AI mód ráadásul a vásárlást is forradalmasítja: a ruhapróba-szimuláció (amely fotóból 3D-s modellt készít), árfigyelés és intelligens vásárlási ajánlatok személyre szabják az online boltok élményét. Nyáron pedig a Search Live is elindul, ami valós idejű kameraképpel és beszélgetéses felülettel segíti, hogy közvetlenül annak alapján kérdezhessünk, amit látunk a környezetünkben.
Android XR és a Project Moohan: A kiterjesztett valóság a mindennapokban
Az Android XR új operációs rendszerként érkezik, kifejezetten AR és XR eszközökhöz, és szorosan együttműködik a Gemini MI-modellekkel, hogy olyan intelligens kiterjesztett valóság funkciókat nyújtson, amelyek eddig csak sci-fi filmekben voltak elképzelhetők. A már együttműködő Samsung és Qualcomm által fejlesztett Project Moohan headset in-lens képernyőkkel, kamerákkal és hangszórókkal lesz felszerelve, és egy sor izgalmas képességgel rendelkezik: például valós idejű fordítás, navigációs HUD, tárgyfelismerés és útbaigazítás várható. A piacra kerülés 2025 végére várható, ami új távlatokat nyit a hordható technológia világában.
Emellett partnerek, mint a Gentle Monster és a Warby Parker vonzó, divatos okosszemüvegeket terveznek Android XR platformon, bár elsőként a Samsung fog izgalmas terméket piacra dobni.
Google Beam és Project Astra: A kommunikáció és asszisztencia új szintjei
A Google Beam – korábbi nevén Project Starline – szemüveg nélküli 3D videóhívást kínál többkamerás, térhatású közvetítéssel, a testbeszéd és szemkontaktus szimulálásával, így a távmunka és vállalati meetingek sokkal személyesebbé válhatnak. Jelenleg HP-boothokon tesztelik, de hamarosan további elterjedése várható.
A Project Astra multimodális mobil asszisztensként integrálja a hang- és vizuális inputokat, hogy valós időben, proaktívan, a kontextust figyelembe véve segítse a felhasználót, legyen szó hibajavításról vagy akár kerékpár-szerelésről.
Volvo és Google: Együtt az intelligens autózásért
A Volvo Cars elsőként kap közvetlen frissítéseket az Android Automotive Platform legújabb verziójáról, miközben a Gemini MI személyre szabott hangalapú asszisztenciát, valós idejű információkat és naprakész élményt ígér a fedélzeti rendszerekben. Ez az együttműködés új dimenziót nyit az autó és a mesterséges intelligencia kapcsolatában, amely kifejezetten a magyar és nemzetközi piacon is releváns lehet.
További MI-fejlesztések és előfizetések
A megannyi innováció között kiemelendő a Gemini Live, amely ingyenes, valós idejű kamera- és képernyőmegosztást tesz lehetővé Androidon, és nyárra iOS támogatással bővül. A közeljövőben érkező Gemini Agent Mode akár több lépéses, összetett feladatokat is automatikusan el tud végezni, mint a tökéletes koncertjegy vagy lakás kiválasztása.
Az új AI Ultra előfizetés havi 250 dolláros díjjal prémium eszközöket, extrém magas használati limitet, valamint YouTube Premiumot és 30 TB tárhelyet kínál azoknak, akik professzionális és kiemelt hozzáférést szeretnének.
Kreatív eszközök és munkafolyamatok átalakulása
A Veo 3 segítségével mesterséges intelligencia generálhat hanggal, effektekkel és párbeszédekkel kibővített, foto-realisztikus videókat. Az Imagen 4 2K felbontású, részletgazdag képeket alkot, míg a Flow bármilyen rövid film klipjét promptból készíti el, vágási és storyboard funkciókkal.
Ezeket a kreatív megoldásokat a Deep Research is kiegészíti, amely PDF és kép alapú kutatásokhoz készít riportokat, valamint szoros Drive- és Gmail-integrációt kap hamarosan.
Workspace és böngészőfejlesztések
a Workspace integrációinak köszönhetően a Gmail automatikusan testre szabja az e-mailek stílusát és ajánl megbeszélési időpontokat a korábbi tartalmak alapján. A Google Meet pedig valós idejű beszédfordítást indít Pro és Ultra csomagokban, angol-spanyol nyelvpárral.
A Chrome integrálja a Gemini modellt, így képes összefoglalni hosszabb anyagokat, automatikusan kezelni jelszó-cserét kiszivárgott fiókok esetén, mindezt a felhasználók kényelméért.
Összegzés: MI mindenütt, személyesen, az életünk részeként
A Google I/O 2025 alapjaiban formálja át a digitális világot a mesterséges intelligencia és kiterjesztett valóság irányába. Akár a keresők, az okostelefonok, a hordható eszközök, az autók vagy épp a kreatív ipar területén dolgozunk, az új Gemini 2.5 modellek, AR-platformok és összekapcsolt eszközök minden szakmai és hétköznapi feladatot könnyebbé, élvezetesebbé és hatékonyabbá tesznek. A magyar közösség, fejlesztők és felhasználók számára is kijelölik az utat egy olyan jövőbe, ahol a digitális és a valós világ határai elmosódhatnak.
Részletes információk és források elérhetők a Google hivatalos blogján.
Hozzászólások
-