• Autor: Ondřej Chabr
Umelá inteligencia Google Gemini už teraz poskytuje cenné informácie pre používateľov, ktorí ich môžu využiť na širokú škálu úkonov, napríklad cez mobilný telefón. Najnovšie sa však možnosť interakcie s Gemini ešte viac priblížila klasickej medziľudskej komunikácii. Túto zmenu prináša funkcia Gemini Live. Čo to vlastne je, kde ju môžeme spustiť a v čom nám môže pomôcť?
Gemini Live je k dispozícii v rámci funkcie Gemini Live Camera & Screen Sharing, teda funkcie, vychádzajúcej z predchádzajúceho projektu Project Astra. S používateľmi komunikuje v reálnom čase pomocou hlasu, a to na základe toho, čo vidí cez fotoaparát, alebo toho, čo uvidí, keď jej zdieľate obsah svojej obrazovky.
Namierte fotoaparátom svojho mobilu na ľubovoľný predmet a v reálnom čase sa môžete o ňom rozprávať s umelou inteligenciou. Jednoducho tak zistíte približnú cenu a technické parametre vozidla, ktoré vás zaujalo na ulici. Rovnako vám AI prezradí, čo je ten neznámy doplnok do domácnosti u známeho, kde ho možno kúpiť a koľko stojí.
Umelá inteligencia v Gemini Live vám podá informácie aj o ďalších predmetoch či objektoch a zvládne tiež poradiť s výberom oblečenia alebo zisťovať informácie o prírode okolo vás.
Rady od AI v Gemini Live sa môžu hodiť aj pri riešení rôznych problémov, napríklad technických. Stačí telefónom ukázať miesto problému a položiť otázku. Na základe toho, čo vidí, by malo Gemini Live dokázať odpovedať a poskytnúť inštrukcie. Svoje znalosti pritom čerpá z dostupných dát a informácií z rôznych webových zdrojov.
Podobnú konverzáciu potom môžete viesť aj na základe toho, čo máte na obrazovke svojho telefónu, napríklad keď potrebujete vyriešiť nejaký problém.
Ak nemáte radi prehliadanie rôznych návodov, stačí ich nahrať do služby Gemini vo formáte PDF. Google Gemini Live vás potom môže navigovať na základe informácií, ktoré získava rýchlym prečítaním daného súboru.
Komunikovať možno aj o obsahu videa. Asistent vysvetlí, čo sa v obraze deje, alebo upraví informácie podľa zmenených vstupov. Napríklad, ak máte video s receptom na jedlo pre dve osoby, Gemini Live vám pomôže prispôsobiť ho tak, aby vyhovovalo dvojnásobnému počtu ľudí.
Iste poznáte funkciu Circle to Search, Gemini Live je ale intuitívnejšia v tom, že s ňou môžete o výsledku diskutovať a pýtať sa na ďalšie doplňujúce otázky. To všetko navyše v slovenskom jazyku, pretože Gemini Live podporuje viac ako 45 jazykov a náš jazyk medzi nimi našťastie nechýba.
Ak budete sedieť v reštaurácii v zahraničí, môžete sa rýchlo zorientovať v ponuke jedálneho lístka a získať odporúčanie na jedlo, ktoré by vám mohlo najviac chutiť. Rovnako môže umelá inteligencia suplovať sprievodcu v múzeu. Nasledujúca ukážka hovorí za všetko.
Ako sme už spomenuli, funkcia Gemini Live je dostupná pre používateľov platenej verzie Gemini Advanced. Časom sa presunie aj do Gemini Basic, avšak zatiaľ iba na telefónoch radu Google Pixel 9 a Samsung Galaxy S25. Aktivácia funkcie Gemini Live je jednoduchá – stačí spustiť asistenta podržaním zapínacieho tlačidla a následne kliknúť na tri bodky vedľa ikonky mikrofónu.
Gemini Live predstavuje ďalší zaujímavý krok v oblasti umelej inteligencie a jej integrácie do každodenného života. Môže sa stať spoločníkom, ktorý sa bude hodiť väčšine z nás, pretože táto funkcia umožňuje používateľom komunikovať s AI v reálnom čase a konzultovať s ňou množstvo tém. Či už ide o hľadanie inšpirácie, riešenie problémov alebo získavanie praktických rád.
Mobilné telefóny
• Autor: Peter Vnuk
Google predstavil v marci 2025 novú verziu svojej umelej inteligencie Gemini 2.5, ktorá prináša množstvo vylepšení zameraných na lepšie porozumenie jazyku a vizuálnym dátam. Nová verzia sa vyznačuje zvýšenou schopnosťou rozpoznávať nuansy v jazyku, rýchlejším spracovaním dát a pokročilejšími funkciami na identifikáciu objektov v obrazoch. Vďaka tomu má byť nová verzia AI od Googlu výkonnejším nástrojom pre rôzne aplikácie, od chatbotov a hlasových asistentov až po priemyselné využitie a vývoj webových aplikácií.
Google v marci 2025 predstavil novú verziu svojej AI Gemini 2.5, ktorá prináša významné vylepšenia v oblasti spracovania prirodzeného jazyka a vizuálnych dát. Aktualizácia sa zameriava na lepšie porozumenie kontextu a presnejšiu identifikáciu objektov v obrazoch.
Gemini 2.5 sa pýši predovšetkým zosilnením schopnosti rozpoznávať nuansy prirodzeného jazyka. Vďaka tomu je model schopný lepšie pochopiť kontext a významy slov aj v komplikovanejších textoch. Novinka je navrhnutá ako „myšlienkový model“, čo znamená, že dokáže premýšľať pred odpoveďou, čím sa zlepšuje presnosť a logika výstupu. To je užitočné najmä v aplikáciách, ktoré vyžadujú hlbokú jazykovú analýzu, napríklad v chatbotových službách alebo pri automatizovanom spracovaní dokumentov.
Zároveň bola výrazne optimalizovaná rýchlosť spracovania. Google sa sústredil na skrátenie odozvy modelu, čo je kľúčové pri využití v reálnom čase, napríklad v asistentoch alebo aplikáciách na monitorovanie obrazu.
Výrazným posunom je vylepšenie schopnosti spracovávať vizuálne dáta. Gemini 2.5 dokáže presnejšie identifikovať objekty a pracuje lepšie s detailnými obrazovými informáciami. Model obsahuje kontextové okno s veľkosťou 1 milióna tokenov s plánovaným rozšírením na 2 milióny, čo umožňuje efektívnejšiu prácu s rozsiahlymi dátovými súbormi. Táto vlastnosť je cenná pri aplikáciách využívajúcich vizuálnu analýzu, ako je rozpoznávanie tvárí alebo sledovanie priemyselných procesov.
Google taktiež integroval do modelu nové algoritmy na rýchlejšiu analýzu obrazov, čo zlepšuje výkon pri práci s videom alebo veľkými obrazovými databázami.
Gemini 2.5 ponúka nové rozhranie pre vývojárov, ktoré umožňuje ľahšiu integráciu s ďalšími službami Google. Vývojári môžu využiť pokročilé nástroje na prácu s prirodzeným jazykom a obrazmi priamo vo svojich aplikáciách. Zlepšená dokumentácia a podpora výrazne uľahčujú implementáciu nových funkcií do rôznych projektov.
Verzia 2.5 Pro Experimental má byť najpokročilejším modelom pre zložité úlohy a vedie v rebríčku LMArena, čo ukazuje na jej špičkové schopnosti v oblasti logického uvažovania a kódovania. Tiež je to v podstate dôkaz, že Google svoje tvrdenia o pokročilosti modelu Pro Experimental nepreháňa.
Výrobca tiež plánuje rozšíriť využitie Gemini 2.5 v rámci svojej cloudovej platformy, čím ponúkne robustnejšie a výkonnejšie riešenia pre firmy, ktoré potrebujú spracovávať veľké množstvo dát v reálnom čase.
Vďaka novým schopnostiam je možné využiť Gemini 2.5 napríklad pri tvorbe interaktívnych hlasových asistentov, kde je kladený dôraz na prirodzenosť konverzácie a schopnosť reagovať na zmeny kontextu. Ďalej je možné model nasadiť v priemyselných aplikáciách, kde je nutné rýchlo a presne analyzovať vizuálne dáta.
Novinka tiež výrazne vylepšuje kóderské schopnosti, najmä pri tvorbe vizuálne atraktívnych webových aplikácií a agentových kódovacích aplikácií, pričom na benchmarku SWE-Bench Verified dosahuje 63,8 % (zdroj: Google).
Model Gemini 2.5 naznačuje, že firma plánuje rozvíjať umelú inteligenciu tak, aby bola čo najviac prispôsobená praktickým potrebám používateľov, ale zároveň chce osloviť aj firmy a vývojárov s cieľom pokryť celý trh s AI.
• Autor: Ondřej Chabr
Google predstavil novú generáciu AI, Gemini 2.0, počnúc verziou Flash, ktorá sa výkonom vyrovná predchádzajúcu verziu 1.5 Pro. Táto generácia je označovaná ako „agentná“ AI, schopná plniť zadané úlohy, pričom súčasťou tejto verzie je Project Astra – asistent napríklad pre praktické úkony ako konverzácia alebo používanie nástrojov.
Google predstavuje novú generáciu svojej AI – Google Gemini 2.0. Predchádzajúcu generáciu označoval ako 1.5, pričom nová 2.0 vychádza aktuálne iba v „slabšej“ verzii nazvanej 2.0 Flash. Aj tak je táto na zhruba rovnakej úrovni ako súčasný model Pro. Gemini 2.0 Flash je teraz dostupný pre vývojárov a testerov.
Google Gemini 2.0 prináša natívny audiovizuálny výstup, ktorý umožňuje generovanie obrázkov a hudobných súborov. Expanzia sa očakáva už začiatkom roka 2025. Google novú generáciu umelej inteligencie označuje ako „AI typu agent“, pričom tento systém funguje podobne ako autonómny robot plniaci zadané úlohy.
V rámci Gemini 2.0 sa do popredia dostáva asistent Project Astra. Zameriava sa na čisto praktické úkony. Zvládne napríklad konverzovať v niekoľkých jazykoch s podporou akcentu. Tiež vie používať nástroje, má prístup k mapám, vyhľadávaču aj vizuálnemu hľadaniu Google Lens.
V praxi funguje napríklad tak, že telefónom namierite na nejaký objekt, napríklad na umeleckej výstave, a spýtate sa mobilu, čo vie o danom objekte. Telefón následne odpovie. Ukážku môžete vidieť vo videu vyššie.
Pre plynulú a prirodzenejšiu komunikáciu Astra zapracovala na pamäti, vďaka ktorej si dokáže držať v povedomí posledných 10 minút konverzácie. Okrem aplikácie Gemini by ju Google rád integroval aj do smart okuliarov, kde bude mať vizuálne vyhľadávanie pravdepodobne najväčší potenciál.
Ďalším agentom je Project Mariner. Rieši komplexnejšie úlohy s tým, že postupuje krok za krokom s využitím nástrojov Google, predovšetkým vyhľadávačom. Vývojárov potom zase zaujme Jules. Ten sa integruje priamo do workflow GitHubu. Pod dohľadom vývojárov potom pomôže s riešením problému, plánuje postup a vykonáva ho.
Prekvapivo sa ďalší agent zaoberá hraním hier. Pomáha orientovať sa v hrateľných virtuálnych svetoch. Radí na základe toho, čo vidí na obrazovke.
• Autor: Peter Vnuk
Umelá inteligencia (AI) je aktuálne najväčší trend technologického sveta a stretávať ju budeme všade oveľa častejšie, než sme zvyknutí. Jej generatívny druh započal svoju veľkú cestu do zariadení, ako sú mobilné telefóny, tablety, počítače alebo nositeľné zariadenia, hlavne vďaka ChatGPT. Google však prichádza s modelom Gemini, ktorý by mohol ChatGPT natrhnúť tričko a o ktorom sa v poslednej dobe veľa hovorí. Čím sa Gemini líši a čo všetko dokáže?
Rok 2023 bol rokom generatívnej umelej inteligencie (AI). Široká verejnosť sa začala zaujímať o toto odvetvie hlavne vďaka chatbotovi ChatGPT od spoločnosti OpenAI, v ktorej mal kedysi svoj podiel aj Elon Musk. Prepracované a užitočné odpovede ChatGPT mali úspech a bolo otázkou času, kedy na tohto nového a rýchleho koňa sadne aj konkurencia.
Jednou z nich je Bing AI, ktorý sa premenoval na Copilot a Microsoft ho aktuálne integruje do Windows 11. Kartami ale mieša aj samotná spoločnosť Google, ktorá svojho chatbota Bard poháňaného modelom LaMDA premenovala na Gemini a dala mu nové jadro.
Model je trénovaný na obrovskom množstve dát, a tak dokáže odpovedať na otázky z oblastí ako veda, literatúra, aktuálne udalosti vo svete, politika či história. Práve prístup k aktuálnym informáciám z internetu je výhoda Gemini, ktorú mnohá konkurencia nemá. Napríklad ChatGPT sa obmedzuje na informácie pred januárom 2022.
V praxi je podstatné, že generatívna AI mení pravidlá hry. Do rúk bežného človeka sa dostáva silný nástroj, ktorý dokáže napríklad na fotografii odstrániť vrásky na vašom čele, zmenšiť výrazne rušivý prvok alebo vizuálne odstrániť osobu, ktorá na zábere nemá čo robiť.
Generatívna AI totiž dokáže vďaka tréningu na množstvo dát zamaskovať zmeny, a preto už nemusíte ovládať žiadne „photoshopy“. Stačí po danom mieste prejsť prstom alebo dotykovým perom. Telefón si väčšinu vecí domyslí, takže je to jednoduché, rýchle a zvládne to každý. Tým však výhody ani zďaleka nekončia.
Súčasťou modelov ako Google Gemini je aj možnosť kreatívnej konverzácie s chatbotom. Môže podľa vášho zadania napísať báseň či esej, poradí vám s upravením jedálnička, aby ste si zlepšili naberanie svalov či znižovanie hmotnosti, alebo sa s vami jednoducho porozprávajú na akúkoľvek tému prakticky na úrovni človeka.
Úplne prirodzeným jazykom s vami Google Gemini preberie napríklad politickú situáciu vo Venezuele. Vysvetlí vám, prečo je v noci tma, preloží článok v cudzom jazyku alebo poradí, ako investovať do bitcoinu čo najbezpečnejšie.
Google vyvinul model Gemini ako multimodálny, čo znamená, že jeho schopnosti nekončia pri kreatívnom či inom rozhovore. Má predpoklady pomôcť svojmu používateľovi aj s programovaním softvéru alebo generovaním a úpravou videí, zvukových záznamov či obrázkov. V tejto chvíli ešte jeho úplný potenciál nie je verejnosti prístupný, zatiaľ pracuje s textom a informáciami, ale pravdepodobne sa to zmení v priebehu niekoľkých mesiacov. Google pritom tvrdí, že Gemini je vo viac ako 50 testovaných oblastiach schopností na úrovni ľudských expertov.
Aktuálne ponúkajú firmy stojace za AI, ako je Google Gemini, vždy dve alternatívy. Platení chatboti sú vždy oveľa sofistikovanejší. Majú prístup k väčšiemu množstvu informácií, sú kreatívnejší, menej obmedzujú počet odpovedí, ktoré mesačne môžete dostať, a majú hromadu ďalších výhod.
Je ale potrebné zdôrazniť, že bezplatná verzia Gemini, ktorá je dostupná pre každého, dokáže už teraz množstvo vecí, ktoré budú určite nejednému používateľovi stačiť. Okrem konverzácie na rôzne témy zvládne bezplatný variant aj kreatívne generovanie textu či jazykové preklady. Vo chvíli vzniku tohto článku je k dispozícii práve len bezplatná verzia, pričom Google zdôrazňuje, že Gemini je celkovo vo verzii beta a verzie Pro (niekde sa uvádza aj ako Advanced) a Enterprise nie sú prístupné širokej verejnosti.
V názvosloví platených verzií Gemini vládne tak trochu chaos a nič nie je isté a jasné. Google aktuálne vyhodnocuje dáta z testovania a registrácia do platených verzií beta nie je možná. Ich výhody a ceny však poznáme už teraz. Variant Pro by mal ponúknuť úplnú verziu Gemini za približne 50 € mesačne s obmedzením na 100 tisíc odpovedí. Tá bezplatná sa obmedzuje na 500 odpovedí mesačne.
Pre podnikovú sféru je tu aj variant Enterprise, ktorý má prinášať rýchlejšie reakcie, výhody v oblasti podpory Google, oveľa vyšší počet odpovedí a prideleného manažéra účtu. Cena takého predplatného je však na vyžiadanie a odhaduje sa nad 10 000 € mesačne, takže bude zaujímavá skutočne len pre obmedzený počet špecifických zákazníkov.
Google pracuje na začlenení Gemini aj do svojho portfólia aplikácií a služieb ako Gmail alebo Mapy. Takže AI, ktorá bude mať prístup k emailovým správam a ďalším personalizovaným informáciám, bude schopná lepšie pomáhať jednotlivcom aj firmám napríklad s optimalizáciou výdavkov či v oblasti zdravia.
Je jasné, že v roku 2024 sa trend generatívnej AI bude zosilňovať a postupne sa bude táto technológia usadzovať v mobilných telefónoch. Prvými predstaviteľmi sú členovia novej generácie smartfónov Galaxy S24 od Samsungu a už v tejto chvíli je isté, že aj nový iPhone 16 a iOS 18 budú plné nových prvkov, ktoré AI so sebou prináša. Karty však môže veľmi výrazne zamiešať umelá inteligencia Gemini od Google.
Je potrebné povedať, že nejde o žiadne marketingové triky. Umelá inteligencia dokáže skutočne vylepšiť bežné používanie mobilu napríklad rozpoznaním a vyhľadaním objektov na fotografii. Google má s jeho Gemini tú výhodu, že operačný systém Android beží na miliardách inteligentných telefónov po celom svete.
Keď začne vymieňať postaršieho Asistenta Google za nového s jadrom Gemini, Samsung s jeho Galaxy AI či Apple s novou vylepšenou Siri budú mať veľmi silnú konkurenciu. A tento proces už začal, aj keď oficiálne iba v Spojených štátoch amerických. U nás je možné vymeniť Asistenta Google za Gemini zatiaľ iba aplikáciou z neoficiálnych zdrojov.
Oficiálne je apka iba v angličtine, ale v skutočnosti podporuje Gemini češtinu aj slovenčinu a dokáže v nej bez problémov komunikovať. To mu dáva predpoklady nahradiť Asistenta Google plnohodnotne aj v našich končinách. Je to iba otázka času.