Google je predstavio Gemini, svoj najnapredniji i najsposobniji model vještačke inteligencije (AI), sa naprednim multimodalnim mogućnostima

 

Google Gemini je revolucionarni model koji predstavlja korak naprijed u AI tehnologiji, nudeći najsavremenije performanse u poređenju sa postojećim velikim jezičnim modelima (LLM).

Veliki jezični model Gemini uključivaće paket od tri različite veličine: Gemini Ultra, njegova najveća, najsposobnija kategorija; Gemini Pro, koji se prilagođava širokom rasponu zadataka; i Gemini Nano, koji će koristiti za specifične zadatke i mobilne uređaje.

Kompanija za sada planira da licencira Gemini korisnicima putem Google Clouda kako bi ih koristili u svojim aplikacijama. Gemini će da se koristi za pokretanje Google-ovih proizvoda kao što su njegov Bard chatbot i Search Generative Experience, koji pokušava da odgovori na upite pretraživanja tekstom u stilu razgovora (SGE još nije široko dostupan).

 

Šta je Gemini?

 

Razvijen od strane Google DeepMind, na čelu s izvršnim direktorom i suosnivačem Demisom Hassabisom, Gemini predstavlja dokaz Google-ove stalne predanosti tome da bude kompanija na prvom mjestu za AI.

Gemini je najveće Google-ovo predstavljanje vještačke inteligencije do sada, njegov pokušaj da nadmaši konkurente OpenAI i Microsoft u trci za prednost na AI polju . Nema sumnje da je model najbolji u klasi u širokom rasponu mogućnosti – „mašina za sve“ , kako to kaže jedan poznavaoc problematike.

„Ovaj model je inherentno sposobniji“, rekao je Sundar Pichai, izvršni direktor Google-a i njegove matične kompanije Alphabet, za MIT Technology Review.

“To je platforma. AI je duboka promjena platforme, veća od weba ili mobilnih uređaja. To predstavlja veliki korak za nas” , dodao je Pichai.

Model prikazuje impresivan niz mogućnosti, posebno u multimodalnom razumijevanju – opcija koja mu omogućuje obradu i besprijekorno kombinovanja različitih vrsta informacija, uključujući tekst, kod, zvuk, sliku i video.

 

Gdje je u odnosu na GPT-4?

 

Google DeepMind tvrdi da Gemini nadmašuje GPT-4 u 30 od 32 standardne mjere performansi. A ipak, granice između njih su tanke.

Ono što je DeepMind učinio jest da je uklopio trenutne mogućnosti vještačke inteligencije u jedan snažan paket. Sudeći prema demonstracijama, mnoge stvari radi vrlo dobro — ali i nekoliko stvari koje prije nismo vidjeli. Gemini bi mogao biti znak da smo dostigli vrhunac AI pompe. Bar za sada.

Kao i GPT-4, Gemini je multimodalan. Tradicionalni multimodalni modeli često su ograničeni svojim dizajnom, koji uključuje obuku posebnih komponenti za različite modalitete i njihovo spajanje.

Nasuprot tome, Gemini je izgrađen od temelja da bude izvorno multimodalan, što mu omogućuje daleko efikasnije razumijevanje i rasuđivanje različitih inputa.

On može da kombinuje ove različite formate da odgovori na pitanja o svemu, od kućnih poslova do matematike i ekonomije na fakultetu.

U demo prezentaciji za štampu, Google je demonstrirao Geminijevu sposobnost da napravi snimak ekrana postojećeg grafikona, analizira stotine stranica istraživanja sa novim podacima, a zatim ažurira grafikon tim novim informacijama.

U drugom primjeru, Geminiju se prikazuju slike omleta koji se kuva u tavi i pitaju (govorom, a ne tekstom) da li je omlet spreman. „Nije gotovo jer su jaja još tečna“ , odgovara on.

Osim svojih multimodalnih mogućnosti, Gemini se ističe u zadacima kodiranja. Njegova sposobnost razumijevanja, objašnjenja i generisanja visokokvalitetnog koda u više programskih jezika pozicionira ga kao vodeći model za kodiranje. Takođe čini osnovu za naprednije sisteme kodiranja, poput AlphaCode, značajno poboljšavajući probleme konkurentnog programiranja.

 

Gemini Ultra, Pro i Nano

 

Gemini 1.0, prva verzija modela, dolazi u tri varijante: Gemini Ultra, Gemini Pro i Gemini Nano.

Svaki je optimizovan za specifične zadatke, sa Gemini Ultra dizajniranim za vrlo složene zadatke, Gemini Pro za širok raspon zadataka i Gemini Nano za djelotvorne zadatke na uređaju.

“Mi gledamo na to kao na Geminijevu eru modela” , rekao je Pichai pa dodao: “Ovako će Google DeepMind da gradi i napreduje na području AI-ja. Zato će uvijek da predstavlja granicu, mjesto napretka u tehnologiji vještačke inteligencije.”

Google je najavio značajnu nadogradnju Barda, integrišući Gemini Pro kako bi poboljšao mogućnosti vještačke inteligencije. Gemini Pro je fino podešen unutar Barda kako bi značajno poboljšao svoje performanse u razumijevanju i sažimanju informacija, zaključivanju, kodiranju i planiranju.

Google-ovo najnovije ažuriranje predstavlja Gemini Nano, napredni AI model, sada integrisan u pametni telefon Pixel 8 Pro. Ovo ažuriranje označava Pixel 8 Pro kao prvi telefon dizajniran za AI sa Gemini Nano, koji koristi Google Tensor G3 tehnologiju.

 

Dostupnost Gemini AI modela

 

Gemini 1.0 postupno se integriše u razne Google proizvode i platforme. Od 13. decembra će biti dostupan programerima i poslovnim korisnicima putem Google AI Studija i Google Cloud Vertex AI. Android programeri takođe će moći da grade sa Gemini Nano.

Kao dio Google-ove predanosti odgovornom unapređenju vještačke inteligencije, Gemini Ultra će proći opsežne provjere povjerenja i bezbjednosti prije šireg izdanja.

Potpuno izdanje Geminija biće objavljeno tokom sljedećih mjeseci.

„Novi Google Bard pojačan Geminijem u početku će biti dostupan na engleskom jeziku u više od 170 zemalja, ne uključujući EU i UK. Takva odluka je donesena kako bi se Google prije toga posavjetovao sa lokalnim regulatorima“ , kaže Sissie Hsiao, potpredsjednik Google-a, koja je zadužena za Bard.

(IT mixer)