Llama 3 - najnovija Metina verzija Llama AI modela otvorenog koda

Meta je predstavila sljedeću generaciju svojih AI modela Llama 3 8B i 70B

Meta je najavila Llama 3, sljedeću veliku verziju svog osnovnog AI modela otvorenog koda. Meta tvrdi da Llama 3 nadmašuje konkurentske modele u svojoj klasi u ključnim metrikama i da je bolji u svim zadacima kao što je kodiranje. Dva manja modela Llame 3 (8B i 70B) su puštena u prodaju, kako u Meta AI asistentu, tako i za spoljne programere, dok mnogo veća, multimodalna verzija dolazi u narednim mjesecima.

Pročitajte još: Brave uvodi AI asistenta za iPhone i iPad korisnike

Llama 3 dolazi sa poboljšanim mogućnostima u odnosu na svog prethodnika, a kompanija je usvojila nove metode obuke kako bi optimizovala efikasnost modela.

“Bilo da razvijate agente ili druge aplikacije koje pokreće vještačka inteligencija, Llama 3 u 8B i 70B će ponuditi mogućnosti i fleksibilnost koje su vam potrebne za razvoj vaših ideja”, saopštila je Meta.

Llame 3 se ističe u jezičkim nijansama, kontekstualnom razumijevanju i složenim zadacima kao što su prevođenje i generisanje dijaloga. Uz poboljšanu skalabilnost i performanse, Llama 3 može bez napora da se nosi sa zadacima u više koraka, dok procesi nakon obuke značajno smanjuju stopu lažnih odbijanja, poboljšavaju usklađenost odgovora i povećavaju raznolikost u odgovorima modela. Pored toga, drastično podiže mogućnosti kao što su rezonovanje, generisanje koda i praćenje instrukcija.

Performanse i arhitektura

Novi modeli 8B i 70B parametara Llama 3 predstavljaju veliki skok u odnosu na Llama 2 i uspostavljaju novo stanje tehnike za LLM modele u tim razmjerama. Zahvaljujući poboljšanjima u pre-treningu i post-treningu, Metini unaprijed obučeni i fino podešeni modeli su najbolji modeli koji danas postoje na skali parametara 8B i 70B.

Za referencu, unaprijeed je obučen opšti konverzacijski AI, dok su modeli instrukcija usmjereni na izvršavanje specifičnih zadataka. Unaprijed obučeni model Llama 3 70B nadmašio je Google Gemini 1.0 Pro u MMLU (79.5 vs 71.8), BIG-Bench Hard (81.3 vs 75.0) i DROP (79.7 vs 74.1), gdje je model 70B nadmašio Gemi Instruct 1.5 Pro model u MMLU, HumanEval i GSM-8K referentnim vrijednostima, na osnovu podataka koje dijeli kompanija.

Meta se odlučila za transformatorsku arhitekturu samo dekodera za nove AI modele, ali je napravila nekoliko poboljšanja u odnosu na prethodnika. Llama 3 sada koristi tokenizer sa vokabularom od 128.000 tokena, a kompanija je usvojila grupnu pažnju na upite (GQA) kako bi poboljšala efikasnost zaključivanja. GQA pomaže u poboljšanju pažnje AI tako da se ne kreće izvan svog određenog konteksta kada odgovara na upite. meta je unaprijed obučila modele sa više od 15T tokena, za koje tvrdi da su dobili iz javno dostupnih podataka.

Dostupnost

Oni koji su zainteresovani da isprobaju nove modele vještačke inteligencije imaju sreće jer Meta sa Llama 3 koristi pristup koji je prvi u zajednici. Novi osnovni modeli će biti otvorenog koda kao i prethodni modeli.

Meta je u svom blog postu navela: „Llama 3 modeli će uskoro biti dostupni na AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM i Snowflake, i uz podršku hardverskih platformi koje nudi AMD, AWS, Dell, Intel, NVIDIA i Qualcomm.”

Lista uključuje sve glavne platforme u oblaku, hostingu i hardveru, što bi entuzijastima trebalo olakšati da se dočepaju AI modela. Meta je takođe integrisala Llama 3 sa vlastitim Meta AI kojem se može pristupiti putem Facebook Messenger-a, Instagrama i WhatsApp-a u podržanim zemljama.

Iako je do sada bio dostupan samo u SAD-u, Meta AI je sada na engleskom jeziku u Australiji, Kanadi, Gani, Jamajci, Malaviju, Novom Zelandu, Nigeriji, Pakistanu, Singapuru, Južnoj Africi, Ugandi, Zambiji i Zimbabve, sa više zemalja i jezika koji dolaze. Daleko je od Zаkerbergovog mišljenja o istinski globalnom AI asistentu, ali ovo šire izdanje približava Meta AI tome da konačno dosetigne više od 3 milijarde korisnika kompanije dnevno.

(IT mixer)

Llama 3 – najnovija Metina verzija Llama AI modela otvorenog koda

Meta je predstavila sljedeću generaciju svojih AI modela Llama 3 8B i 70B

Performanse i arhitektura

Dostupnost

Komentari Otkaži

IT mixer

Llama 3 – najnovija Metina verzija Llama AI modela otvorenog koda

Meta je predstavila sljedeću generaciju svojih AI modela Llama 3 8B i 70B

Performanse i arhitektura

Dostupnost

OpenAI predstavio Atlas: Veb pregledač pokretan ChatGPT-om

Google Mape olakšavaju povratak kući uz prikaz stvarnog vremena dolaska

Windows 11 Copilot dobija glasovnu aktivaciju i pametnu analizu ekrana u velikom AI ažuriranju

Komentari Otkaži

IT mixer