Anthropic predstavio novi AI chatbot „Claude 2“ koji su proglasili da je koristan, bezopasan i iskren
Anthropic-ov chatbot, Claude 2, ima poznati repertoar. Može da kreira sažetke, piše kod, prevodi tekst i obavljati zadatke za softverski žanr.
Ovoj najnovijoj verziji generativne AI ponude može se pristupiti putem API-ja i putem novog web interfejsa na koje javnost može pristupiti u SAD-u i Velikoj Britaniji. Ranije je bila dostupna samo preduzećima na zahtjev ili putem Slack-a kao aplikacija.
„Zamislite Claudea kao ljubaznog, entuzijastičnog kolegu ili ličnog asistenta koji može dobiti instrukcije na prirodnom jeziku da vam pomogne u mnogim zadacima“, navodi Anthropic u izjavi.
Dok Microsoft ima prednost u dovođenju Binga u svoj paket produktivnosti, Claude želi da bude korisniji lični asistent od ostalih, piše TechNewsWorld.
Claude 2 je poboljšan u odnosu na prethodne modele u oblastima kodiranja, matematike i zaključivanja, navodi Anthropic.
U dijelu pravosudnog ispita s višestrukim izborom, na primjer, Claude 2 je postigao 76,5%. Prethodni modeli su postigli 73,0%.
Na ispitima iz čitanja i pisanja za studente koji se prijavljuju za postdiplomske studije, Claude 2 je postigao više od 90 procenata. Što se tiče kvantitativnog obrazloženja, učinilo je isto kao i srednji podnosioci zahtjeva.
U oblasti kodiranja, Claude 2 je postigao 71,2% na Codex HumanEval testu, Python testu kodiranja. To je značajno poboljšanje u odnosu na prethodne modele, koji su postigli rezultat od 56,0%.
Međutim, bio je samo nešto bolji od svog prethodnika na GSM8K, koji obuhvata veliki skup matematičkih problema u osnovnoj školi, postižući rezultat od 88,0%, u poređenju sa 85,2% za Claude 1.3.
Introducing Claude 2! Our latest model has improved performance in coding, math and reasoning. It can produce longer responses, and is available in a new public-facing beta website at https://t.co/uLbS2JNczH in the US and UK. pic.twitter.com/jSkvbXnqLd
— Anthropic (@AnthropicAI) July 11, 2023
Prozor konteksta Claude-a 2 može podnijeti do 75.000 riječi. To znači da Claude može „probaviti“ stotine stranica tehničke dokumentacije ili čak knjigu. Poređenja radi, maksimalni unos ChatGPT-a je 3.000 riječi.
Anthropic je dodao da Claude sada može pisati i duže dokumente – od memoranduma preko pisama do priča do nekoliko hiljada riječi.
Kao i ChatGPT, Claude nije povezan na internet. Obučen je na podacima koji se iznenada završavaju u decembru 2022. To mu daje malu prednost u odnosu na ChatGPT, čiji podaci se trenutno prekidaju u septembru 2021. — ali zaostaje za Bingom i Bardom.
„Crveni tim“ za bezbjednost
Anthropic je takođe reklamirao bezbjednosna poboljšanja napravljena u Claude 2. Objasnio je da posjeduje interni „crveni tim“ koji svoje modele ocjenjuje na osnovu velikog skupa štetnih uputstava. Testovi su automatizovani, ali se rezultati redovno provjeravaju ručno. U svojoj posljednjoj evaluaciji, Anthropic je primijetio da je Claude 2 bio dva puta bolji u davanju bezopasnih odgovora od Claudea 1.3.
Osim toga, ima niz principa koji se nazivaju konstitucija ugrađena u sistem koji može da ublaži njegove odgovore bez potrebe za korišćenjem ljudskog moderatora.
Pokušaji da se minimizira šteta u generativnom AI programu mogu potencijalno uticati na njegovu vrijednost. Međutim, izgleda da to nije slučaj sa Claude 2. Ne izgleda kastrirano do granice beskorisnosti.
Čak i ako Claude 2 može ispuniti svoje obećanje da će biti „korisan, bezopasan i pošten“ AI chatbot, moraće se boriti da bude primijećen na tržištu.
Pokušaj razlikovanja Claude-a kao „prijateljskog“ AI vjerovatno neće biti dovoljan da se razlikuje od ostalih igrača na tržištu. Claude će morati bolje da radi ili da bude korisniji da bi ga čovječanstvo prihvatilo. Ljudi neće vidjeti nikakvu razliku između njega i njegovog poznatijeg rivala ChatGPT.
Uvijek postoji muka s kojom se treba nositi. Teže je impresionirati ljude bilo kakvom vrstom novog chat bota nego prije šest mjeseci. Moramo biti svjesni da se pojavljuje malo umora od chatbotova.
(IT mixer)