AI UPDATE #5

Umělá inteligence je už zase o kus dál! Přečtete si o novinkách ze světa AI a buďte v obraze. Toto vydání je pro všechny zdarma.

Společnost Open AI představila nový text-to-video nástroj Sora

OpenAI představilo Sora, pokročilý model umělé inteligence schopný generovat realistická a kreativní videa z textových pokynů. Sora umožňuje tvorbu videí až do délky jedné minuty s vysokou vizuální kvalitou a přesností v dodržování zadání uživatele. Cílem je naučit AI rozumět a simulovat fyzický svět v pohybu, aby mohla pomáhat lidem řešit problémy vyžadující interakci s reálným světem.

Sora může generovat celá videa najednou nebo prodloužit již vygenerovaná videa, čímž zůstává subjekt konzistentní. Model je schopen generovat videa přímo z textových instrukcí nebo animovat stávající statické obrázky s vysokou úrovní detailů a přesnosti. Představuje základ pro modely, které mohou rozumět a simulovat reálný svět, což je považováno za důležitý milník k dosažení obecné umělé inteligence. Mrkněte na ukázky na webu OpenAI.

OpenAI zpřístupňuje některým uživatelům funkci Paměť

OpenAI testuje novou funkci paměti pro ChatGPT, která mu umožní pamatovat si informace z diskuzí a díky nim činit budoucí rozhovory užitečnějšími. Uživatelé budou mít plnou kontrolu nad pamětí ChatGPT, mohou ji vypnout, říct mu, aby si něco zapamatoval, zjistit, co si pamatuje, nebo mu říct, aby zapomněl konkrétní informace buď konverzačně, nebo prostřednictvím nastavení. Tato funkce je zaváděna pro malou část uživatelů ChatGPT zdarma a Plus, aby se zjistilo, jak je užitečná, s plány na širší zavedení, které budou brzy sdíleny.

Paměť ChatGPT se zlepší, čím více s ním uživatelé budou komunikovat. Například ChatGPT si může zapamatovat preferovaný formát poznámek z jednání, zájmy dětí uživatele pro návrhy narozeninových přání nebo předvolby učitele pro plánování hodin. Uživatelé mohou kdykoli vypnout paměť, prohlížet a mazat konkrétní vzpomínky nebo vymazat celou paměť v nastavení. Smazání chatu nesmaže jeho paměť; musíte smazat samotnou paměť. Obsah poskytnutý ChatGPT, včetně paměti, může být použit k vylepšení modelů pro všechny uživatele, ale uživatelé mohou tuto možnost vypnout.

Stability AI uvádí Stable Diffusion 3

Londýnská AI laboratoř Stability AI představilo preview svého nového modelu pro generování obrázků z textu, Stable Diffusion 3. Tento pokročilý generativní AI model slibuje vytváření vysoce kvalitních obrázků na základě textových pokynů s vylepšenými výkony. Společnost Stability AI také uvedla, že před veřejným uvedením Stable Diffusion 3 zavede řadu bezpečnostních opatření a spolupracuje s odborníky na testování modelu, aby minimalizovala potenciální rizika.

Model Stable Diffusion 3, který není ještě veřejně dostupný, nabízí Stability AI v různých velikostech, čímž se snaží vyvážit kreativní výkon a dostupnost pro všechny uživatele. Společnost zdůrazňuje svůj závazek k otevřenému, bezpečnému a univerzálně dostupnému generativnímu AI.

Google představil Gemini 1.5

Google představil svůj nejnovější AI model Gemini 1.5, který umí zpracovávat obsah o rozsahu až jednoho milionu tokenů. Tato nová schopnost umožňuje modelu Gemini 1.5 zpracovávat extrémně dlouhé textové pasáže – až jeden milion znaků – pro pochopení kontextu a významu, což výrazně překonává předchozí systémy AI jako Claude 2.1 a GPT-4 Turbo.

Tento pokrok je přičítán inovativní architektuře Mixture-of-Experts (MoE) modelu. Na rozdíl od tradičních transformátorových modelů, které fungují jako jedna velká neuronová síť, jsou modely MoE rozděleny do menších „expertních“ neuronových sítí. Ty se v závislosti na typu vstupu učí selektivně aktivovat pouze nejrelevantnější expertní cesty v neuronové síti, což výrazně zvyšuje efektivitu modelu.

Schopnost jednoho milionu tokenů zůstává prozatím experimentální, ale pokud splní svůj počáteční slib, mohl by Gemini 1.5 stanovit nový standard pro schopnost AI rozumět složitým textům z reálného světa.

Gemini lze využít přímo v prohlížeči Google Chrome

Google Chrome představil nový AI nástroj pro psaní, poháněný modelem Gemini AI, který rozšiřuje funkci „Help me write“ z Gmailu na celý web. Tento experimentální nástroj je dostupný v angličtině na Windows, Mac a Linuxu a lze jej zapnout v nastavení Chrome pod stránkou „Experimental AI“. Kromě psaní nového obsahu nebo přepsání stávajícího textu nástroj bere v úvahu kontext webové stránky pro navrhování relevantního obsahu.

Další novinky ve zkratce:

Bývalí inženýři Twitteru založili startup Particle, AI poháněnou čtečku novin nabízející personalizované a víceperspektivní shrnutí zpráv s cílem spravedlivě kompenzovat autory a vydavatele.
Microsoft investoval 16 milionů dolar do pařížského startupu Mistral AI, aby spolupracoval na vývoji AI modelů a rozšířil k nim přístup přes Azure, což přitáhlo pozornost Evropské komise v rámci šetření vztahů mezi technologickými giganty a AI firmami.
Stovky podepsaly otevřený dopis volající po přísné regulaci AI generovaných deepfakes, s výzvou k úplné kriminalizaci materiálů zneužívajících děti a trestu za šíření škodlivých deepfakes.
Match Group uzavřela dohodu s OpenAI. Získala přes 1000 licencí ChatGPT Enterprise pro zaměstnance a slibuje revoluci pracovní kultury a inovace v oblasti komunikace, kódování a designu ve svých aplikacích, jako jsou Tinder, Match, OkCupid, Hinge.
DeepMind, výzkumná divize AI společnosti Google, založila novou organizaci AI Safety and Alignment, která sdružuje stávající týmy pracující na bezpečnosti AI a zároveň se rozšiřuje o nové specializované skupiny výzkumníků a inženýrů v oblasti generativní AI.

Marketingology