OpenAI představilo Sora, pokročilý model umělé inteligence schopný generovat realistická a kreativní videa z textových pokynů. Sora umožňuje tvorbu videí až do délky jedné minuty s vysokou vizuální kvalitou a přesností v dodržování zadání uživatele. Cílem je naučit AI rozumět a simulovat fyzický svět v pohybu, aby mohla pomáhat lidem řešit problémy vyžadující interakci s reálným světem.
Sora může generovat celá videa najednou nebo prodloužit již vygenerovaná videa, čímž zůstává subjekt konzistentní. Model je schopen generovat videa přímo z textových instrukcí nebo animovat stávající statické obrázky s vysokou úrovní detailů a přesnosti. Představuje základ pro modely, které mohou rozumět a simulovat reálný svět, což je považováno za důležitý milník k dosažení obecné umělé inteligence. Mrkněte na ukázky na webu OpenAI.
OpenAI testuje novou funkci paměti pro ChatGPT, která mu umožní pamatovat si informace z diskuzí a díky nim činit budoucí rozhovory užitečnějšími. Uživatelé budou mít plnou kontrolu nad pamětí ChatGPT, mohou ji vypnout, říct mu, aby si něco zapamatoval, zjistit, co si pamatuje, nebo mu říct, aby zapomněl konkrétní informace buď konverzačně, nebo prostřednictvím nastavení. Tato funkce je zaváděna pro malou část uživatelů ChatGPT zdarma a Plus, aby se zjistilo, jak je užitečná, s plány na širší zavedení, které budou brzy sdíleny.
Paměť ChatGPT se zlepší, čím více s ním uživatelé budou komunikovat. Například ChatGPT si může zapamatovat preferovaný formát poznámek z jednání, zájmy dětí uživatele pro návrhy narozeninových přání nebo předvolby učitele pro plánování hodin. Uživatelé mohou kdykoli vypnout paměť, prohlížet a mazat konkrétní vzpomínky nebo vymazat celou paměť v nastavení. Smazání chatu nesmaže jeho paměť; musíte smazat samotnou paměť. Obsah poskytnutý ChatGPT, včetně paměti, může být použit k vylepšení modelů pro všechny uživatele, ale uživatelé mohou tuto možnost vypnout.
Londýnská AI laboratoř Stability AI představilo preview svého nového modelu pro generování obrázků z textu, Stable Diffusion 3. Tento pokročilý generativní AI model slibuje vytváření vysoce kvalitních obrázků na základě textových pokynů s vylepšenými výkony. Společnost Stability AI také uvedla, že před veřejným uvedením Stable Diffusion 3 zavede řadu bezpečnostních opatření a spolupracuje s odborníky na testování modelu, aby minimalizovala potenciální rizika.
Model Stable Diffusion 3, který není ještě veřejně dostupný, nabízí Stability AI v různých velikostech, čímž se snaží vyvážit kreativní výkon a dostupnost pro všechny uživatele. Společnost zdůrazňuje svůj závazek k otevřenému, bezpečnému a univerzálně dostupnému generativnímu AI.
Google představil svůj nejnovější AI model Gemini 1.5, který umí zpracovávat obsah o rozsahu až jednoho milionu tokenů. Tato nová schopnost umožňuje modelu Gemini 1.5 zpracovávat extrémně dlouhé textové pasáže – až jeden milion znaků – pro pochopení kontextu a významu, což výrazně překonává předchozí systémy AI jako Claude 2.1 a GPT-4 Turbo.
Tento pokrok je přičítán inovativní architektuře Mixture-of-Experts (MoE) modelu. Na rozdíl od tradičních transformátorových modelů, které fungují jako jedna velká neuronová síť, jsou modely MoE rozděleny do menších „expertních“ neuronových sítí. Ty se v závislosti na typu vstupu učí selektivně aktivovat pouze nejrelevantnější expertní cesty v neuronové síti, což výrazně zvyšuje efektivitu modelu.
Schopnost jednoho milionu tokenů zůstává prozatím experimentální, ale pokud splní svůj počáteční slib, mohl by Gemini 1.5 stanovit nový standard pro schopnost AI rozumět složitým textům z reálného světa.
Google Chrome představil nový AI nástroj pro psaní, poháněný modelem Gemini AI, který rozšiřuje funkci „Help me write“ z Gmailu na celý web. Tento experimentální nástroj je dostupný v angličtině na Windows, Mac a Linuxu a lze jej zapnout v nastavení Chrome pod stránkou „Experimental AI“. Kromě psaní nového obsahu nebo přepsání stávajícího textu nástroj bere v úvahu kontext webové stránky pro navrhování relevantního obsahu.