OpenAI představuje generátor videa Sora

Po generování textových konverzací a obrázků přichází čas generátorů videa. Americká společnost OpenAI představila svůj AI nástroj Sora, který umí z textových zadání (promptů) vytvořit realistické videosekvence. Sora dokáže generovat videa o maximální délce 60 sekund a zatím není dostupná veřejnosti. OpenAI nástroj dala k dispozici pouze uzavřené skupině testerů a vybraným filmařům a umělcům, kteří mají společnosti poskytnout prvotní zpětnou vazbu. Na svém webu ale publikovala řadu krátkých ukázek videosekvencí, které Sora vygenerovala, včetně jejich promptů. "Sora dokáže generovat složité scény s více postavami, specifickými typy pohybu a přesnými detaily objektů a pozadí. Model rozumí nejen tomu, co uživatel požadoval v zadání, ale také tomu, jak tyto věci existují ve fyzickém světě," popisuje OpenAI možnosti svého generátoru. Podle firmy model dokáže v rámci jednoho videa vytvořit několik různých záběrů, které si zachovávají jednotný vizuální styl. Zároveň má stále některá omezení: ve složitějších scénách nemusí správně dodržovat fyzikální pravidla a někdy nemusí správně rozumět vztahu mezi příčinou a následkem. "Osoba si může například ukousnout kousek sušenky, ale na sušence pak nemusí být žádná stopa," dává OpenAI konkrétní příklad. Sora podle firmy dokáže generovat zcela nová videa, ale dokáže také prodlužovat už existující záběry nebo vytvořit video ze statického obrázku. Umí si přitom "zapamatovat" objekt, který vyšel ze záběru, a později jej zobrazit znovu ve stejné podobě. Firma zatím nezveřejnila kdy a za jakých podmínek chce nástroj uvolnit veřejnosti. Než se tak stane, plánuje do generátoru zavést řadu bezpečnostních pojistek, které mají bránit jeho zneužití pro tvorbu dezinformací nebo zajistit, aby nevytvářel nenávistný či předsudečný obsah. Půjde nejspíš zejména o filtrování textových promptů. Firma také říká, že pracuje na nástroji, který má videa prověřovat snímek po snímku. Vygenerovaná videa mají být podle OpenAI v budoucnu také označena metadaty ve standardu C2PA, která mají obsahovat informaci o tom, že záběry byly vygenerovány AI.