OpenAI heeft opnieuw voor opschudding gezorgd op het internet met een baanbrekende aankondiging van een nieuwe AI-technologie: Sora, een videogenerator die verbazingwekkend levensechte video’s kan creëren. De reeds vrijgegeven voorbeelden zijn bijna niet te onderscheiden van echte camerabeelden.

Sora maakt gebruik van een diffusiemodel gecombineerd met een transformer-architectuur. Dit betekent dat het neurale netwerk op een vergelijkbare manier functioneert als ChatGPT. OpenAI heeft zich nog niet uitgelaten over een officiële lanceerdatum, maar geeft aan dat het mensen een voorproefje wil geven van wat er aan de horizon ligt op het gebied van kunstmatige intelligentie.

Dit is wat we tot nu toe weten over Sora, en waarom de lancering van deze videogenerator voor het grote publiek mogelijk nog even op zich laat wachten.

Wat is Sora van OpenAI?

Sora is een AI-model voor tekst-naar-video, ontwikkeld door de makers van ChatGPT, OpenAI. “Tekst-naar-video” betekent dat Sora tekstuele opdrachten omzet in korte videoclips. De serie video’s die OpenAI deze week heeft vrijgegeven, is werkelijk adembenemend.

“Sora kan complexe scènes genereren met meerdere personages, specifieke bewegingstypes en nauwkeurige details over het onderwerp en de achtergrond,” legt OpenAI uit in een blogpost die deze week is gepubliceerd, waarin meer video’s werden vrijgegeven. “Het model begrijpt niet alleen wat de gebruiker vraagt in de opdracht, maar ook hoe die dingen in de fysieke wereld bestaan.”

training-ai-kunstmatige-intelligentie-in-company

Training AI op locatie 2024

De wereld waarin we werken veranderd ontzettend snel. Breng jezelf en jouw team op de hoogte van de laatste ontwikkelingen en leer hoe AI tools zoals ChatGPT en Gemini zijn in te zetten voor productiviteit, (werk)geluk en succes!

Duur: 3 uur
Investering: 950,- ex BTW
Formaat: Tot 30 deelnemers

Wie kan Sora gebruiken?

Momenteel wordt Sora grondig getest door beveiligingsonderzoekers die verantwoordelijk zijn voor het waarborgen van de veiligheid en beveiliging voordat het publiekelijk wordt vrijgegeven, en voor het beoordelen van “kritieke risico’s”.

OpenAI meldt echter dat een kleine groep visuele kunstenaars, filmmakers en ontwerpers ook toegang heeft gekregen tot Sora. Er worden geen namen genoemd van kunstenaars of ontwerpers die aan de proef deelnemen.

Sommige goed ingelichte accounts op het OpenAI-forum lijken aan te geven dat er op enig moment een wachtlijst zal worden uitgerold, wat de eerste kans zal zijn om ermee aan de slag te gaan.

Helaas is er nog geen indicatie wanneer we ons kunnen aanmelden om Sora te gebruiken.

Wanneer is Sora beschikbaar voor het grote publiek?

Helaas is er momenteel geen releasedatum voor Sora. Alle content die de afgelopen 24 uur viraal is gegaan op internet, komt voort uit de aankondigingsblogpost die door OpenAI is gepubliceerd.

Interessant is dat OpenAI zelfs geen vage indicatie heeft gegeven van wanneer het algemeen beschikbaar zou kunnen zijn – er is zelfs geen aanwijzing dat het dit jaar zou worden uitgebracht.

Dit is vrij ongebruikelijk voor zo’n grote aankondiging en zou kunnen suggereren dat een openbare release nog ver weg is – maar anderzijds geeft OpenAI toe dat het zijn onderzoek vroeg deelt. Gezien de snelheid waarmee de industrie van kunstmatige intelligentie zich de afgelopen twee jaar heeft ontwikkeld, is de werkelijke lanceerdatum ieders gok.

Wat is het probleem met Sora?

Zoals we hebben besproken, is OpenAI nog niet klaar om Sora publiekelijk vrij te geven, ontevreden over het feit dat de technologie voor het genereren van video’s onvoldoende op veiligheid is getest. Dit is begrijpelijk, gezien de talloze ethische vraagstukken die de creatie van dergelijke levensechte video’s met zich meebrengt – nog afgezien van het feit dat dit gebeurt in een jaar met zoveel verkiezingen.

“We zullen verschillende belangrijke veiligheidsmaatregelen nemen voordat we Sora beschikbaar maken in de producten van OpenAI.” “We werken samen met red teamers – domeinexperts op gebieden zoals desinformatie, haatdragende inhoud en vooringenomenheid – die het model vijandig zullen testen,” voegde het toe.

OpenAI zegt ook dat het werkt aan een AI-video-detectieclassifier die kan identificeren of een video al dan niet door Sora is geproduceerd.

Dit lijkt op een vergelijkbare stap die werd genomen na de lancering van ChatGPT, waarna het AI-bedrijf een tekstclassifier lanceerde. Deze werd echter later stopgezet vanwege de onbetrouwbaarheid. Toen we het testten om te zien of het ChatGPT-plagiaat kon ontdekken, kon het zelfs geen door zichzelf gegenereerde inhoud detecteren.

Hoe werkt Sora van OpenAI?

“Sora is een diffusiemodel dat een video genereert door te starten met een die eruitziet als statische ruis en deze geleidelijk transformeert door de ruis in vele stappen te verwijderen,” zei OpenAI deze week.

De technologie werkt op een vergelijkbare manier als de GPT-familie van taalmodellen die de chatbot van het bedrijf, ChatGPT, aandrijven. Ze gebruiken allemaal een “transformer”-architectuur – een type neuraal netwerk dat invoer neemt en deze “transformeert” naar uitvoer. Ze hebben ook elementen van DALLE-3 opgenomen, zoals het bijschriftsysteem.

OpenAI heeft Sora gevoed met video’s en afbeeldingen als data-eenheden – of “patches”. “Door te verenigen hoe we gegevens representeren,” zegt OpenAI, “kunnen we diffusietransformers trainen op een breder scala aan visuele gegevens dan voorheen mogelijk was, met verschillende duur, resoluties en beeldverhoudingen.”

training-ai-kunstmatige-intelligentie-in-company

Training AI op locatie 2024

De wereld waarin we werken veranderd ontzettend snel. Breng jezelf en jouw team op de hoogte van de laatste ontwikkelingen en leer hoe AI tools zoals ChatGPT en Gemini zijn in te zetten voor productiviteit, (werk)geluk en succes!

Duur: 3 uur
Investering: 950,- ex BTW
Formaat: Tot 30 deelnemers