Gemini Omni: Google lanserar ny AI för videoredigering

Under Google I/O har teknikjättens forskningsavdelning för artificiell intelligens, Google DeepMind, visat upp en banbrytande ny mjukvarumodell.

Den nya teknologin har fått namnet Gemini Omni och är särskilt utvecklad för att förändra hur digitalt rörligt material produceras och modifieras. Genom att kombinera avancerad analysförmåga med generativa verktyg öppnar systemet upp helt nya möjligheter för digitala kreatörer.

Röststyrd videoredigering och multimodala funktioner

Kärnan i Gemini Omni ligger i dess förmåga att tolka komplexa instruktioner via naturligt tal. Användare kan genom enkla röstkommandon genomföra omfattande förändringar i befintliga videofiler. Systemet klarar av att identifiera och manipulera specifika element i bild, vilket gör det möjligt att byta ut allt från visuella bakgrunder till enskilda karaktärer i en scen.

Modellen utmärker sig genom att arbeta sömlöst över flera olika medietyper samtidigt. Google beskriver systemets kapacitet på följande sätt:

”Meet Gemini Omni: where Gemini’s ability to reason meets the ability to create. Omni is our new model that can create anything from any input — starting with video. With Omni, you can combine images, audio, video and text as input and generate high-quality videos grounded in Gemini’s real-world knowledge. You can also easily edit your videos through conversation.”

Denna djupa integration av bild, ljud, rörligt material och text gör att produktionerna inte bara blir visuellt imponerande, utan också logiskt sammanhängande och förankrade i en bredare kontextuell förståelse av omvärlden.

Demonstrationer och framtida lansering av Flash-versionen

För att illustrera kapaciteten hos den nya plattformen har Google publicerat presentationsmaterial och demonstrationsvideor. Materialet visar handfasta exempel på hur råmaterial kan transformeras och hur användare kan föra en löpande dialog med artificiell intelligens för att finjustera slutresultatet i klippningen.

Utvecklingstakten är hög och konsumenter kommer inte att behöva vänta länge på att få testa tekniken i praktiken. Den första publika versionen som görs tillgänglig blir en mer strömlinjeformad utgåva under namnet Gemini Omni Flash. Enligt de officiella planerna ska denna version integreras i det befintliga ekosystemet för registrerade användare någon gång under den kommande sommaren, vilket markerar startskottet för en ny era inom automatiserad videoproduktion.

Källablog.google
Ivan Spoljaric
Ivan Spoljaric är tech-entusiasten som grundade Teknikhype.se i början av 2013. Med över 20 års erfarenhet av produkt-testning brinner han för att ge ärliga recensioner och knivskarpa nyhetsanalyser inom gaming, AI och bilbranschen. När han inte skriver hittar du honom ofta framför kameran på Teknikhypes växande TikTok-kanal.