Fortschritte im Bereich Künstliche Intelligenz: Chinesische Modelle transformieren die Videoproduktion
Die Innovationskraft Chinas im Bereich der Künstlichen Intelligenz (KI) wird durch die Einführung neuer text-to-video AI Modelle eindrucksvoll demonstriert. Mit der Vorstellung dieser Technologien wird nicht nur das Potenzial der Künstlichen Intelligenz in der Medienproduktion beleuchtet, sondern es wird auch ein wichtiger Schritt in Richtung einer intensiven Wettbewerbssituation mit etablierten Modellen aus den USA, wie dem Sora von OpenAI, sichtbar.
Vidu und Ying: Neue Maßstäbe setzen
Der am Donnerstag veröffentlichte text-to-video AI Modell Vidu ermöglicht es Nutzern, Videos und Bilder aus Text zu generieren. Es bietet die Wahl zwischen 4-sekündigen oder 8-sekündigen Clips in bis zu 1080P Auflösung. Diese Fähigkeiten wurden bereits als Durchbruch in der Technologie angesehen, da Vidu seit der Präsentation auf dem Zhongguancun Forum im April 2024 als erstes Modell in China gilt, das den Fähigkeiten von Sora überlegen ist.
Die Konkurrenz schläft jedoch nicht. Das Unternehmen ChatGLM hat ebenfalls sein Modell namens Ying auf den Markt gebracht, welches in der Lage ist, Videos in der Auflösung 1440×960 zu erzeugen. Ying verwendet die neueste Generation von CogVideoX und hat die Fähigkeit, in nur 30 Sekunden einen 6-sekündigen Clip zu erzeugen, womit es im Bereich der Geschwindigkeit bemerkenswerte Fortschritte erzielt hat.
Technologische Entwicklungen und gesellschaftliche Auswirkungen
Die rasante Entwicklung von Vidu wird durch umfangreiche Verbesserungen nach einer dreimonatigen Entwicklungsphase unterstützt. Neue Funktionen wie die Konsistenz von Charakteren zu Video, Anime-Stil und die Möglichkeit, spezielle Effekte zu generieren, haben die Nutzererfahrung deutlich verbessert. Vidu hat sogar die Fähigkeit erreicht, filmähnliche Spezialeffekte wie Rauch- und Lichtspiele sowie CG-Effekte zu produzieren, was es zu einem starken Akteur in der Videoproduktion macht.
Die Bedeutung für die Technologiebranche
Diese Entwicklungen haben nicht nur Auswirkungen auf die Technologiewelt, sondern sie zeigen auch den zunehmenden Einfluss Chinas im globalen Wettlauf um technologische Innovationen. Wang Jingtao, stellvertretender Direktor der Cyberspace Administration of China, betonte während der 12. Internet Security Conference die Existenz von über 180 öffentlich zugänglichen generativen KI-Modellen in China. Die Anzahl registrierter Nutzer übersteigt mittlerweile 564 Millionen, was auf ein wachsendes Interesse und die Akzeptanz dieser Technologien in der Gesellschaft hinweist.
Unterstützung durch die chinesische Regierung
Die Entwicklung dieser fortschrittlichen KI-Modelle wird durch eine solide Unterstützung der chinesischen Regierung gestärkt. Das Beispiel der Unterstützung für das Ying-Modell, die von der Beijing AI Public Computing Platform bereitgestellt wird, verdeutlicht, wie wichtig staatliche Investitionen und Ressourcen für Innovationen in diesem Bereich sind. Diese Art der Förderung umfasst industrielle Investitionen, Rechenleistung sowie die Schaffung hochwertiger Anwendungen und Talente, was für die zukünftige Entwicklung grundlegende Bedeutung hat.
Zusammenfassend lässt sich sagen, dass die neuen text-to-video AI Modelle nicht nur Technologien für die Medienproduktion bereitstellen, sondern auch als Indikator für den bedeutenden Fortschritt Chinas im Bereich KI gelten. Die rasante Entwicklung hat nicht nur wirtschaftliche, sondern auch gesellschaftliche Relevanz und könnte künftig die Landschaft der Medien- und Unterhaltungsindustrie nachhaltig verändern.
– NAG