AI-Breakdown | KW 15, 2025 – Bilder, Musik & Agenten

4 min lesen

April 2025

8:03

AI-Breakdown | KW 15, 2025 – Bilder, Musik & Agenten

diese Woche gab es erneut eine wahre Flut an spannenden Updates aus der KI-Welt. Im Fokus standen Bild- und Videogenerierung, neue Sprachmodelle sowie praxisnahe AI-Tools für Alltag und Business. Hier kommt unsere kompakte Zusammenfassung:

ChatGPT: Bildgenerierung jetzt auch für Free-User

Kostenlos testen: ChatGPT bietet sein KI-Bildmodell nun zeitlich limitiert auch für Nutzer des Gratisplans an. Laut Sam Altman liegt das Kontingent derzeit bei drei Bildern pro Tag. https://x.com/sama/status/1906867488320843823
Server am Limit: Nach der Einführung gab es in nur einer Stunde über 1 Million neue User! OpenAI drosselt voraussichtlich weitere Releases, um Kapazitäten zu sichern. https://techcrunch.com/2025/04/01/sam-altman-says-that-openais-capacity-issues-will-cause-product-delays/
OpenAI Academy & Open Language Model: Neben ChatGPT-Pro-Freimonaten für Studierende (USA & Kanada) hat OpenAI eine neue „OpenAI Academy“ gelauncht – mit Lernkursen rund um KI. Außerdem plant OpenAI ein eigenes Open-Source-LLM („open language model“) zu veröffentlichen. https://academy.openai.com

Konkurrenz: Ernie 4.5 schlägt GPT-4.5 im Schach

Das chinesische Modell Ernie 4.5 von Baidu trat gegen GPT-4.5 an und gewann 3:0. https://x.com/riyazmd774/status/1905883014707491075
Google Gemini 2.5 ist jetzt ebenfalls gratis zugänglich. Es glänzt vorwiegend durch sein enormes Kontextfenster (bis zu 1 Million Tokens) – ideal für umfangreiche Codereviews. https://arstechnica.com/gadgets/2025/03/googles-new-experimental-gemini-2-5-model-rolls-out-to-free-users/
Notebook LM bei Google erhält stetige Updates, etwa zur automatischen Quellensuche und besseren PDF-Verarbeitung. https://blog.google/technology/google-labs/notebooklm-discover-sources/

Neue KI-Agenten: Amazon Nova Act, Rabbit OS Intern & XAI-Übernahme

Amazon Nova Act: Amazons eigener KI-Agent, der eigenständig im Browser handeln kann (z. B. Wohnungssuche). https://techcrunch.com/2025/03/31/amazon-unveils-nova-act-an-ai-agent-that-uses-a-web-browser/
Rabbit OS Intern: Baut automatisierte Abläufe ähnlich „Manis“ (bekannter Desktop-Agent). Jetzt auch ohne Rabbit-Hardware nutzbar; in Beta, mit limitierter Task-Anzahl. https://www.rabbit.tech/newsroom/rabbit-os-intern
xAI kauft X: Elon Musks KI-Firma, übernimmt offiziell die Plattform X (ehem. Twitter). So soll ein freierer Datenzugang für Trainingszwecke möglich werden. https://x.com/elonmusk/status/1905731750275510312

Apple & Adobe: Updates für Vision Pro und Premiere

Apple Intelligence: KI-Features (Texterkennung, Bilderzeugung, Siri-Verbesserungen) in weiteren Sprachen verfügbar, darunter auch Deutschland. Außerdem KI-Funktionalitäten für Vision Pro via Update. https://www.apple.com/newsroom/2025/03/apple-intelligence-features-expand-to-new-languages-and-regions-today/ https://www.apple.com/newsroom/2025/03/apple-intelligence-comes-to-apple-vision-pro-today-with-visionos-2-4/
Adobe Premiere: Neue AI-Funktionen zur automatischen Verlängerung von Video-Clips und Soundeffekten. Ideal für präzisere Schnitte, ohne extra B-Roll drehen zu müssen. https://www.theverge.com/news/641270/adobe-premiere-pro-generative-extend-generally-available

Videogenerierung boomt: Runway Gen-4, Higgsfield & Luma AI

Runway Gen-4: Liefert teilweise schon auf „V2-Niveau“. Kurze Test-Clips (5 Sekunden) wirken deutlich realistischer. https://x.com/runwayml/status/1906718935778545964
Higgsfield AI & Luma AI: Bieten neuartige Kamerafahrten (Robo-Arm, 360°-Orbit, Dolly Zoom). Wer motion-lastige Clips kreieren möchte, findet hier spannende Tools. https://x.com/higgsfield_ai/status/1906748655702265901 https://lumalabs.ai/news/camera-motion-concepts

Bild- & Text-Editing: Krea, ElevenLabs & mehr

Krea AI: Komplett überarbeitetes Interface, inkl. 3D-Tools und „Natural Language Image Editing“. https://x.com/krea_ai/status/1907101512670609762 https://x.com/krea_ai/status/1906772402853351594
ElevenLabs Actor Mode: Ermöglicht echte „Regieanweisungen“ an KI-Stimmen. Man kann seine Stimme hochladen und mit KI-Skript verknüpfen. https://x.com/elevenlabsio/status/1905653402429723110
Minimax & Mureka: Neue Möglichkeiten zur Spracherzeugung und Musikkomposition – z.B. Audio-Book-Erstellung mit wenigen Klicks oder eigene Songs generieren. https://x.com/MiniMax__AI/status/1906720764885180775

Coding im KI-Zeitalter: Windsurf & Co.

Windsurf: Ab sofort Deploy-Funktionen direkt im Tool – kein externer Hosting-Dienst mehr nötig. https://x.com/windsurf_ai/status/1907497638267924566
Devon 2.0: Cognition Labs bringt eine günstigere Variante (Pay-as-you-go) seines 200-Dollar-Assistenten.
Vibe Code: (Noch in der Entwicklung) Apps direkt auf dem Smartphone zusammenklicken und deployen. https://x.com/vibecodeapp/status/1907587136330805578

KI im Bildungs- und Social-Sektor

Claude for Education: Sprachmodell, das Studierenden keine fertigen Lösungen präsentiert, sondern beim Lernprozess begleitet. https://www.anthropic.com/news/introducing-claude-for-education
Tinder-AI-Spiel: Nutzer üben Flirtversuche gegen einen Chatbot – der vergibt dann Bewertungen wie „+3 Charme“. https://techcrunch.com/2025/04/01/tinders-new-ai-powered-game-assesses-your-flirting-skills/
Brainwaves to Voice: Spektakuläre Technologie, die Hirnströme in Echtzeit in gesprochene Sprache umwandelt und so stummen Personen Kommunikation ermöglicht. https://studyfinds.org/brain-waves-to-voice-revolutionary-technology-gives-speech-to-the-speechless/

Meta: Llama 4 und neue Modelle

Scout & Maverick: Zwei Modelle aus der Llama-4-Familie sind bereits in Meta AI (WhatsApp, Messenger) integriert. https://ai.meta.com/blog/llama-4-multimodal-intelligence/
Behemoth: 288 Mrd. aktive Parameter, übertrifft laut Meta GPT-4.5 in vielen Tests.
Llama 4 Reasoning: Ein spezielles Modell für fortgeschrittenes Schließen und Faktenprüfung soll in Kürze folgen.
Aber Vorsicht bei Benchmarks: Einige Modellversionen sind nur Testoptimierungen und unterscheiden sich vom später öffentlich verfügbaren Release. https://www.golem.de/news/ki-modellfamilie-meta-bringt-llama-4-mit-multimodalen-faehigkeiten-2504-195066.html

Midjourney V7

Höhere Bildqualität durch neue Architektur und individualisierte Voreinstellungen (Vorab-Training durch das Bewerten eigener Bildpräferenzen).
Turbo & Relax: Mehr Leistung, doch auch mehr Ressourcenverbrauch.
Draft Mode: Sehr schnelle „Skizzen“ zum halben Preis, anschließend auf Knopfdruck verbesserbar. https://x.com/midjourney/status/1908012961840672947

Wohin führt der KI-Hype?

Die große Frage bleibt: Wie integrieren wir diese rasant fortschreitenden Technologien sinnvoll und verantwortungsvoll im Alltag, Wirtschaft und Forschung? Schreibt uns gerne eure Gedanken dazu!

Bis zum nächsten Newsletter und wie immer: Bleibt neugierig!

Herzliche Grüße,

Tobit

Themen: KI Neuigkeiten

Vorheriger Artikel

← AI-Breakdown | KW 14, 2025 – Bilder & Spitzenmodelle

Nächster Artikel

AI-Breakdown | KW 16, 2025 – Llama 4, 4.1 & 50 Jahre Microsoft →

AI-Breakdown | KW 15, 2025 – Bilder, Musik & Agenten

AI-Breakdown | KW 15, 2025 – Bilder, Musik & Agenten

ChatGPT: Bildgenerierung jetzt auch für Free-User

Konkurrenz: Ernie 4.5 schlägt GPT-4.5 im Schach

Neue KI-Agenten: Amazon Nova Act, Rabbit OS Intern & XAI-Übernahme

Apple & Adobe: Updates für Vision Pro und Premiere

Videogenerierung boomt: Runway Gen-4, Higgsfield & Luma AI

Bild- & Text-Editing: Krea, ElevenLabs & mehr

Coding im KI-Zeitalter: Windsurf & Co.

KI im Bildungs- und Social-Sektor

Meta: Llama 4 und neue Modelle

Midjourney V7

Wohin führt der KI-Hype?

AI-Breakdown Newsletter

Das könnte Sie auch interessieren

AI-Breakdown | KW 16, 2024 – Jeder braucht Chips, Blutspuren, Musik

AI-Breakdown | KW 5, 2024 – Fake Biden, schlaue Browser, schöne Videos und vieles mehr

AI-Breakdown | KW 14, 2025 – Bilder & Spitzenmodelle

KI Social Media Playbook

Verpassen Sie die KI-Revolution nicht!