Guten Morgen, liebe KI-Begeisterte,
auch diese Woche gab es wieder zahlreiche Neuigkeiten aus der aufregenden Welt der Künstlichen Intelligenz. Von neuen Wegen der Bild- und Videobearbeitung bis zu spannenden Partnerschaften der großen Tech-Firmen: Hier findet ihr eine kompakte Zusammenfassung aller Höhepunkte.
Nano Banana für alle: Googles mächtiges Bildbearbeitungsmodell, offiziell „Gemini Flash 2.5 image“, ist jetzt für alle kostenlos zugänglich. Damit könnt ihr Bilder einfach per Texteingabe verändern – fast wie Magie. Neue Anwendungsfälle sind bereits aufgetaucht:
Orte beschriften: Ladet einen Screenshot von Google Earth hoch und lasst die KI interessante Orte mit Informationen versehen.
Fotos wiederherstellen: Selbst die allererste Fotografie der Geschichte wurde damit bereits erfolgreich restauriert.
Neue Perspektiven: Lasst euch aus einer Kartenansicht eine realistische Bodensicht generieren. https://blog.google/products/gemini/updated-image-editing-model/
Kling animiert zwischen den Bildern: Das Videomodell Kling hat eine neue Funktion, bei der man nur das erste und das letzte Bild einer Szene vorgibt. Die KI erzeugt dann flüssig alle Zwischenbilder. https://x.com/theomediaai/status/1960324049768182003
HeyGen verbessert digitale Zwillinge: Mit „Avatar IV“ werden die digitalen Abbilder von Personen noch realistischer. Gesten, Mimik und Bewegungen wirken natürlicher. Während die Lippensynchronisation deutlich besser geworden ist, klingt die Standardstimme oft noch etwas künstlich. https://x.com/joshua_xu_/status/1960341965398225295
Sync Labs ändert, was im Video gesagt wird: Mit „LipSync-2-Pro“ könnt ihr eine Videodatei hochladen, eine neue Tonspur hinzufügen und die KI passt die Lippenbewegungen an den neuen Text an. https://x.com/synclabs_so/status/1960009657302319150
Google:
Live-Übersetzung: Die Google Translate App kann jetzt Gespräche in Echtzeit übersetzen und bietet zudem eine neue Funktion zum Sprachenlernen, die an Duolingo erinnert. https://blog.google/products/translate/language-learning-live-translate/
Google Vids erhält ein Upgrade: In Googles Videopräsentationen können jetzt KI-generierte Videoclips und sprechende Avatare eingefügt werden. Außerdem lässt sich das Video nun durch einfaches Bearbeiten des Text-Transkripts schneiden. https://workspace.google.com/blog/product-announcements/create-and-edit-videos-with-gen-ai-in-google-vids?hl=en
Microsoft: Neue KI-Modelle: Microsoft hat zwei neue hauseigene Modelle vorgestellt. MAI-Voice-1 ist ein besonders ausdrucksstarkes Text-zu-Sprache-Modell, das Stimmen sehr natürlich und emotional klingen lässt. MAI-1-Preview ist ein neues Sprachmodell, das bereits getestet werden kann. https://microsoft.ai/news/two-new-in-house-models/
OpenAI: Gesprächs-KI für Entwickler: Die Technologie hinter dem flüssigen Gesprächsmodus der ChatGPT-App steht Entwicklern jetzt als Schnittstelle zur Verfügung, um sie in eigene Anwendungen einzubauen. https://openai.com/index/introducing-gpt-realtime/
Meta und Midjourney arbeiten zusammen: In einer überraschenden Ankündigung gab Meta bekannt, mit Midjourney zu kooperieren. Meta möchte die herausragende „ästhetische Technologie“ von Midjourney in zukünftige Produkte integrieren. Dies ist ein großer Schritt, da Midjourney seine Modelle bisher nie für andere geöffnet hat. https://x.com/alexandr_wang/status/1958983843169673367
Perplexity entschädigt Urheber: Der KI-Suchdienst Perplexity startet mit „Comet Plus“ ein neues Abo-Modell. Ein Großteil der Einnahmen (80 %) soll direkt an die Verlage und Nachrichtenseiten gehen, deren Inhalte für die Antworten genutzt werden. Ein wichtiger Schritt, um die Ersteller von Inhalten fair zu beteiligen. https://www.perplexity.ai/de/hub/blog/introducing-comet-plus
Anthropic testet Browser-Steuerung: Mit „Claude for Chrome“ wird eine Erweiterung getestet, die es der KI erlaubt, Aufgaben direkt im Browser des Nutzers auszuführen – etwa Webseiten zu bedienen oder Informationen zu suchen. https://www.anthropic.com/news/claude-for-chrome
Jailbreaking: KI gegen KI – kurz erklärt: Eine neue Angriffsmethode zeigt, wie eine KI eine andere dazu bringen kann, ihre Sicherheitsregeln zu brechen. Dabei geht es nicht um einen einzelnen Befehl, sondern um eine geschickte Gesprächsführung. Sogenannte „Reasoning“-Modelle (wie DeepSeek-R1) planen im Verborgenen mehrstufige Dialoge. Sie bauen Vertrauen zum Zielmodell auf und formulieren Anfragen immer wieder neu (z.B. als hypothetische Frage oder in Fachjargon), bis die Sicherheitsbarrieren umgangen werden. Nicht der einzelne Befehl zählt, sondern die Dramaturgie des Gesprächs. Mit immer stärkeren Modellen sinken die Kosten für solche Angriffe, was zu einer „Alignment-Regression“ führt – die Sicherheit wird also relativ gesehen schwächer. https://arxiv.org/pdf/2508.04039
Absolut. Hier sind die beiden Themen passend für den Newsletter formuliert. Ich habe sie in einem neuen Abschnitt namens „Forschung & Einblicke“ zusammengefasst, der direkt nach der Einleitung platziert werden kann.
In einer Studie haben OpenAI und das Biotech-Unternehmen Retro Biosciences gezeigt, wie KI den Prozess der Zellverjüngung revolutionieren kann. Bisher war es zwar möglich, erwachsene Zellen in einen jugendlichen Zustand zurückzuversetzen (ein Prozess, der 2012 mit dem Nobelpreis ausgezeichnet wurde), doch die Methode war sehr langsam und ineffizient. Hier kam eine speziell auf biologische Daten trainierte KI namens GPT-4b micro ins Spiel. Ihre Aufgabe war es, die für die Verjüngung zuständigen Proteine neu zu gestalten, um sie schlagkräftiger zu machen. Das Ergebnis: Die von der KI entworfenen Proteine waren über 50-mal effizienter darin, Zellen zu verjüngen. Dieser Durchbruch zeigt, wie KI zu einem unverzichtbaren Werkzeug in der Grundlagenforschung wird und die Entwicklung neuer Therapien massiv beschleunigen könnte. https://openai.com/index/accelerating-life-sciences-research-with-retro-biosciences/
Eine neue Studie von Anthropic gibt spannende Einblicke, wofür Lehrkräfte die KI Claude im Alltag einsetzen. Die Analyse von zehntausenden Gesprächen zeigt: KI wird weniger zum Unterrichten selbst, sondern vor allem zur Automatisierung von Verwaltungsaufgaben und zur Vorbereitung genutzt. Die häufigsten Anwendungsfälle sind:
Unterrichtsplanung (57 %): Erstellung von Lehrplänen, Arbeitsblättern und Unterrichtsmaterialien.
Forschungsunterstützung (13 %): Hilfe bei der Recherche für akademische Arbeiten.
Bewertung von Schülerarbeiten (7 %): Erstellung von Bewertungsrastern und Auswertungen.
Am kontroversesten wurde das Thema Benotung diskutiert. Obwohl viele Lehrkräfte KI zur Automatisierung nutzten, hielten sie es gleichzeitig für eine der schwächsten Fähigkeiten der KI. https://www.anthropic.com/news/anthropic-education-report-how-educators-use-claude
YouTube bearbeitet Videos heimlich: Es kam heraus, dass YouTube im Hintergrund Videos von Nutzern mit KI „verbessert“ hat, um die Bildqualität zu schärfen. Dies führte jedoch dazu, dass einige Videos künstlich aussahen und den Erstellern unterstellt wurde, sie würden KI-generierte Inhalte hochladen. https://www.bbc.com/future/article/20250822-youtube-is-using-ai-to-edit-videos-without-permission
Elon Musks Pläne und Klagen: xAI verklagt Apple und OpenAI wegen angeblicher Wettbewerbsverzerrung im App Store. Gleichzeitig kündigte Musk ein neues Projekt namens „Macrohard“ an, eine Firma, die komplett auf KI-Software basieren soll. https://x.com/synclabs_so/status/1960009657302319150 https://x.com/elonmusk/status/1958852874236305793
Und zum Schluss …: In Kolumbien wurde ein Baby offiziell auf den Namen Chat Yippity getauft – inspiriert von ChatGPT. https://www.reddit.com/r/ChatGPT/comments/1mzmwri/baby_in_colombia_registered_as_chat_yipiti_name/
Wohin wird die Reise noch gehen, wenn KI unseren Alltag so kreativ und manchmal auch kurios durchdringt? Schreibt mir gerne eure Meinung dazu.
Wir lesen uns bei der nächsten Ausgabe – bleibt neugierig!
Herzliche Grüße
Tobit