Auch diese Woche gab es wieder zahlreiche Neuigkeiten aus der aufregenden Welt der Künstlichen Intelligenz. Während wir uns langsam an sprachbegabte Computer gewöhnen, steht der nächste große Sprung bevor: KI, die unsere physische Welt versteht. Dazu gibt es spannende Einblicke in neue Modelle von OpenAI und Google sowie Neuigkeiten aus Hollywood.
Hier findet ihr eine kompakte Zusammenfassung aller Höhepunkte.
World Labs & Dr. Fei-Fei Li: Die bekannte KI-Forscherin hat in einem neuen Aufsatz dargelegt, warum die bloße Sprachverarbeitung nicht ausreicht.
Das Problem: Aktuelle Sprachmodelle besitzen viel abstraktes Wissen, scheitern aber oft daran, räumliche Zusammenhänge, Entfernungen oder Bewegungen in der echten Welt zu verstehen.
Die Lösung: Sogenannte „Welt-Modelle“ (World Models). Diese sollen in der Lage sein, 3D-Umgebungen physikalisch korrekt zu erfassen und vorherzusagen, wie sich Dinge verändern.
Warum das wichtig ist: Dies ist der Schlüssel, um KI nützlich für die Robotik, die Medizin oder das Design zu machen. Unternehmen wie Google, Tencent und Lis eigenes „World Labs“ arbeiten bereits unter Hochdruck daran. https://drfeifei.substack.com/p/from-words-to-worlds-spatial-intelligence
Sakana AI Benchmark: Es gibt erste Berichte über die Leistungsfähigkeit von GPT-5 im Bereich logisches Denken.
Der Test: Sakana AI hat das Modell auf die Probe gestellt. GPT-5 war laut Berichten die erste KI, die ein komplettes 9x9 Sudoku-Rätsel lösen konnte.
Die Leistung: Das Modell erreichte eine Lösungsquote von 33 % – das ist fast doppelt so gut wie der bisherige Spitzenreiter.
Fazit: Auch wenn noch viele Rätsel ungelöst blieben, zeigt dies einen deutlichen Fortschritt im strukturierten Denken und der räumlichen Logik. https://pub.sakana.ai/sudoku-gpt5/
ElevenLabs Marktplatz: Das Stimmenklonen wird offiziell und legal. ElevenLabs hat seinen „Iconic Voice Marketplace“ gestartet.
Was ist neu?: Marken und Nutzer können nun lizenzierte KI-Stimmen von Prominenten nutzen.
Wer ist dabei?: Die Auswahl umfasst lebende Legenden wie den Schauspieler Michael Caine, aber auch verstorbene Ikonen wie Judy Garland, Burt Reynolds oder Marlene Dietrich (beispielhaft für historische Figuren), die in Zusammenarbeit mit den Nachlassverwaltern erstellt wurden.
Der Nutzen: Dies könnte eine ethisch saubere Alternative zu den vielen illegalen „Deepfakes“ im Netz bieten und eröffnet neue Möglichkeiten für Hörbücher oder Werbung. https://elevenlabs.io/iconic-marketplace
GPT-5.1 und neue Einstellungen: OpenAI hat mit GPT-5.1 eine aktualisierte Version seines Flaggschiffs veröffentlicht, die menschlicher wirken soll.
Stimmungsprofile: Nutzer können jetzt aus acht verschiedenen Persönlichkeiten wählen – von „Professionell“ über „Freundlich“ bis zu „Zynisch“.
Verbesserungen: Das Modell soll effizienter arbeiten und Anweisungen noch präziser befolgen.
Strategie: Der Start verlief vergleichsweise ruhig, was darauf hindeuten könnte, dass OpenAI in Zukunft eher auf regelmäßige, kleinere Updates setzt statt auf riesige Einzelveröffentlichungen. https://openai.com/index/gpt-5-1/
Anthropic stoppt Angriff: Ein spannender Fall von „KI gegen KI“: Anthropic hat eine Spionage-Kampagne aufgedeckt und gestoppt.
Der Vorfall: Eine mutmaßlich staatlich gelenkte Gruppe versuchte, das Modell „Claude“ für einen Cyberangriff zu missbrauchen, indem sie Aufgaben in harmlos wirkende Anfragen aufteilte.
Die Reaktion: Anthropic konnte den Angriff identifizieren. Experten sehen dies als Warnschuss: KI-Systeme, die eigenständig handeln können, stellen eine neue Herausforderung für die IT-Sicherheit dar. https://assets.anthropic.com/m/ec212e6566a0d47/original/Disrupting-the-first-reported-AI-orchestrated-cyber-espionage-campaign.pdf
Google DeepMind & SIMA 2: Google DeepMind hat mit SIMA 2 einen KI-Agenten vorgestellt, der Videospiele fast wie ein Mensch spielt.
Selbstlernend: Der Agent muss nicht speziell für ein Spiel trainiert werden. Er schaut sich den Bildschirm an, nutzt Maus und Tastatur und lernt durch Ausprobieren.
Leistung: In Tests konnte SIMA 2 in gänzlich fremden Spielumgebungen Aufgaben lösen, an denen Vorgängermodelle scheiterten. Vielleicht ist unser nächster Mitspieler im Online-Game bald eine KI? https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/
Time Magazine: Das Archiv aus 102 Jahren Zeitgeschichte lässt sich nun per KI durchsuchen und zusammenfassen. https://time.com/7332572/the-story-behind-the-time-ai-agent/
Urheberrecht: Ein Gericht in München entschied gegen OpenAI im Streit um Urheberrechte an Musiktexten – ein mögliches Signal für kommende Regelungen in Europa. https://www.golem.de/news/gema-klagte-wegen-chatgpt-landgericht-muenchen-urteilt-gegen-openai-2511-202063.html
Disney: Chef Bob Iger kündigte an, dass Disney+ bald KI-Tools nutzen könnte, mit denen Zuschauer eigene kurze Clips erstellen können. https://www.hollywoodreporter.com/business/digital/disney-plus-gen-ai-user-generated-content-1236426135/
NotebookLM: Die „Deep Research“-Funktion hält Einzug. Ebenso können Google-Tabellen und -Dokumente, verwendet werden. https://blog.google/technology/google-labs/notebooklm-deep-research-file-types/
Ein Blick in die Zukunft: Besonders das Thema der „Räumlichen Intelligenz“ finde ich faszinierend. Wenn KI nicht nur Texte schreibt, sondern die physische Welt versteht, stehen wir vor vollkommen neuen Anwendungen in der Robotik. Was denkt ihr: Wäre ein Roboter im Haushalt, der wirklich versteht, wo die Tasse steht, eher eine Hilfe oder unheimlich?
Schreibt mir gerne eure Meinung dazu!
Wir lesen uns wie immer bei der nächsten Ausgabe des Newsletters – und bis dahin gilt: bleibt neugierig!