AI-Breakdown | KW 20, 2025 – LegoGPT, Transkription & Windsurf Übernahme
AI-Breakdown | KW 20, 2025 – LegoGPT, Transkription & Windsurf Übernahme
Diese Woche trifft sich, was scheinbar nicht zusammenpasst: Künstliche Intelligenz und unsere heiß geliebten Klemmbausteine. Natürlich schauen wir auch drauf, was es abseits der Klemmbausteine Neues in der KI-Welt gegeben hat.
LegoGPT – Bauanleitung per Textbefehl
Ein Forschungsteam der Carnegie‑Mellon‑Universität hat LegoGPT vorgestellt. Gib dem System eine kurze Beschreibung – etwa „Frachtschiff mit Kran“ – und Sekunden später spuckt es eine komplette Schritt-für-Schritt-Anleitung aus. Besonders clever: LegoGPT prüft jede Lage sofort auf Stabilität. Wackelt etwas, wird der Abschnitt neu durchdacht, bis alles hält. Die Forschenden setzen dafür auf Llama 3.2, der Code ist bereits auf GitHub verfügbar. Die Größe der Bauwerke und die Variation sind limitiert. https://www.golem.de/news/klemmbausteine-ki-liefert-lego-bauanleitungen-ueber-text-prompt-2505-196064.html https://avalovelace1.github.io/LegoGPT/ https://huggingface.co/spaces/cmu-gil/LegoGPT-Demo
Hörtipp für alle Klemmbaustein-Verrückten
Wenn euch solche Themen begeistern, schaut (besser: hört) doch mal bei AOBricks – Der Klemmbausteine Podcast vorbei. Zusammen mit Felix spreche ich dort über alles, was Stein auf Stein steckt: Lego, Cobi, BlueBrixx und natürlich neue KI‑Gadgets wie LegoGPT. Wir schwärmen über Highlights, meckern auch mal über Flops – und entdecken dabei jedes Mal wieder das Kind in uns.
🎧 Jetzt reinhören: Einfach „AOBricks Podcast“ in eurem Player suchen und abonnieren. https://aobricks.podigee.io/
OpenAI‑Modelle endlich übersichtlich
OpenAI erklärt in einem neuen Leitfaden, wann sich welches GPT‑Modell lohnt. Kurzfassung:
-
GPT‑4.0 für Alltag, Websuche und Bilder.
-
GPT‑4.5 (bald abgeschaltet) für empathische Texte.
-
GPT‑0 3 für lange Analysen und komplexe Aufgaben. Der Überblick spart Zeit – ab in die Lesezeichen!
https://help.openai.com/en/articles/11165333-chatgpt-enterprise-models-limits
Video‑Avatar in 60 Sekunden
HeyGen „Avatar 4“ braucht nur ein Foto plus Sprachaufnahme und liefert ein verblüffend synchrones Talking‑Head‑Video. Lip‑Sync sitzt, sogar Profilbilder funktionieren. Das einzige Risiko: KI‑Hände, die plötzlich auftauchen. https://app.heygen.com/guest/videos/ab26b60984234f189e770f22ef903826
Effekte zum Mitnehmen
Higgsfield „Effects Mix“ lässt Bild‑ und Videoeffekte frei kombinieren. Soul‑Jump + Feuer? Kein Problem. Wer bisher Pika mochte, bekommt hier noch mehr Spielraum. https://x.com/higgsfield_ai
Turbo‑Transkription von Nvidia
Ein neues Open‑Source‑Modell schreibt eine Stunde Audio in einer (!) Sekunde ab – bei unter sieben Prozent Fehlerquote. Auf Hugging Face sofort testbar und gratis. https://venturebeat.com/ai/nvidia-launches-fully-open-source-transcription-ai-model-parakeet-tdt-0-6b-v2-on-hugging-face/ https://huggingface.co/spaces/nvidia/parakeet-tdt-0.6b-v2
Netflix wird gesprächig
Der Streaming‑Dienst testet eine KI‑Suche auf iOS: „Ich brauche etwas Lustiges und Kurzes“ reicht künftig als Anfrage. Zusätzlich kommt ein vertikaler Clip‑Feed im TikTok‑Stil. https://about.netflix.com/en/news/unveiling-our-innovative-new-tv-experience
Gemini 2.5 Pro hebt Coding auf ein neues Level
Google spendiert seinem Spitzenmodell Videoverständnis: Ein YouTube‑Tutorial genügt, und Gemini baut die gezeigte App nach. Im AI‑Studio schon anspielbar – inklusive Bild‑zu‑Code‑Experimente. https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/
Bilder bearbeiten mit Gemini
Die neue Image‑API tauscht Gegenstände zwischen Fotos oder setzt auf Knopfdruck Sonnenbrillen auf den Mond. Entwickler können sofort loslegen. https://developers.googleblog.com/en/generate-images-gemini-2-0-flash-preview/
Claude bekommt Websuche
Anthropic öffnet die Web‑Recherche jetzt auch in der API. Praktisch für alle, die Apps rund um aktuelle Daten bauen wollen. https://www.anthropic.com/news/web-search-api
GitHub trifft ChatGPT
Repositories lassen sich direkt in „Deep Research“ einbinden. Ganzer Code‑Stapel als Kontext – ideal für Refactoring oder Bug-Jagd. https://x.com/OpenAIDevs/status/1920556386083102844
OpenAI führt Verstärkungs‑Feintuning ein
Eigene Fachantworten lassen sich jetzt „belohnen“ oder „abstrafen“. So trimmt ihr Modelle gezielt auf eure Unternehmenssprache. https://x.com/OpenAIDevs/status/1920531856426143825
Windsurf Wave 8 und OpenAI‑Übernahme
Die beliebte KI‑IDE rollt stetig neue Features aus (Pull‑Request‑Checks, Docs‑Import). Bloomberg meldet: OpenAI kauft Windsurf für drei Milliarden Dollar. https://windsurf.com/blog/windsurf-wave-8-teams-and-enterprise https://www.bloomberg.com/news/articles/2025-05-06/openai-reaches-agreement-to-buy-startup-windsurf-for-3-billion
Apple & Anthropic planen Xcode‑Upgrade
Gerüchten zufolge soll das nächste Xcode Claude‑Sonnet als Co‑Pilot integrieren. Der Kampf um die „Vibe‑Coder“ geht weiter. https://www.bloomberg.com/news/articles/2025-05-02/apple-anthropic-team-up-to-build-ai-powered-vibe-coding-platform
Preiswerter Code‑Partner von Mistral
Das neue Modell kostet nur 0,40 $ pro Million Eingabetokens und liefert Benchmarks auf GPT‑4‑Mini‑Niveau – spannend für Sparfüchse. https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/
OpenAI strukturiert sich um
Statt klassischem Profit‑Unternehmen wird OpenAI nun eine Public‑Benefit‑Corporation. Mehr Flexibilität bei Gewinnen, weniger Streit um Gemeinwohl. https://openai.com/index/evolving-our-structure/
Amazons Roboter spürt, was er anfasst
„Vulcan“ erkennt Druck und greift Pakete entsprechend sanft oder fest – ein Schritt Richtung vollautomatisiertes Lager. https://www.aboutamazon.com/news/operations/amazon-vulcan-robot-pick-stow-touch
Kundensupport: Klarna holt Menschen zurück
Nach AI‑First‑Experimenten setzt das Fintech wieder stärker auf persönliche Betreuung. Qualität schlägt reine Kostenoptimierung. https://www.golem.de/news/wende-beim-kundensupport-klarna-hat-jetzt-ki-kater-2505-196076.html
AI-Breakdown Newsletter
Verpassen Sie die KI-Revolution nicht! Wichtige News, Entwicklungen, Trends und Diskussionen rund um KI
Das könnte Sie auch interessieren
Verwandte Themen

AI-Breakdown | KW 19, 2025 – Meta, OpenAI & Google

AI-Breakdown | KW 21, 2025 – selbst verbessern, weniger Trainingsdaten & Programmieragenten
