AI-Breakdown | KW 20, 2025 – LegoGPT, Transkription & Windsurf Übernahme

3 min lesen
Mai 2025
AI-Breakdown | KW 20, 2025 – LegoGPT, Transkription & Windsurf Übernahme
7:02

AI-Breakdown | KW 20, 2025 – LegoGPT, Transkription & Windsurf Übernahme

Diese Woche trifft sich, was scheinbar nicht zusammenpasst: Künstliche Intelligenz und unsere heiß geliebten Klemmbausteine. Natürlich schauen wir auch drauf, was es abseits der Klemmbausteine Neues in der KI-Welt gegeben hat.

LegoGPT – Bauanleitung per Textbefehl

Ein Forschungsteam der Carnegie‑Mellon‑Universität hat LegoGPT vorgestellt. Gib dem System eine kurze Beschreibung – etwa „Frachtschiff mit Kran“ – und Sekunden später spuckt es eine komplette Schritt-für-Schritt-Anleitung aus. Besonders clever: LegoGPT prüft jede Lage sofort auf Stabilität. Wackelt etwas, wird der Abschnitt neu durchdacht, bis alles hält. Die Forschenden setzen dafür auf Llama 3.2, der Code ist bereits auf GitHub verfügbar. Die Größe der Bauwerke und die Variation sind limitiert. https://www.golem.de/news/klemmbausteine-ki-liefert-lego-bauanleitungen-ueber-text-prompt-2505-196064.html https://avalovelace1.github.io/LegoGPT/ https://huggingface.co/spaces/cmu-gil/LegoGPT-Demo

Hörtipp für alle Klemmbaustein-Verrückten

Wenn euch solche Themen begeistern, schaut (besser: hört) doch mal bei AOBricks – Der Klemmbausteine Podcast vorbei. Zusammen mit Felix spreche ich dort über alles, was Stein auf Stein steckt: Lego, Cobi, BlueBrixx und natürlich neue KI‑Gadgets wie LegoGPT. Wir schwärmen über Highlights, meckern auch mal über Flops – und entdecken dabei jedes Mal wieder das Kind in uns.

🎧 Jetzt reinhören: Einfach „AOBricks Podcast“ in eurem Player suchen und abonnieren. https://aobricks.podigee.io/

OpenAI‑Modelle endlich übersichtlich

OpenAI erklärt in einem neuen Leitfaden, wann sich welches GPT‑Modell lohnt. Kurzfassung:

  • GPT‑4.0 für Alltag, Websuche und Bilder.

  • GPT‑4.5 (bald abgeschaltet) für empathische Texte.

  • GPT‑0 3 für lange Analysen und komplexe Aufgaben. Der Überblick spart Zeit – ab in die Lesezeichen!

https://help.openai.com/en/articles/11165333-chatgpt-enterprise-models-limits

Video‑Avatar in 60 Sekunden

HeyGen „Avatar 4“ braucht nur ein Foto plus Sprachaufnahme und liefert ein verblüffend synchrones Talking‑Head‑Video. Lip‑Sync sitzt, sogar Profilbilder funktionieren. Das einzige Risiko: KI‑Hände, die plötzlich auftauchen. https://app.heygen.com/guest/videos/ab26b60984234f189e770f22ef903826

Effekte zum Mitnehmen

Higgsfield „Effects Mix“ lässt Bild‑ und Videoeffekte frei kombinieren. Soul‑Jump + Feuer? Kein Problem. Wer bisher Pika mochte, bekommt hier noch mehr Spielraum. https://x.com/higgsfield_ai

Turbo‑Transkription von Nvidia

Ein neues Open‑Source‑Modell schreibt eine Stunde Audio in einer (!) Sekunde ab – bei unter sieben Prozent Fehlerquote. Auf Hugging Face sofort testbar und gratis. https://venturebeat.com/ai/nvidia-launches-fully-open-source-transcription-ai-model-parakeet-tdt-0-6b-v2-on-hugging-face/ https://huggingface.co/spaces/nvidia/parakeet-tdt-0.6b-v2

Netflix wird gesprächig

Der Streaming‑Dienst testet eine KI‑Suche auf iOS: „Ich brauche etwas Lustiges und Kurzes“ reicht künftig als Anfrage. Zusätzlich kommt ein vertikaler Clip‑Feed im TikTok‑Stil. https://about.netflix.com/en/news/unveiling-our-innovative-new-tv-experience

Gemini 2.5 Pro hebt Coding auf ein neues Level

Google spendiert seinem Spitzenmodell Videoverständnis: Ein YouTube‑Tutorial genügt, und Gemini baut die gezeigte App nach. Im AI‑Studio schon anspielbar – inklusive Bild‑zu‑Code‑Experimente. https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/

Bilder bearbeiten mit Gemini

Die neue Image‑API tauscht Gegenstände zwischen Fotos oder setzt auf Knopfdruck Sonnenbrillen auf den Mond. Entwickler können sofort loslegen. https://developers.googleblog.com/en/generate-images-gemini-2-0-flash-preview/

Claude bekommt Websuche

Anthropic öffnet die Web‑Recherche jetzt auch in der API. Praktisch für alle, die Apps rund um aktuelle Daten bauen wollen. https://www.anthropic.com/news/web-search-api

GitHub trifft ChatGPT

Repositories lassen sich direkt in „Deep Research“ einbinden. Ganzer Code‑Stapel als Kontext – ideal für Refactoring oder Bug-Jagd. https://x.com/OpenAIDevs/status/1920556386083102844

OpenAI führt Verstärkungs‑Feintuning ein

Eigene Fachantworten lassen sich jetzt „belohnen“ oder „abstrafen“. So trimmt ihr Modelle gezielt auf eure Unternehmens­sprache. https://x.com/OpenAIDevs/status/1920531856426143825

Windsurf Wave 8 und OpenAI‑Übernahme

Die beliebte KI‑IDE rollt stetig neue Features aus (Pull‑Request‑Checks, Docs‑Import). Bloomberg meldet: OpenAI kauft Windsurf für drei Milliarden Dollar. https://windsurf.com/blog/windsurf-wave-8-teams-and-enterprise https://www.bloomberg.com/news/articles/2025-05-06/openai-reaches-agreement-to-buy-startup-windsurf-for-3-billion

Apple & Anthropic planen Xcode‑Upgrade

Gerüchten zufolge soll das nächste Xcode Claude‑Sonnet als Co‑Pilot integrieren. Der Kampf um die „Vibe‑Coder“ geht weiter. https://www.bloomberg.com/news/articles/2025-05-02/apple-anthropic-team-up-to-build-ai-powered-vibe-coding-platform

Preiswerter Code‑Partner von Mistral

Das neue Modell kostet nur 0,40 $ pro Million Eingabetokens und liefert Benchmarks auf GPT‑4‑Mini‑Niveau – spannend für Sparfüchse. https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/

OpenAI strukturiert sich um

Statt klassischem Profit‑Unternehmen wird OpenAI nun eine Public‑Benefit‑Corporation. Mehr Flexibilität bei Gewinnen, weniger Streit um Gemeinwohl. https://openai.com/index/evolving-our-structure/

Amazons Roboter spürt, was er anfasst

„Vulcan“ erkennt Druck und greift Pakete entsprechend sanft oder fest – ein Schritt Richtung voll­automatisiertes Lager. https://www.aboutamazon.com/news/operations/amazon-vulcan-robot-pick-stow-touch

Kundensupport: Klarna holt Menschen zurück

Nach AI‑First‑Experimenten setzt das Fintech wieder stärker auf persönliche Betreuung. Qualität schlägt reine Kosten­optimierung. https://www.golem.de/news/wende-beim-kundensupport-klarna-hat-jetzt-ki-kater-2505-196076.html

newsletter-icon-green

AI-Breakdown Newsletter

Verpassen Sie die KI-Revolution nicht! Wichtige News, Entwicklungen, Trends und Diskussionen rund um KI

Jetzt abonnieren 

This is the sticky part of the sidebar. You can change the top position of the sticky sidebar and other in-page sticky elements by adjusting the 'Scroll offset' value in your Theme settings.