Diese Woche trifft sich, was scheinbar nicht zusammenpasst: Künstliche Intelligenz und unsere heiß geliebten Klemmbausteine. Natürlich schauen wir auch drauf, was es abseits der Klemmbausteine Neues in der KI-Welt gegeben hat.
Ein Forschungsteam der Carnegie‑Mellon‑Universität hat LegoGPT vorgestellt. Gib dem System eine kurze Beschreibung – etwa „Frachtschiff mit Kran“ – und Sekunden später spuckt es eine komplette Schritt-für-Schritt-Anleitung aus. Besonders clever: LegoGPT prüft jede Lage sofort auf Stabilität. Wackelt etwas, wird der Abschnitt neu durchdacht, bis alles hält. Die Forschenden setzen dafür auf Llama 3.2, der Code ist bereits auf GitHub verfügbar. Die Größe der Bauwerke und die Variation sind limitiert. https://www.golem.de/news/klemmbausteine-ki-liefert-lego-bauanleitungen-ueber-text-prompt-2505-196064.html https://avalovelace1.github.io/LegoGPT/ https://huggingface.co/spaces/cmu-gil/LegoGPT-Demo
Wenn euch solche Themen begeistern, schaut (besser: hört) doch mal bei AOBricks – Der Klemmbausteine Podcast vorbei. Zusammen mit Felix spreche ich dort über alles, was Stein auf Stein steckt: Lego, Cobi, BlueBrixx und natürlich neue KI‑Gadgets wie LegoGPT. Wir schwärmen über Highlights, meckern auch mal über Flops – und entdecken dabei jedes Mal wieder das Kind in uns.
🎧 Jetzt reinhören: Einfach „AOBricks Podcast“ in eurem Player suchen und abonnieren. https://aobricks.podigee.io/
OpenAI erklärt in einem neuen Leitfaden, wann sich welches GPT‑Modell lohnt. Kurzfassung:
GPT‑4.0 für Alltag, Websuche und Bilder.
GPT‑4.5 (bald abgeschaltet) für empathische Texte.
GPT‑0 3 für lange Analysen und komplexe Aufgaben. Der Überblick spart Zeit – ab in die Lesezeichen!
https://help.openai.com/en/articles/11165333-chatgpt-enterprise-models-limits
HeyGen „Avatar 4“ braucht nur ein Foto plus Sprachaufnahme und liefert ein verblüffend synchrones Talking‑Head‑Video. Lip‑Sync sitzt, sogar Profilbilder funktionieren. Das einzige Risiko: KI‑Hände, die plötzlich auftauchen. https://app.heygen.com/guest/videos/ab26b60984234f189e770f22ef903826
Higgsfield „Effects Mix“ lässt Bild‑ und Videoeffekte frei kombinieren. Soul‑Jump + Feuer? Kein Problem. Wer bisher Pika mochte, bekommt hier noch mehr Spielraum. https://x.com/higgsfield_ai
Ein neues Open‑Source‑Modell schreibt eine Stunde Audio in einer (!) Sekunde ab – bei unter sieben Prozent Fehlerquote. Auf Hugging Face sofort testbar und gratis. https://venturebeat.com/ai/nvidia-launches-fully-open-source-transcription-ai-model-parakeet-tdt-0-6b-v2-on-hugging-face/ https://huggingface.co/spaces/nvidia/parakeet-tdt-0.6b-v2
Der Streaming‑Dienst testet eine KI‑Suche auf iOS: „Ich brauche etwas Lustiges und Kurzes“ reicht künftig als Anfrage. Zusätzlich kommt ein vertikaler Clip‑Feed im TikTok‑Stil. https://about.netflix.com/en/news/unveiling-our-innovative-new-tv-experience
Google spendiert seinem Spitzenmodell Videoverständnis: Ein YouTube‑Tutorial genügt, und Gemini baut die gezeigte App nach. Im AI‑Studio schon anspielbar – inklusive Bild‑zu‑Code‑Experimente. https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/
Die neue Image‑API tauscht Gegenstände zwischen Fotos oder setzt auf Knopfdruck Sonnenbrillen auf den Mond. Entwickler können sofort loslegen. https://developers.googleblog.com/en/generate-images-gemini-2-0-flash-preview/
Anthropic öffnet die Web‑Recherche jetzt auch in der API. Praktisch für alle, die Apps rund um aktuelle Daten bauen wollen. https://www.anthropic.com/news/web-search-api
Repositories lassen sich direkt in „Deep Research“ einbinden. Ganzer Code‑Stapel als Kontext – ideal für Refactoring oder Bug-Jagd. https://x.com/OpenAIDevs/status/1920556386083102844
Eigene Fachantworten lassen sich jetzt „belohnen“ oder „abstrafen“. So trimmt ihr Modelle gezielt auf eure Unternehmenssprache. https://x.com/OpenAIDevs/status/1920531856426143825
Die beliebte KI‑IDE rollt stetig neue Features aus (Pull‑Request‑Checks, Docs‑Import). Bloomberg meldet: OpenAI kauft Windsurf für drei Milliarden Dollar. https://windsurf.com/blog/windsurf-wave-8-teams-and-enterprise https://www.bloomberg.com/news/articles/2025-05-06/openai-reaches-agreement-to-buy-startup-windsurf-for-3-billion
Gerüchten zufolge soll das nächste Xcode Claude‑Sonnet als Co‑Pilot integrieren. Der Kampf um die „Vibe‑Coder“ geht weiter. https://www.bloomberg.com/news/articles/2025-05-02/apple-anthropic-team-up-to-build-ai-powered-vibe-coding-platform
Das neue Modell kostet nur 0,40 $ pro Million Eingabetokens und liefert Benchmarks auf GPT‑4‑Mini‑Niveau – spannend für Sparfüchse. https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/
Statt klassischem Profit‑Unternehmen wird OpenAI nun eine Public‑Benefit‑Corporation. Mehr Flexibilität bei Gewinnen, weniger Streit um Gemeinwohl. https://openai.com/index/evolving-our-structure/
„Vulcan“ erkennt Druck und greift Pakete entsprechend sanft oder fest – ein Schritt Richtung vollautomatisiertes Lager. https://www.aboutamazon.com/news/operations/amazon-vulcan-robot-pick-stow-touch
Nach AI‑First‑Experimenten setzt das Fintech wieder stärker auf persönliche Betreuung. Qualität schlägt reine Kostenoptimierung. https://www.golem.de/news/wende-beim-kundensupport-klarna-hat-jetzt-ki-kater-2505-196076.html