AI-Breakdown | KW 30, 2025 – Gold-Niveau, Materialforschung & Trickserei

3 min lesen
Juli 2025
AI-Breakdown | KW 30, 2025 – Gold-Niveau, Materialforschung & Trickserei
6:08

AI-Breakdown | KW 30, 2025 – Gold-Niveau, Materialforschung & Trickserei

die Welt der künstlichen Intelligenz stand auch diese Woche nicht still. Von mächtigen neuen KI-Agenten, die ganze Computer steuern, über überraschende Übernahmen in der Start-up-Szene bis zu neuen Modellen und Werkzeugen – hier ist Ihr kompakter Überblick über die wichtigsten Neuigkeiten.

OpenAI startet die Agenten-Offensive

OpenAI hat diese Woche gleich mehrere Fortschritte im Bereich der KI-Agenten gezeigt:

  • ChatGPT bekommt einen Computer: Mit dem neuen „ChatGPT Agent“ erhält das KI-Modell die Fähigkeit, einen eigenen virtuellen Computer zu steuern. In einer Vorführung konnte der Agent selbstständig Reisen buchen, Präsentationen erstellen, online einkaufen und sich mit Anwendungen wie Gmail oder GitHub verbinden. Von einer solchen Anbindung rät OpenAI-Chef Sam Altman noch ab. https://openai.com/index/introducing-chatgpt-agent/

  • Agenten für Excel und PowerPoint: Berichten zufolge entwickelt OpenAI spezielle Agenten, die direkt im Chat Tabellenkalkulationen und Präsentationen erstellen können. Damit tritt OpenAI in direkten Wettbewerb mit den Büro-Anwendungen von Microsoft und Google. Erste Tests beschreiben die Funktion aber noch als „langsam und fehleranfällig“. https://www.livemint.com/technology/tech-news/chatgpt-may-soon-edit-excel-and-powerpoint-files-natively-challenging-microsoft-office-report-11752665586822.html

  • Fast der beste Programmierer: Ein autonomer KI-Agent von OpenAI, hat bei einem internationalen Programmierwettbewerb in Tokio den zweiten Platz belegt und wurde nur von einem menschlichen Teilnehmer geschlagen. Dies unterstreicht die rasant wachsenden Fähigkeiten von KI im Bereich der Softwareentwicklung. https://x.com/andresnds/status/1945655797314154762

  • Gold-Niveau in der Mathematik: Ein experimentelles Sprachmodell von OpenAI, soll bei einer Simulation der Internationalen Mathematik-Olympiade eine Leistung auf Gold-Niveau erzielt haben. Es löste fünf von sechs komplexen Problemen fehlerfrei – ein langjähriges Ziel in der KI-Forschung. https://x.com/alexwei_/status/1946477742855532918

Überraschungen und Milliarden im Start-up-Sektor

  • Cognition übernimmt Windsurf: Nach einem wochenlangen Hin und Her hat Cognition AI (die Firma hinter dem Programmier-Assistenten „Devin“) das Konkurrenz-Start-up Windsurf übernommen. Zuvor war ein geplanter Verkauf von Windsurf an OpenAI geplatzt und wichtige Führungskräfte waren zu Google gewechselt. Die verbliebenen Mitarbeiter und die Technologie von Windsurf gehören nun zu Cognition. https://windsurf.com/blog/windsurfs-next-chapter

  • 2 Milliarden für Thinking Machines Lab: Das von der ehemaligen OpenAI-Technikchefin Mira Murati gegründete Start-up hat in einer frühen Finanzierungsrunde 2 Milliarden US-Dollar eingesammelt. Murati kündigte an, dass ihr Unternehmen in den nächsten Monaten ein erstes Produkt vorstellen wird, das auf multimodale KI und die Zusammenarbeit mit Forschern setzt. https://x.com/miramurati/status/1945166365834535247

Neue Modelle und nützliche Werkzeuge

Spannendes aus der KI-Forschung

  • Selbststeuerndes Labor beschleunigt Materialforschung: Forscher haben ein KI-gesteuertes Labor entwickelt, das chemische Experimente zehnmal schneller durchführen kann als herkömmliche Methoden. Dies könnte die Entdeckung neuer Materialien für saubere Energie oder Elektronik drastisch beschleunigen. https://news.ncsu.edu/2025/07/fast-forward-for-self-driving-labs/

  • KI fällt auf Psychotricks herein: Eine Studie hat gezeigt, dass KI-Modelle wie GPT-4 mit psychologischen Überzeugungstaktiken, die auch bei Menschen funktionieren (z. B. durch Erzeugen von Verknappung oder Autorität), dazu gebracht werden können, unerwünschte Anfragen zu beantworten. https://gail.wharton.upenn.edu/research-and-insights/call-me-a-jerk-persuading-ai/

  • Ruf nach mehr Transparenz: Führende Forscher von OpenAI, DeepMind und anderen Institutionen fordern in einer gemeinsamen Veröffentlichung, die „Gedankenketten“ (also die schrittweisen Denkprozesse) von KI-Modellen genauer zu untersuchen. Sie sehen darin eine wichtige Möglichkeit, die Sicherheit zukünftiger Modelle zu gewährleisten. https://tomekkorbak.com/cot-monitorability-is-a-fragile-opportunity/cot_monitoring.pdf

Es bleibt unglaublich spannend, wie sich diese Werkzeuge weiterentwickeln und unseren Alltag verändern werden. Besonders die Fortschritte bei den autonom agierenden KI-Agenten zeigen, wohin die Reise geht.

Was ist Ihre Meinung zu diesen Entwicklungen? Ich freue mich auf einen Austausch in den Kommentaren!

Bis zur nächsten Ausgabe – bleiben Sie neugierig!

Herzliche Grüße

Tobit

newsletter-icon-green

AI-Breakdown Newsletter

Verpassen Sie die KI-Revolution nicht! Wichtige News, Entwicklungen, Trends und Diskussionen rund um KI

Jetzt abonnieren 

This is the sticky part of the sidebar. You can change the top position of the sticky sidebar and other in-page sticky elements by adjusting the 'Scroll offset' value in your Theme settings.