KI-Agenten helfen, intelligenter zu suchen: Wie EnCompass die LLM-Leistung steigert
Ein neuer Horizont: KI-Agenten verändern den Arbeitsplatz
In der heutigen schnelllebigen, technologiegetriebenen Welt ist die künstliche Intelligenz (KI) zu einem stillen, aber effizienten Assistenten geworden, der vielen Fachleuten hilft. Vom Wissenschaftler, der eine bahnbrechende Forschungsidee entwickelt, bis hin zum CEO, der seine Personal- und Finanzressourcen optimieren möchte - KI, insbesondere KI-Agenten, sind die Werkzeuge, von denen sie nie wussten, dass sie sie brauchen. Diese KI-Agenten arbeiten als halbautonome Softwaresysteme und werden zunehmend eingesetzt, um große Sprachmodelle (LLMs) zu nutzen, um Probleme zu lösen und Aufgaben schnell zu erledigen.
LLMs spielen aufgrund ihrer Anpassungsfähigkeit und Effizienz eine noch stärkere Rolle, wenn sie mit KI-Agenten gepaart werden. Eine ihrer weithin anerkannten Anwendungen ist die Automatisierung der Übersetzung veralteter Codebasen in moderne Programmiersprachen. Ein Softwareunternehmen kann beispielsweise ein LLM einsetzen, um eine Programmierdatei nach der anderen zu übersetzen und diese dann zu testen. Dieser Prozess kann jedoch mühsam und zeitaufwändig sein, wenn das LLM Fehler macht und diese manuell behoben werden müssen.
EnCompass: Eine Innovation zur Vereinfachung des Prozesses
Dieses Rätsel führte zur Entwicklung von EnCompass von Forschern des MIT's Computer Science and AI Laboratory (CSAIL) und Asari AI. EnCompass ist ein hochmodernes Framework, das KI-Agenten befähigt, automatisch zurückzugehen und es erneut zu versuchen, wenn LLMs auf Fehler stoßen. Außerdem macht es die langwierigen Fehlerbehandlungscodes überflüssig, die Programmierer benötigen.
Encompass zeichnet sich durch seine Fähigkeit aus, die Laufzeit des Programms zu klonen. Dies ermöglicht die gleichzeitige Ausführung mehrerer Lösungsversuche. Mit anderen Worten: Es werden nicht nur ein Pfad, sondern mehrere mögliche Ergebnisse untersucht, um die optimalste Lösung zu finden. Mit EnCompass können Entwickler bestimmte Operationen, wie z. B. LLM-Aufrufe, markieren, bei denen die Ergebnisse variieren können. Diese Kontrollpunkte, die so genannten ‘Branchpoints’, ermöglichen es dem Programm, mehrere Szenarien zu untersuchen, wie in einer "Choose-your-own-Adventure"-Geschichte, um die bestmögliche Lösung zu finden.
Außerdem können die Benutzer eine Strategie für die Navigation in diesen Zweigen auswählen oder definieren. EnCompass unterstützt eine Vielzahl von vorgefertigten Suchstrategien wie die Monte-Carlo-Baumsuche und die Balkensuche. Alternativ dazu können die Benutzer benutzerdefinierte Strategien entwickeln, die speziell auf ihre Aufgaben zugeschnitten sind.
Die Vorteile des Einsatzes von EnCompass sind überragend. In einem Test, bei dem EnCompass von einem KI-Agenten für die Übersetzung von Java-Code-Repositories in Python verwendet wurde, konnte die für die Implementierung der Suche erforderliche Code-Menge um 82% reduziert werden. Dies führte zu einer Einsparung von 348 Codezeilen. Außerdem wurde die Genauigkeit um 15-40% über fünf verschiedene Repositories hinweg verbessert, wenn eine zweistufige Strahlensuchstrategie verwendet wurde.
“Mit EnCompass haben wir die Suchstrategie vom zugrunde liegenden Arbeitsablauf des KI-Agenten losgelöst. Dadurch können die Programmierer frei mit verschiedenen Suchstrategien experimentieren, um die effektivste zu finden”, sagt Zhening Li ’25, MEng ’25, Doktorand am MIT EECS und Forscher am CSAIL.
Die Zukunft von EnCompass und KI-gesteuerter Softwareentwicklung
Encompass hat vielversprechende Ergebnisse bei der Verwendung für in Python implementierte Agenten gezeigt, die LLMs aufrufen. Es kann umfangreiche Code-Bibliotheken verwalten, wissenschaftliche Experimente entwerfen und sogar komplexe Hardware-Baupläne wie Raketen entwerfen. Der derzeitige Erfolg von EnCompass ist jedoch eher auf Agenten anwendbar, die einem bestimmten programmatischen Arbeitsablauf folgen, und es arbeitet weniger effektiv mit Agenten, die vollständig von LLMs gesteuert werden.
In den kommenden Jahren plant das EnCompass-Team, seine Funktionalität auf universellere Suchrahmen zu erweitern. Sie wollen das System bei hochkomplexen Aufgaben testen und sein Potenzial für die Zusammenarbeit zwischen KI-Agenten und Menschen untersuchen, z. B. bei der gemeinsamen Entwicklung von Hardware oder der Übersetzung umfangreicher Codebasen.
EnCompass markiert somit einen entscheidenden Moment in der Entwicklung von KI-Agenten und suchbasierten Techniken, die die Arbeitsabläufe in der Softwareentwicklung revolutionieren. Durch die präzise Unterscheidung zwischen der Logik eines Agenten und seiner Suchstrategie schafft EnCompass eine solide Grundlage für die Konstruktion systematischer, zuverlässiger und leistungsstarker KI-Systeme.
Einen ausführlicheren Bericht finden Sie in dem Originalartikel unter MIT-Nachrichten.