In today’s fast-paced, tech-driven world, artificial intelligence (AI) has become a silent yet efficient assistant aiding many professionals. From a scientist brainstorming a ground-breaking research idea to a CEO looking to optimize human resources and finance, AI, specifically AI agents, are the tools they never knew they needed. Operating as semi-autonomous software systems, these AI agents are increasingly used to leverage large language models (LLMs) to solve issues and rapidly complete tasks.
LLMs spielen aufgrund ihrer Anpassungsfähigkeit und Effizienz eine noch stärkere Rolle, wenn sie mit KI-Agenten gepaart werden. Eine ihrer weithin anerkannten Anwendungen ist die Automatisierung der Übersetzung veralteter Codebasen in moderne Programmiersprachen. Ein Softwareunternehmen kann beispielsweise ein LLM einsetzen, um eine Programmierdatei nach der anderen zu übersetzen und diese dann zu testen. Dieser Prozess kann jedoch mühsam und zeitaufwändig sein, wenn das LLM Fehler macht und diese manuell behoben werden müssen.
Dieses Rätsel führte zur Entwicklung von EnCompass von Forschern des MIT's Computer Science and AI Laboratory (CSAIL) und Asari AI. EnCompass ist ein hochmodernes Framework, das KI-Agenten befähigt, automatisch zurückzugehen und es erneut zu versuchen, wenn LLMs auf Fehler stoßen. Außerdem macht es die langwierigen Fehlerbehandlungscodes überflüssig, die Programmierer benötigen.
Encompass stands out with its ability to clone the program’s runtime. This allows for simultaneous execution of multiple solution attempts. In other words, it explores multiple possible outcomes, not just one path, to find the most optimal resolution. With EnCompass, developers can earmark particular operations, such as LLM calls, where results can vary. These checkpoints, known as ‘branchpoints’, permit the program to explore multiple scenarios like in a choose-your-own-adventure story, finding the best possible conclusion.
Außerdem können die Benutzer eine Strategie für die Navigation in diesen Zweigen auswählen oder definieren. EnCompass unterstützt eine Vielzahl von vorgefertigten Suchstrategien wie die Monte-Carlo-Baumsuche und die Balkensuche. Alternativ dazu können die Benutzer benutzerdefinierte Strategien entwickeln, die speziell auf ihre Aufgaben zugeschnitten sind.
Die Vorteile des Einsatzes von EnCompass sind überragend. In einem Test, bei dem EnCompass von einem KI-Agenten für die Übersetzung von Java-Code-Repositories in Python verwendet wurde, konnte die für die Implementierung der Suche erforderliche Code-Menge um 82% reduziert werden. Dies führte zu einer Einsparung von 348 Codezeilen. Außerdem wurde die Genauigkeit um 15-40% über fünf verschiedene Repositories hinweg verbessert, wenn eine zweistufige Strahlensuchstrategie verwendet wurde.
“With EnCompass, we’ve detached the search strategy from AI agent’s underlying workflow. This allows programmers to experiment freely with different search strategies to discover the most effective one,” said MIT EECS PhD student and CSAIL researcher, Zhening Li ’25, MEng ’25.
Encompass hat vielversprechende Ergebnisse bei der Verwendung für in Python implementierte Agenten gezeigt, die LLMs aufrufen. Es kann umfangreiche Code-Bibliotheken verwalten, wissenschaftliche Experimente entwerfen und sogar komplexe Hardware-Baupläne wie Raketen entwerfen. Der derzeitige Erfolg von EnCompass ist jedoch eher auf Agenten anwendbar, die einem bestimmten programmatischen Arbeitsablauf folgen, und es arbeitet weniger effektiv mit Agenten, die vollständig von LLMs gesteuert werden.
In den kommenden Jahren plant das EnCompass-Team, seine Funktionalität auf universellere Suchrahmen zu erweitern. Sie wollen das System bei hochkomplexen Aufgaben testen und sein Potenzial für die Zusammenarbeit zwischen KI-Agenten und Menschen untersuchen, z. B. bei der gemeinsamen Entwicklung von Hardware oder der Übersetzung umfangreicher Codebasen.
EnCompass markiert somit einen entscheidenden Moment in der Entwicklung von KI-Agenten und suchbasierten Techniken, die die Arbeitsabläufe in der Softwareentwicklung revolutionieren. Durch die präzise Unterscheidung zwischen der Logik eines Agenten und seiner Suchstrategie schafft EnCompass eine solide Grundlage für die Konstruktion systematischer, zuverlässiger und leistungsstarker KI-Systeme.
Einen ausführlicheren Bericht finden Sie in dem Originalartikel unter MIT-Nachrichten.
Diese Website verwendet Cookies.