KI-Agenten helfen, intelligenter zu suchen: Wie EnCompass die LLM-Leistung steigert

Ein neuer Horizont: KI-Agenten verändern den Arbeitsplatz

In der heutigen schnelllebigen, technologiegetriebenen Welt ist künstliche Intelligenz (KI) zu einem stillen, aber effizienten Assistenten geworden, der vielen Fachleuten zur Seite steht. Vom Wissenschaftler, der eine bahnbrechende Forschungsidee entwickelt, bis hin zum CEO, der Personal- und Finanzressourcen optimieren möchte – KI, insbesondere KI-Agenten, sind die Werkzeuge, von denen sie nie wussten, dass sie sie brauchen. Diese KI-Agenten arbeiten als halbautonome Softwaresysteme und werden zunehmend eingesetzt, um große Sprachmodelle (LLMs) zu nutzen, Probleme zu lösen und Aufgaben zügig zu erledigen.

LLMs spielen aufgrund ihrer Anpassungsfähigkeit und Effizienz eine noch stärkere Rolle, wenn sie mit KI-Agenten gepaart werden. Eine ihrer weithin anerkannten Anwendungen ist die Automatisierung der Übersetzung veralteter Codebasen in moderne Programmiersprachen. Ein Softwareunternehmen kann beispielsweise ein LLM einsetzen, um eine Programmierdatei nach der anderen zu übersetzen und diese dann zu testen. Dieser Prozess kann jedoch mühsam und zeitaufwändig sein, wenn das LLM Fehler macht und diese manuell behoben werden müssen.

EnCompass: Eine Innovation zur Vereinfachung des Prozesses

Dieses Rätsel führte zur Entwicklung von EnCompass von Forschern des MIT's Computer Science and AI Laboratory (CSAIL) und Asari AI. EnCompass ist ein hochmodernes Framework, das KI-Agenten befähigt, automatisch zurückzugehen und es erneut zu versuchen, wenn LLMs auf Fehler stoßen. Außerdem macht es die langwierigen Fehlerbehandlungscodes überflüssig, die Programmierer benötigen.

Encompass zeichnet sich durch seine Fähigkeit aus, die Laufzeit des Programms zu klonen. Dies ermöglicht die gleichzeitige Ausführung mehrerer Lösungsversuche. Mit anderen Worten: Es untersucht mehrere mögliche Ergebnisse und nicht nur einen einzigen Pfad, um die optimale Lösung zu finden. Mit EnCompass können Entwickler bestimmte Operationen, wie beispielsweise LLM-Aufrufe, bei denen die Ergebnisse variieren können, gezielt markieren. Diese als ‘Zweigpunkte’ bezeichneten Kontrollpunkte ermöglichen es dem Programm, verschiedene Szenarien wie in einer „Wähle-dein-eigenes-Abenteuer“-Geschichte zu erkunden und so den bestmöglichen Ausgang zu finden.

Außerdem können die Benutzer eine Strategie für die Navigation in diesen Zweigen auswählen oder definieren. EnCompass unterstützt eine Vielzahl von vorgefertigten Suchstrategien wie die Monte-Carlo-Baumsuche und die Balkensuche. Alternativ dazu können die Benutzer benutzerdefinierte Strategien entwickeln, die speziell auf ihre Aufgaben zugeschnitten sind.

Die Vorteile des Einsatzes von EnCompass sind überragend. In einem Test, bei dem EnCompass von einem KI-Agenten für die Übersetzung von Java-Code-Repositories in Python verwendet wurde, konnte die für die Implementierung der Suche erforderliche Code-Menge um 82% reduziert werden. Dies führte zu einer Einsparung von 348 Codezeilen. Außerdem wurde die Genauigkeit um 15-40% über fünf verschiedene Repositories hinweg verbessert, wenn eine zweistufige Strahlensuchstrategie verwendet wurde.

“Mit EnCompass haben wir die Suchstrategie vom zugrunde liegenden Arbeitsablauf des KI-Agenten getrennt. So können Programmierer frei mit verschiedenen Suchstrategien experimentieren, um die effektivste zu finden”, sagte Zhening Li ’25, MEng ’25, Doktorand am MIT EECS und Forscher am CSAIL.

Die Zukunft von EnCompass und KI-gesteuerter Softwareentwicklung

Encompass hat vielversprechende Ergebnisse bei der Verwendung für in Python implementierte Agenten gezeigt, die LLMs aufrufen. Es kann umfangreiche Code-Bibliotheken verwalten, wissenschaftliche Experimente entwerfen und sogar komplexe Hardware-Baupläne wie Raketen entwerfen. Der derzeitige Erfolg von EnCompass ist jedoch eher auf Agenten anwendbar, die einem bestimmten programmatischen Arbeitsablauf folgen, und es arbeitet weniger effektiv mit Agenten, die vollständig von LLMs gesteuert werden.

In den kommenden Jahren plant das EnCompass-Team, seine Funktionalität auf universellere Suchrahmen zu erweitern. Sie wollen das System bei hochkomplexen Aufgaben testen und sein Potenzial für die Zusammenarbeit zwischen KI-Agenten und Menschen untersuchen, z. B. bei der gemeinsamen Entwicklung von Hardware oder der Übersetzung umfangreicher Codebasen.

EnCompass markiert somit einen entscheidenden Moment in der Entwicklung von KI-Agenten und suchbasierten Techniken, die die Arbeitsabläufe in der Softwareentwicklung revolutionieren. Durch die präzise Unterscheidung zwischen der Logik eines Agenten und seiner Suchstrategie schafft EnCompass eine solide Grundlage für die Konstruktion systematischer, zuverlässiger und leistungsstarker KI-Systeme.

Einen ausführlicheren Bericht finden Sie in dem Originalartikel unter MIT-Nachrichten.

Max Krawiec

Weiter Die »Epstein-Akten“ decken ein beunruhigendes Muster unter der Elite der Tech-Branche auf »

Vorherige « KI steht im Mittelpunkt der Werbespots beim Super Bowl LX »

Teilen Sie

Herausgegeben von

Max Krawiec

vor 5 Monaten

Wie 3D-Druckunternehmen durch die Automatisierung von Inhalten an Sichtbarkeit gewinnen können.

Diese Website verwendet Cookies.

KI-Agenten helfen, intelligenter zu suchen: Wie EnCompass die LLM-Leistung steigert

Ein neuer Horizont: KI-Agenten verändern den Arbeitsplatz

EnCompass: Eine Innovation zur Vereinfachung des Prozesses

Die Zukunft von EnCompass und KI-gesteuerter Softwareentwicklung

Verwandter Beitrag

Neueste Beiträge

Geschichte neu gedacht: Die Gründerväter und moderne Tools für die Zusammenarbeit

Fanfiction-Communities wehren sich gegen KI-generierte Werke

Wegweisende Forschungspartnerschaft: Google DeepMind und A24

Anthropic stellt „Claude Science“ vor: Eine neue Ära für KI in der wissenschaftlichen Forschung

Der futuristische medizinische Scanner von Midjourney: Ein genauerer Blick

Der kühne Vorschlag von OpenAI: Ein 5%-Anteil an der US-Regierung