AutomatyzacjaAktualności

Pomaganie agentom AI w inteligentniejszym wyszukiwaniu: jak EnCompass zwiększa wydajność LLM

Nowy horyzont: Agenci AI przekształcający miejsca pracy

W dzisiejszym szybko zmieniającym się, napędzanym technologią świecie, sztuczna inteligencja (AI) stała się cichym, ale skutecznym asystentem pomagającym wielu profesjonalistom. Od naukowca burzy mózgów nad przełomowym pomysłem badawczym po dyrektora generalnego, który chce zoptymalizować zasoby ludzkie i finanse, sztuczna inteligencja, a konkretnie agenci sztucznej inteligencji, są narzędziami, o których nigdy nie wiedzieli, że są im potrzebne. Działając jako półautonomiczne systemy oprogramowania, agenci AI są coraz częściej wykorzystywani do wykorzystywania dużych modeli językowych (LLM) w celu rozwiązywania problemów i szybkiego wykonywania zadań.

LLM odgrywają jeszcze większą rolę w połączeniu z agentami AI ze względu na ich zdolność adaptacji i wydajność. Jednym z ich powszechnie uznanych zastosowań jest automatyzacja tłumaczenia przestarzałych baz kodu na współczesne języki programowania. Na przykład, firma programistyczna może wykorzystać LLM do tłumaczenia jednego pliku programistycznego na raz, a następnie przetestować każdy z nich. Proces ten może być jednak pracochłonny i czasochłonny, gdy LLM popełnia błędy, które muszą zostać ręcznie naprawione.

EnCompass: Innowacja ułatwiająca proces

Ta zagadka doprowadziła do opracowania EnCompass przez naukowców z MIT's Computer Science and AI Laboratory (CSAIL) i Asari AI. EnCompass to najnowocześniejszy framework, który umożliwia agentom AI automatyczne cofanie się i ponawianie prób, gdy LLM napotkają błędy. Dodatkowo, eliminuje on długie kody obsługi błędów wymagane przez programistów.

Encompass wyróżnia się możliwością klonowania środowiska uruchomieniowego programu. Pozwala to na jednoczesne wykonywanie wielu prób rozwiązania. Innymi słowy, bada wiele możliwych wyników, a nie tylko jedną ścieżkę, aby znaleźć najbardziej optymalne rozwiązanie. Dzięki EnCompass programiści mogą oznaczać konkretne operacje, takie jak wywołania LLM, w których wyniki mogą się różnić. Te punkty kontrolne, znane jako ‘punkty rozgałęzienia’, pozwalają programowi badać wiele scenariuszy, jak w historii przygodowej, znajdując najlepsze możliwe zakończenie.

Dodatkowo użytkownicy mogą wybrać lub zdefiniować strategię nawigacji po tych gałęziach. EnCompass obsługuje wiele gotowych strategii wyszukiwania, takich jak wyszukiwanie drzewa Monte Carlo i wyszukiwanie wiązki. Alternatywnie, użytkownicy mogą aktualizować niestandardowe strategie specjalnie dostosowane do ich zadań.

Korzyści z zastosowania EnCompass są ogromne. W teście, w którym EnCompass był używany przez agenta AI do tłumaczenia repozytoriów kodu Java na Python, ilość kodu wymaganego do implementacji wyszukiwania została zmniejszona o 82%. Zaoszczędziło to 348 linii kodu. Co więcej, dokładność została poprawiona o 15-40% w pięciu różnych repozytoriach, gdy zastosowano dwupoziomową strategię wyszukiwania wiązki.

“Dzięki EnCompass odłączyliśmy strategię wyszukiwania od podstawowego przepływu pracy agenta AI. Pozwala to programistom swobodnie eksperymentować z różnymi strategiami wyszukiwania, aby odkryć tę najbardziej efektywną” - powiedział doktorant MIT EECS i badacz CSAIL, Zhening Li ’25, MEng ’25.

Przyszłość EnCompass i inżynierii oprogramowania opartej na sztucznej inteligencji

Encompass wykazał obiecujące wyniki w przypadku agentów zaimplementowanych w Pythonie, które wywołują LLM. Potrafi zarządzać obszernymi bibliotekami kodu, projektować eksperymenty naukowe, a nawet tworzyć złożone plany sprzętowe, takie jak rakiety. Jednak obecny sukces EnCompass ma większe zastosowanie do agentów, którzy podążają za określonym programistycznym przepływem pracy i działa mniej efektywnie z agentami całkowicie zarządzanymi przez LLM.

W nadchodzących latach zespół EnCompass planuje rozszerzyć swoją funkcjonalność na bardziej uniwersalne ramy wyszukiwania. Zamierzają przetestować system na bardzo złożonych zadaniach i zbadać jego potencjał we współpracy między agentami AI i ludźmi, takimi jak wspólne projektowanie sprzętu lub tłumaczenie obszernych baz kodów.

EnCompass wyznacza zatem kluczowy moment w rozwoju agentów AI i technik opartych na wyszukiwaniu, które rewolucjonizują procesy tworzenia oprogramowania. Precyzyjnie odróżniając logikę agenta od jego strategii wyszukiwania, EnCompass stanowi solidną podstawę do konstruowania systematycznych, niezawodnych i wydajnych systemów sztucznej inteligencji.

Bardziej szczegółowy opis można znaleźć w oryginalnym artykule na stronie MIT News.

Jaka jest twoja reakcja?

Podekscytowany
0
Szczęśliwy
0
Zakochany
0
Nie jestem pewien
0
Głupi
0

Komentarze są zamknięte.