Kategorien: BilderNachrichten

Wie man Robotern beibringt, große Umgebungen mit KI und klassischen Sichttechniken schnell zu kartieren

Bei einem Mineneinsturz ist die Zeit von entscheidender Bedeutung. Kritische Such- und Rettungseinsätze werden zu einer unglaublichen Herausforderung, da der Roboter, der durch den gefährlichen, teilweise eingestürzten Schacht navigiert, schnell seine Umgebung erfassen und seine Position bestimmen muss. Da er sich bei der Navigation nur auf seine Kameras an Bord verlassen kann, ist diese Aufgabe gelinde gesagt mühsam.

Auch wenn die jüngsten Fortschritte im Bereich des maschinellen Lernens es Robotern ermöglichen, solche Aufgaben anhand visueller Daten auszuführen, bestehen nach wie vor Einschränkungen. Die aktuellen Modelle können nur eine begrenzte Anzahl von Bildern gleichzeitig verarbeiten. Stellen Sie sich eine Situation vor, in der der Roboter Tausende von Bildern in Echtzeit überprüfen und analysieren muss – genau an dieser Stelle werden diese Einschränkungen zu einem erheblichen Hindernis.

Ein neuer Horizont für KI-gestütztes Mapping

Die Forscher des MIT haben ein KI-gestütztes System entwickelt, das die Stärken des modernen Deep Learning und traditioneller Computer-Vision-Techniken vereint. Diese Methode kann eine unendliche Anzahl von Bildern verarbeiten und schnell komplizierte 3D-Karten von komplexen Umgebungen wie einem überfüllten Büroflur erstellen.

Anstatt eine riesige Szene auf einen Schlag zu erfassen, unterteilt das System die Umgebung in kleinere Teilbereiche oder “Submaps”. Diese werden anschließend ausgerichtet und zu einem vollständigen 3D-Modell zusammengeführt – wobei die Position des Roboters in Echtzeit überwacht wird. Der Vorteil dieser Methode liegt in ihrer Einfachheit, Geschwindigkeit und Skalierbarkeit, wodurch sie sich für Anwendungen eignet, die von Such- und Rettungseinsätzen über industrielle Logistik bis hin zu Extended-Reality-Erlebnissen reichen.

Der Kern dieses Durchbruchs liegt in der Neudefinition eines großen Problems der Robotik – der simultanen Lokalisierung und Kartierung (SLAM). Bislang hatten SLAM-Algorithmen Schwierigkeiten mit visuell komplexen Umgebungen oder waren stark auf vorkalibrierte Hardware angewiesen. Modelle des maschinellen Lernens bieten zwar eine Lösung, sind jedoch durch die Datenmenge begrenzt, die sie gleichzeitig verarbeiten können – in der Regel etwa 60 Bilder.

Eine revolutionäre Mischung aus Alt und Neu

Das bahnbrechende System des MIT löst dieses Hindernis, indem es sich auf kleinere Fragmente der Umgebung konzentriert. Obwohl jede Teilkarte mit nur wenigen Schnappschüssen erstellt wird, werden sie schnell zu einer übergreifenden, zusammenhängenden Karte zusammengesetzt, was den Prozess beschleunigt und es dem Roboter ermöglicht, ein größeres und abwechslungsreicheres Terrain zu bewältigen.

Zunächst schien die Ausrichtung der Teilkarten eine einfache Lösung zu sein, doch schon bald stellte sich heraus, dass die Teilkarten aufgrund von Fehlern in den Modellen des maschinellen Lernens leicht verzerrt sein können. Herkömmliche Ausrichtungsmethoden, die auf Rotation und Translation basierten, versagten, da die Teilkarten selbst verzerrt waren. Daher griff das Team auf jahrzehntealte Forschungsergebnisse aus dem Bereich der Bildverarbeitung zurück und verband diese Erkenntnisse mit moderner KI.

Das Ergebnis war ein flexibleres mathematisches Gerüst, das auch Verzerrungen von Teilkarten berücksichtigt. Dies ermöglichte es dem System, selbst verzerrte Submaps genau auszurichten und einen zuverlässigen 3D-Prototyp sowie präzise Schätzungen der Kamerapositionen zu erstellen, die für die Roboternavigation entscheidend sind. Beeindruckende Testergebnisse zeigten, dass das System bestehende Methoden sowohl in Bezug auf Geschwindigkeit als auch auf Präzision übertrifft und in der Lage ist, komplizierte Umgebungen mit nur kurzen Smartphone-Videos zu rekonstruieren, und zwar mit einer Fehlerspanne von weniger als fünf Zentimetern.

Die Zukunft der robotergestützten Kartierung gestalten

Für die Zukunft plant das Team, seine Methode für noch vielschichtigere Umgebungen weiterzuentwickeln und sie in echte Roboter zu integrieren, die im Einsatz sind. Ihre Arbeit verdeutlicht letztlich den Nutzen der Kombination von Grundlagenwissen mit modernster KI zur Bewältigung realer Herausforderungen. Wie Luca Carlone, außerordentlicher Professor am MIT, treffend formuliert: “Kenntnisse der klassischen Geometrie zahlen sich aus. Wenn man genau versteht, was im Modell vor sich geht, kann man viel bessere Ergebnisse erzielen und die Skalierbarkeit deutlich verbessern.”

Diese faszinierende Forschung, die von der U.S. National Science Foundation, dem Office of Naval Research und der National Research Foundation of Korea unterstützt wird, soll auf der Conference on Neural Information Processing Systems vorgestellt werden. Wenn Sie an weiteren Einzelheiten interessiert sind, können Sie den Originalartikel lesen hier.

Max Krawiec

Weiter Mit KI die Zukunft der Wälder vorhersagen: Eine neue Ära für Klima und Nachhaltigkeit »

Vorherige «Die Zukunft der KI mit weltraumgestützter Infrastruktur erkunden“

Teilen Sie

Herausgegeben von

Max Krawiec

vor 8 Monaten

Wie 3D-Druckunternehmen durch die Automatisierung von Inhalten an Sichtbarkeit gewinnen können.

Diese Website verwendet Cookies.

Wie man Robotern beibringt, große Umgebungen mit KI und klassischen Sichttechniken schnell zu kartieren

Ein neuer Horizont für KI-gestütztes Mapping

Eine revolutionäre Mischung aus Alt und Neu

Die Zukunft der robotergestützten Kartierung gestalten

Verwandter Beitrag

Neueste Beiträge

Fanfiction-Communities wehren sich gegen KI-generierte Werke

Wegweisende Forschungspartnerschaft: Google DeepMind und A24

Anthropic stellt „Claude Science“ vor: Eine neue Ära für KI in der wissenschaftlichen Forschung

Der futuristische medizinische Scanner von Midjourney: Ein genauerer Blick

Der kühne Vorschlag von OpenAI: Ein 5%-Anteil an der US-Regierung

Die entscheidende Rolle der neugiergetriebenen Forschung für die Zukunft Amerikas