Räumliches Gedächtnis: Roboter sind 21–53% präziser bei Objektsuche
19.06.2026 - 11:39:20 | boerse-global.de
Das MIT-Framework DAAAM verknüpft Computer Vision mit 3D-Kartierung und ermöglicht Maschinen, Objekte über Stunden zu speichern und abzurufen.
Forscher am Massachusetts Institute of Technology (MIT) haben mit DAAAM (Describe Anything, Anywhere, Anytime, at Any Moment) ein System entwickelt, das die Lücke zwischen visueller Wahrnehmung und räumlichem Gedächtnis schließt. Roboter können damit Umgebungen nicht nur geometrisch erfassen, sondern semantisch verstehen und über längere Zeiträume abrufbar speichern.
Objekte mit Zeitstempeln
Anzeige: Die MIT-Forschung zeigt: Mit DAAAM steigern Roboter ihre Objektsuche um 21–53%. Unser Leitfaden zeigt in 5 konkreten Schritten, wie Sie das Framework in Ihre Robotik integrieren – inklusive Checkliste und ROI-Rechner. Leitfaden zur DAAAM-Integration anfordern
Herkömmliche Systeme verarbeiten oft nur punktuelle oder kurzzeitige Informationen. DAAAM erstellt dagegen eine 3D-Karte, in der Objekte mit detaillierten Beschreibungen und Zeitstempeln hinterlegt werden. Die Datenbank enthält neben den 3D-Positionen auch den genauen Zeitpunkt der Erfassung.
Die praktische Folge: Roboter können komplexe Fragen in natürlicher Sprache beantworten. „Wo habe ich den Schlüssel hingelegt?" oder „Wann war die Brieftasche zuletzt sichtbar?" – das System findet die Antworten. In Tests war DAAAM bei objektbezogenen Fragestellungen 21 bis 53 Prozent präziser als bisherige Vergleichsmethoden.
Zehnmal schneller durch Batching
Ein spezielles Batching-Verfahren treibt die Verarbeitungsgeschwindigkeit massiv nach oben. Das System wählt Schlüsselbilder aus und aggregiert die Informationen. Ergebnis: eine bis zu zehnmal höhere Berechnungsgeschwindigkeit als Standardansätze. Echtzeitbetrieb wird möglich – entscheidend für die autonome Navigation in belebten Umgebungen.
Navigationstests zeigten: Roboter absolvierten ihre Aufgaben mit DAAAM um 28 Prozent häufiger korrekt. Der Zugriff auf das gespeicherte Wissen erfolgt über Large Language Models (LLMs). Sie übersetzen die semantischen Informationen der 3D-Karte für Nutzer oder die interne Handlungsplanung.
Finanziert wurde die Entwicklung unter anderem vom U.S. Army Research Laboratory und dem Office of Naval Research. Die Forscher sehen aber auch Grenzen: Sehr ungewöhnliche Objekte erkennt das System weiterhin schlecht. Für schnelle Flugdrohnen ist die Rechenlast noch zu hoch.
Milliarden für die digitale Zwillinge
Anzeige: Roboter ohne räumliches Langzeitgedächtnis finden Objekte unzuverlässig – das kostet Zeit und Geld. Mit dem neuen MIT-Framework DAAAM speichern Maschinen Objekte über Stunden und beantworten Fragen wie „Wo liegt der Schlüssel?“. Unser Whitepaper erklärt, wie Sie semantische 3D-Kartierung in Ihrem Betrieb einführen. Whitepaper zur 3D-Kartierung jetzt laden
DAAAM steht in einem breiteren Branchentrend: Die physische Welt digital simulieren und für KI-Modelle begreifbar machen. Parallel zur MIT-Forschung investierten Amazon, Nvidia und AMD im Juni 2026 insgesamt 310 Millionen Dollar in das Start-up Odyssey ML. Es entwickelt Weltmodelle zur 3D-Simulation der physischen Realität.
Ein kritisches Nadelöhr bleibt die Verfügbarkeit hochwertiger Trainingsdaten für Roboter. Während Sprachmodelle auf riesige Textmengen zugreifen, mangelt es in der Robotik an präzisen Trajektorien und Interaktionsbeispielen. Das Start-up XDOF erhielt 70 Millionen Dollar Risikokapital für spezialisierte Datensätze. Zusammen mit der UC Berkeley entsteht die Datenbank ABC mit über 130.000 Trajektorien.
Auch Alibaba treibt die Verzahnung von Sprachmodellen und Robotik voran. Die im Juni vorgestellte Qwen-Robot Suite erlaubt Robotern, Handlungen vorab in einer simulierten Welt zu prüfen, bevor sie physisch ausgeführt werden. Die Kombination aus räumlichem Langzeitgedächtnis, massiven Datensätzen und Echtzeit-Simulation definiert die nächste Stufe der autonomen Robotik.
