Ένα πλαίσιο πλοήγησης βασισμένο στη μνήμη, που ανέπτυξαν φοιτητές μηχανικής του Texas A&M University, αναδιαμορφώνει πλέον τις προσδοκίες για το τι μπορούν να κάνουν τα ρομπότ διάσωσης. Οι ρομποτικοί σκύλοι που λειτουργούν με τεχνητή νοημοσύνη δεν εκτελούν απλώς εντολές — βλέπουν, θυμούνται τοποθεσίες και λαμβάνουν αποφάσεις σε πραγματικό χρόνο.
Σχεδιασμένο για να λειτουργεί σε χαοτικά περιβάλλοντα, το σύστημα προορίζεται να υποστηρίζει ομάδες αναζήτησης και διάσωσης, πληρώματα έκτακτης ανάγκης και μονάδες αντιμετώπισης καταστροφών. «Καταλαβαίνει φωνητικές εντολές και χρησιμοποιεί AI και εικόνες από κάμερα για να χαράξει διαδρομές και να αναγνωρίσει αντικείμενα», ανέφερε η ομάδα σε δήλωσή της.
Σύμφωνα με τους ερευνητές, χάρη στην προηγμένη μνήμη, κινητικότητα και φωνητικό έλεγχο, το ρομπότ προσφέρει κάτι παραπάνω από αυτοματοποίηση.
Τον προηγούμενο μήνα, ερευνητές του MIT ανέπτυξαν ένα AI σύστημα που επιτρέπει στα ρομπότ να δημιουργούν ταχύτατα λεπτομερείς 3D χάρτες, βελτιώνοντας την πλοήγηση και την απόκριση σε επικίνδυνα, κατεστραμμένα ή χαοτικά περιβάλλοντα όπου κάθε δευτερόλεπτο μετρά.
Πλοήγηση με βάση τη μνήμη
Το σύστημα είναι ένα επίγειο ρομπότ εξοπλισμένο με πλαίσιο πλοήγησης που βασίζεται στη μνήμη και τροφοδοτείται από ένα μεγάλο γλωσσικό μοντέλο.
Το μοντέλο ερμηνεύει οπτικά δεδομένα, υποστηρίζει επίγνωση περιβάλλοντος και παράγει αποφάσεις διαδρομής. Συνδυάζει λήψη εικόνων, υψηλού επιπέδου συλλογισμό και βελτιστοποίηση πορείας και λειτουργεί με υβριδική αρχιτεκτονική ελέγχου που επιτρέπει μακροπρόθεσμη στρατηγική αλλά και γρήγορες προσαρμογές σε πραγματικό χρόνο.
Η πλοήγηση στη ρομποτική έχει εξελιχθεί από απλές μεθόδους με σημεία αναφοράς σε προηγμένα συστήματα που χρησιμοποιούν ποικιλία αισθητήρων. Ωστόσο, απρόβλεπτα και αδόμητα περιβάλλοντα — όπως ζώνες καταστροφής, κτίρια που έχουν καταρρεύσει ή απομακρυσμένα εδάφη — εξακολουθούν να δυσκολεύουν τα αυτόνομα συστήματα, όπου η ευελιξία και οι ταχείες αποφάσεις είναι ζωτικής σημασίας.
Οι ερευνητές τονίζουν ότι, παρότι οι ρομποτικοί σκύλοι και η πλοήγηση με γλωσσικά μοντέλα έχουν εξεταστεί ξεχωριστά, ο συνδυασμός ενός προσαρμοσμένου πολυτροπικού μοντέλου με οπτική μνήμη μέσα σε μία ευέλικτη, γενικής χρήσης πλατφόρμα αποτελεί μια νέα κατεύθυνση.
Εξερεύνηση με ενισχυμένη AI
Η ομάδα ανάπτυξης εξέτασε πρώτα πώς το μοντέλο μπορεί να ερμηνεύει οπτικά δεδομένα από κάμερα και να τα μετατρέπει σε λογική πλοήγησης. Με χρηματοδότηση από το National Science Foundation, η ομάδα ενσωμάτωσε τη δυνατότητα αυτή με φωνητικές εντολές, δείχνοντας πώς όραση, μνήμη και γλώσσα μπορούν να λειτουργούν ενιαία.
Σύμφωνα με τους ερευνητές, το ρομπότ λειτουργεί όπως ένας άνθρωπος που κινείται σε άγνωστο χώρο: συνδυάζει αντιδραστικές συμπεριφορές με στοχευμένο σχεδιασμό. Μπορεί να αποφύγει άμεσα εμπόδια, ενώ χρησιμοποιεί συλλογισμό υψηλού επιπέδου για να αποφασίσει το επόμενο βήμα του με βάση την τρέχουσα οπτική πληροφορία και τη μνήμη του.
«Στο μέλλον, αυτού του είδους η δομή ελέγχου πιθανότατα θα γίνει ο κανόνας για ανθρωπόμορφα ρομπότ», δήλωσε ο Sanjaya Mallikarachchi, υποψήφιος διδάκτορας στο Texas A&M.
Το σύστημα πλοήγησης που βασίζεται στη μνήμη επιτρέπει στο ρομπότ να θυμάται και να επαναχρησιμοποιεί προηγούμενες διαδρομές, μειώνοντας άσκοπη εξερεύνηση και αυξάνοντας την αποτελεσματικότητα — ιδιαίτερα σε περιβάλλοντα χωρίς GPS ή χωρίς χαρτογράφηση, όπου η γρήγορη και αξιόπιστη κίνηση είναι κρίσιμη.
Πέρα από τις αποστολές διάσωσης, οι ερευνητές αναφέρουν ότι οι εφαρμογές είναι πολλές: νοσοκομεία, αποθήκες και μεγάλα κτιριακά συγκροτήματα θα μπορούσαν να βελτιστοποιήσουν λειτουργίες. Η τεχνολογία μπορεί επίσης να βοηθήσει άτομα με προβλήματα όρασης, να πραγματοποιήσει αναγνωριστικές επιχειρήσεις σε επικίνδυνες τοποθεσίες ή να συμβάλει στην ασφαλή εξερεύνηση ναρκοπεδίων.