Diese Woche erkunden wir im GeekWire-Podcast den Stand der Technik in Robotik und künstlicher Intelligenz mit Martial HebertDekan der Fakultät für Informatik der Carnegie Mellon University in Pittsburgh.
EIN erfahrener Informatiker im Bereich Computer VisionHebert ist der ehemalige Direktor der renommierten CMU Institut für Robotik. Als gebürtiger Franzose hatte er auch die große Ehre, unser erster persönlicher Podcast-Gast seit zwei Jahren zu sein und die Büros von GeekWire während seiner kürzlichen Reise in die Gegend von Seattle zu besuchen.
Wie Sie hören werden, diente unsere Diskussion auch als Vorschau auf eine Reise, die das Nachrichtenteam von GeekWire bald nach Pittsburgh unternehmen wird, um die Stadt erneut zu besuchen, in der 2018 unser temporäres GeekWire-Hauptquartier 2 stattfand, und von dort zu berichten Cascadia Connect Robotik, Automatisierung & KI-Konferenzmit Abdeckung unterstützt von Cascadia-Hauptstadt. Näheres in Kürze.
Lesen Sie weiter für Auszüge aus dem Gespräch, die aus Gründen der Klarheit und Länge bearbeitet wurden.
Hören Sie unten zu oder abonnieren Sie GeekWire in Apple-Podcasts, Google-Podcasts, Spotify oder wo immer du hörst.
Warum bist du hier in Seattle? Kannst du uns ein wenig darüber erzählen, was du auf dieser Westküstenreise machst?
Martial Hebert: Wir arbeiten mit einer Reihe von Partnern und einer Reihe von Industriepartnern zusammen. Und das ist der Zweck dieser Reise: diese Kooperationen zu etablieren und diese Kooperationen zu verschiedenen Themen rund um KI und Robotik zu stärken.
Es ist vier Jahre her, dass GeekWire in Pittsburgh war. Was hat sich in der Informatik und der Technikszene verändert?
Die selbstfahrenden Unternehmen Polarlicht Sonstiges Argo-KI expandieren schnell und erfolgreich. Das gesamte Netzwerk und Ökosystem der Robotikunternehmen wächst ebenfalls schnell.
Aber neben der Erweiterung gibt es auch ein größeres Gemeinschaftsgefühl. Dies ist etwas, das in der Bay Area und in der Gegend von Boston seit einigen Jahren existiert. Was sich in den letzten vier Jahren geändert hat, ist, dass unsere Gemeinschaft durch Organisationen wie die Pittsburgh Robotics Networkhat sich sehr verfestigt.
Sind selbstfahrende Autos immer noch eine der vielversprechendsten Anwendungen von Computer Vision und autonomen Systemen?
Es ist eine sehr sichtbare und potenziell sehr wirkungsvolle Anwendung in Bezug auf das Leben der Menschen: Transport, Transit und so weiter. Aber es gibt andere Anwendungen, die nicht so sichtbar sind, aber auch sehr wirkungsvoll sein können.
Zum Beispiel Dinge, die sich um Gesundheit drehen, und wie man Gesundheitssignale von verschiedenen Sensoren nutzt – das hat potenziell tiefgreifende Auswirkungen. Wenn Sie eine kleine Änderung der Gewohnheiten der Menschen erreichen können, kann dies eine enorme Veränderung der allgemeinen Gesundheit der Bevölkerung und der Wirtschaft bewirken.
Was sind einige der innovativen Fortschritte, die Sie heute in der Robotik und Computer Vision sehen?
Lassen Sie mich Ihnen eine Vorstellung von einigen der Themen geben, die ich für sehr interessant und vielversprechend halte.
- Einer davon hat weder mit Robotern noch mit Systemen zu tun, sondern mit Menschen. Und es ist die Idee, Menschen zu verstehen – ihre Interaktionen zu verstehen, ihr Verhalten zu verstehen und ihr Verhalten vorherzusagen und dies zu nutzen, um eine stärker integrierte Interaktion mit KI-Systemen zu haben. Dazu gehört Computer Vision.
- Andere Aspekte beziehen sich darauf, Systeme praktisch und einsetzbar zu machen. Wir haben in den letzten Jahren fantastische Fortschritte auf der Grundlage von Deep Learning und verwandten Techniken gemacht. Vieles davon hängt jedoch von der Verfügbarkeit sehr großer Datenmengen und kuratierter Daten, überwachter Daten, ab. Ein Großteil der Arbeit hat also damit zu tun, diese Abhängigkeit von Daten zu reduzieren und viel agilere Systeme zu haben.
Es scheint, als ob dieses erste Thema des Erfassens, Verstehens und Vorhersagens menschlichen Verhaltens im Klassenzimmer anwendbar sein könnte, in Bezug auf Systeme, die erfassen, wie Schüler interagieren und sich engagieren. Wie viel davon passiert in der Technologie, die wir heutzutage sehen?
Darauf gibt es zwei Antworten:
- Es gibt eine rein technologische Antwort, die lautet: Wie viele Informationen, wie viele Signale können wir aus der Beobachtung extrahieren? Und da haben wir enorme Fortschritte gemacht. Und sicherlich gibt es dort Systeme, die sehr performant sein können.
- Aber können wir dies in der Interaktion effektiv nutzen, um im Falle der Bildung die Lernerfahrung zu verbessern? Wir haben noch einen weiten Weg vor uns, um diese Systeme wirklich einzusetzen, aber wir machen große Fortschritte. Insbesondere an der CMU haben wir dort zusammen mit den Lernwissenschaften eine große Aktivität bei der Entwicklung dieser Systeme.
Wichtig ist aber, dass es nicht nur um KI geht. Es ist nicht nur Computervision. Es ist Technologie plus die Lernwissenschaften. Und es ist entscheidend, dass beides kombiniert wird. Alles, was beispielsweise versucht, diese Art von Computer Vision auf naive Weise zu nutzen, kann tatsächlich desaströs sein. Daher ist es sehr wichtig, dass diese Disziplinen richtig miteinander verknüpft sind.
Ich kann mir vorstellen, dass dies für eine Vielzahl von Initiativen in vielen verschiedenen Bereichen gilt. In der Vergangenheit haben Informatiker, Robotiker, Leute der künstlichen Intelligenz vielleicht versucht, Dinge in einem Vakuum ohne Leute zu entwickeln, die Fachexperten sind. Und das hat sich geändert.
Tatsächlich ist das eine Entwicklung, die ich für sehr interessant und notwendig halte. So haben wir zum Beispiel eine große Aktivität mit [CMU’s Heinz College of Information Systems and Public Policy] zu verstehen, wie KI in der öffentlichen Ordnung eingesetzt werden kann. … Was Sie wirklich wollen, ist, allgemeine Prinzipien und Werkzeuge zu extrahieren, um KI für die öffentliche Ordnung zu nutzen, und das wiederum in einen Lehrplan und ein Bildungsangebot an der Schnittstelle der beiden umzuwandeln.
Es ist wichtig, dass wir die Grenzen der KI deutlich machen. Und ich denke, davon gibt es eigentlich nicht genug. Auch für diejenigen, die keine KI-Experten sind, die nicht unbedingt die technischen Details der KI kennen, ist es wichtig zu verstehen, was KI kann, aber vor allem auch, was sie nicht kann.
[After we recorded this episode, CMU announced a new cross-disciplinary Responsible AI Initiative involving the Heinz College and the School of Computer Science.]
Wenn Sie gerade erst mit Computer Vision und Robotik begonnen haben, gibt es eine besondere Herausforderung oder ein Problem, das Sie einfach nicht erwarten konnten, sich in diesem Bereich zu stellen?
Eine große Herausforderung besteht darin, wirklich umfassende und prinzipientreue Ansätze zu haben, um die Leistung von KI- und maschinellen Lernsystemen zu charakterisieren und diese Leistung zu bewerten und diese Leistung vorherzusagen.
Wenn Sie sich ein klassisches technisches System ansehen – ob es sich nun um ein Auto, einen Aufzug oder etwas anderes handelt – hinter diesem System stehen ein paar hundert Jahre Ingenieurpraxis. Das bedeutet formale Methoden – formale mathematische Methoden, formale statistische Methoden – aber auch Best Practices für das Testen und Evaluieren. Das haben wir für KI und ML nicht, zumindest nicht in diesem Ausmaß.
Das ist im Grunde diese Idee, von den Komponenten des Systems bis hin zur Charakterisierung des gesamten End-to-End-Systems zu gelangen. Das ist also eine sehr große Herausforderung.
Ich dachte, du wolltest sagen, ein Roboter, der dir ein Bier bringt, während du das Spiel der Steelers siehst.
Das passt zu dem, was ich zuvor über die Einschränkungen gesagt habe. Wir haben immer noch nicht die Unterstützung, um diese Komponenten in Bezug auf die Charakterisierung zu handhaben. Da komme ich also her. Ich denke, das ist entscheidend, um das Stadium zu erreichen, in dem der Bierlieferroboter wirklich zuverlässig und vertrauenswürdig ist.
Siehe Forschungsseite von Martial Hebert für weitere Details zu seiner Arbeit im Bereich Computer Vision und autonome Systeme.
Herausgegeben und produziert von Curt Milton, mit Musik von Daniel LK Caldwell.