Física y la “caja negra” del aprendizaje automático | Noticias del MIT



Los algoritmos de aprendizaje automático a menudo se denominan «caja negra». Una vez que se ingresan los datos en un algoritmo, no siempre está claro exactamente cómo el algoritmo logra su predicción. Puede ser especialmente frustrante cuando las cosas van mal. Un nuevo curso de Ingeniería Mecánica (MechE) en el MIT enseña a los estudiantes cómo abordar el problema de la «caja negra», a través de una combinación de ciencia de datos e ingeniería basada en la física.

En la clase 2.C161 (Modelado y diseño de sistemas físicos mediante el aprendizaje automático), el profesor George Barbastathis demuestra cómo los ingenieros mecánicos pueden utilizar su conocimiento único de los sistemas físicos para controlar algoritmos y desarrollar predicciones más precisas.

“Quería tomar el curso 2.C161 porque los modelos de aprendizaje automático suelen ser una ‘caja negra’, pero este curso nos enseñó cómo construir un modelo de sistema basado en la física para que podamos echar un vistazo al interior”, dice Crystal Owens, un mecánico. estudiante graduado de ingeniería que tomó el curso en la primavera de 2021.

Como presidente del Comité de Integración Estratégica de la Ciencia de Datos en la Ingeniería Mecánica, Barbastathis ha tenido numerosas conversaciones con estudiantes, investigadores y profesores de ingeniería mecánica para comprender mejor los desafíos y los éxitos que han encontrado al utilizar el aprendizaje automático en su trabajo.

“Un comentario que escuchamos con frecuencia fue que estos colegas pueden ver el valor de los métodos de ciencia de datos para los problemas que enfrentan en su investigación centrada en la ingeniería mecánica; sin embargo, carecen de las herramientas para aprovecharlo al máximo ”, dice Barbastathis. “Los ingenieros mecánicos, civiles, eléctricos y de otro tipo desean una comprensión fundamental de los principios de los datos sin tener que convertirse en científicos de datos o investigadores de IA a tiempo completo. »

Además, a medida que los estudiantes de ingeniería mecánica pasen del MIT a sus carreras, muchos necesitarán algún día administrar científicos de datos en sus equipos. Barbastathis espera preparar a estos estudiantes para el éxito con la clase 2.C161.

Uniendo MechE y MIT Schwartzman College of Computing

La clase 2.C161 es parte del «Core Computing» de MIT Schwartzman College of Computing. El objetivo de estos cursos es conectar las disciplinas de la ciencia de datos y la ingeniería basada en la física, como la ingeniería mecánica. Los estudiantes toman el curso junto con 6.C402 (Modelado con aprendizaje automático: de algoritmos a aplicaciones), impartido por los profesores de Ingeniería Eléctrica y Ciencias de la Computación Regina Barzilay y Tommi Jaakkola.

Ambos cursos se imparten simultáneamente durante el semestre, exponiendo a los estudiantes a los fundamentos del aprendizaje automático y aplicaciones específicas de dominio en ingeniería mecánica.

En 2.C161, Barbastathis enfatiza cómo la ingeniería basada en la física y la ciencia de datos son complementarias. Las leyes físicas presentan una serie de ambigüedades e incógnitas, que van desde la temperatura y la humedad hasta las fuerzas electromagnéticas. La ciencia de datos se puede utilizar para predecir estos fenómenos físicos. Mientras tanto, tener una comprensión de los sistemas físicos ayuda a garantizar que la salida resultante de un algoritmo sea precisa y explicable.

“Lo que se necesita es una comprensión combinada más profunda de los fenómenos físicos asociados y los principios de la ciencia de datos, especialmente el aprendizaje automático, para cerrar la brecha”, agrega Barbastathis. “Al combinar datos con principios físicos, la nueva revolución en la ingeniería basada en la física es relativamente inmune al problema de la ‘caja negra’ que enfrentan otros tipos de aprendizaje automático. »

Con un conocimiento práctico de los temas de aprendizaje automático cubiertos en la clase 6.C402 y una comprensión más profunda de cómo combinar la ciencia de datos con la física, los estudiantes tienen la tarea de desarrollar un proyecto final que resuelva un sistema físico real.

Desarrollar soluciones para sistemas físicos en el mundo real

Para su proyecto final, se les pide a los estudiantes de 2.C161 que identifiquen un problema del mundo real que requiere ciencia de datos para resolver la ambigüedad inherente a los sistemas físicos. Después de obtener todos los datos relevantes, se les pide a los estudiantes que seleccionen un método de aprendizaje automático, implementen la solución elegida y presenten y critiquen los resultados.

Los temas de este semestre final variaron desde el pronóstico del tiempo hasta el flujo de gas en los motores de combustión, con dos equipos de estudiantes inspirados en la actual pandemia de Covid-19.

Owens y sus compañeros de equipo, los estudiantes graduados Arun Krishnadas y Joshua David John Rathinaraj, se propusieron desarrollar un modelo para el despliegue de la vacuna Covid-19.

«Hemos desarrollado un método para combinar una red neuronal con un modelo epidemiológico susceptible-infectado-recuperado (SIR) para crear un sistema de predicción basado en la física para la propagación de Covid-19 después del inicio de las vacunas», explica Owens.

El equipo tuvo en cuenta varias incógnitas, incluida la movilidad de la población, el clima y el clima político. Este enfoque combinado dio como resultado una predicción de la propagación de Covid-19 durante el despliegue de la vacuna que fue más confiable que usar solo el modelo SIR o una red neuronal.

Otro equipo, incluido el estudiante graduado Yiwen Hu, desarrolló un modelo para predecir las tasas de mutación en Covid-19, un tema que se volvió demasiado relevante cuando la variante delta comenzó su propagación global.

“Usamos el aprendizaje automático para predecir la tasa de mutación de Covid-19 en función de series temporales, luego lo incorporamos como un parámetro independiente en la predicción de la dinámica pandémica para ver si podía ayudarnos a predecir mejor la tendencia de Covid-19. pandemia”, dijo Hu.

Hu, que anteriormente había realizado investigaciones sobre cómo las vibraciones en los picos de proteínas del coronavirus afectan las tasas de infección, espera aplicar los enfoques de aprendizaje automático basados ​​en la física que aprendió en 2.C161 a su investigación sobre el diseño de proteínas de novo.

Cualquiera que sea el sistema físico que los estudiantes aborden en sus proyectos finales, Barbastathis tuvo cuidado de enfatizar un objetivo unificador: la necesidad de evaluar las implicaciones éticas de la ciencia de datos. Si bien los métodos computacionales más tradicionales, como el reconocimiento facial o de voz, han demostrado estar plagados de problemas éticos, existe la oportunidad de combinar los sistemas físicos con el aprendizaje automático de una manera justa y ética.

«Necesitamos asegurarnos de que la recopilación y el uso de datos se realice de manera justa e inclusiva, respetando la diversidad de nuestra sociedad y evitando los problemas bien conocidos a los que se ha enfrentado la gente de TI en el pasado», dice Barbastathis.

Barbastathis espera que al alentar a los estudiantes de ingeniería mecánica a dominar tanto la ética como la ciencia de datos, puedan desarrollar soluciones y predicciones confiables y éticas para los desafíos de la ingeniería física.

Deja un comentario