Guía para principiantes sobre la interfaz cerebro-ordenador y las redes neuronales convolucionales

¿Puede la mente conectarse directamente con la inteligencia artificial, los robots y otras mentes a través de las tecnologías de interfaz cerebro-ordenador (BCI) para trascender nuestras limitaciones humanas?

Para algunos, es una necesidad para nuestra supervivencia. De hecho, tendríamos que convertirnos en cyborgs para ser relevantes en una era de inteligencia artificial.

Definición

Interfaz cerebro-ordenador (BCI): dispositivos que permiten a sus usuarios interactuar con los ordenadores por medio de la actividad cerebral únicamente, siendo esta actividad medida generalmente por ElectroEncephaloGraphy (EEG).

Electroencefalografía (EEG): método fisiológico de elección para registrar la actividad eléctrica generada por el cerebro a través de electrodos colocados en la superficie del cuero cabelludo.

Resonancia magnética funcional (fMRI): mide la actividad cerebral detectando los cambios asociados al flujo sanguíneo.

Espectroscopia funcional del infrarrojo cercano (fNIRS): uso de la espectroscopia del infrarrojo cercano (NIRS) con fines de neuroimagen funcional. Mediante la fNIRS, la actividad cerebral se mide a través de las respuestas hemodinámicas asociadas al comportamiento de las neuronas.

Red neuronal evolutiva (CNN): un tipo de red neuronal artificial utilizada en el reconocimiento y procesamiento de imágenes que está específicamente diseñada para procesar datos de píxeles.

Corteza visual: parte de la corteza cerebral que recibe y procesa los impulsos nerviosos sensoriales de los ojos

Historia

Sarah Marsch, reportera de The Guardian, dijo que «las interfaces cerebro-ordenador (BCI) no son una idea nueva. Ya existen varias formas de BCI, desde las que se colocan encima de la cabeza y miden las señales cerebrales hasta los dispositivos que se implantan en el tejido cerebral.» (fuente)

La mayoría de los BCI se desarrollaron inicialmente para aplicaciones médicas. Según Zaza Zuilhof, diseñador jefe de Tellart, «unas 220.000 personas con problemas de audición ya se benefician de los implantes cocleares, que traducen las señales de audio en impulsos eléctricos enviados directamente a sus cerebros.» (fuente)

El artículo llamado «The Brief History of Brain Computer Interfaces» nos da mucha información relacionada con la historia de la ICB. De hecho, el artículo dice «En la década de 1970, la investigación sobre BCI comenzó en la Universidad de California, lo que llevó a la aparición de la expresión interfaz cerebro-ordenador. La investigación y el desarrollo de la ICB siguen centrándose principalmente en las aplicaciones neuroprotésicas que pueden ayudar a restaurar la vista, el oído y el movimiento dañados. A mediados de la década de 1990 aparecieron los primeros dispositivos neuroprotésicos para humanos. La BCI no lee la mente con precisión, sino que detecta los cambios más pequeños en la energía que irradia el cerebro cuando se piensa de una manera determinada. Un BCI reconoce patrones específicos de energía/frecuencia en el cerebro.

Junio de 2004 marcó un avance significativo en el campo cuando Matthew Nagle se convirtió en el primer humano al que se le implantó un BCI, el BrainGate™ de Cyberkinetics.

En diciembre de 2004, Jonathan Wolpaw y los investigadores del Centro Wadsworth del Departamento de Salud del Estado de Nueva York presentaron un informe de investigación que demostraba la capacidad de controlar un ordenador mediante un BCI. En el estudio, se pidió a los pacientes que llevaran una gorra que contenía electrodos para capturar las señales del EEG de la corteza motora -parte del cerebro que gobierna el movimiento.

La BCI ha tenido una larga historia centrada en aplicaciones de control: cursores, partes del cuerpo paralizadas, brazos robóticos, marcación telefónica, etc.

Recientemente, Elon Musk entró en la industria, anunciando una inversión de 27 millones de dólares en Neuralink, una empresa con la misión de desarrollar una BCI que mejore la comunicación humana a la luz de la IA. Y Regina Dugan presentó los planes de Facebook para una tecnología BCI que cambie el juego y permita una comunicación digital más eficiente.»

Según John Thomas, Tomasz Maszczyk, Nishant Sinha, Tilmann Kluge y Justin Dauwels «Un sistema BCI tiene cuatro componentes principales: adquisición de señales, preprocesamiento de señales, extracción de características y clasificación.» (fuente)

¿Por qué es importante?

Según Davide Valeriani, investigador posdoctoral en interfaces cerebro-ordenador de la Universidad de Essex, «la combinación de humanos y tecnología podría ser más poderosa que la inteligencia artificial. Por ejemplo, cuando tomamos decisiones basadas en una combinación de percepción y razonamiento, las neurotecnologías podrían utilizarse para mejorar nuestra percepción. Esto podría ayudarnos en situaciones como cuando vemos una imagen muy borrosa de una cámara de seguridad y tenemos que decidir si intervenir o no.» (fuente)

¿De qué son capaces realmente estas interfaces cerebro-ordenador?

Para Zaza Zuilhof, depende de a quién le preguntes y de si estás dispuesto o no a pasar por el quirófano. «A efectos de este experimento mental, vamos a suponer que las personas sanas sólo utilizarán las BCI no invasivas, que no requieren cirugía. En ese caso, existen actualmente dos tecnologías principales, la fMRI y el EEG. La primera requiere una máquina enorme, pero la segunda, con auriculares de consumo como Emotiv y Neurosky, se ha puesto realmente al alcance de un público más general.» (fuente)

Fuente

Sin embargo, la BCI también puede ser una prometedora herramienta de interacción para personas sanas, con varias aplicaciones potenciales en el campo de la multimedia, la RV o los videojuegos entre otras muchas aplicaciones potenciales.

Davide Valeriani afirma que «el hardware del EEG es totalmente seguro para el usuario, pero registra señales muy ruidosas. Además, los laboratorios de investigación se han centrado principalmente en utilizarlo para entender el cerebro y proponer aplicaciones innovadoras sin ningún seguimiento en productos comerciales, hasta ahora… pero esto cambiará.(fuente)

La empresa de Musk es la última. Su tecnología de «encaje neural» consiste en implantar electrodos en el cerebro para medir las señales. Esto permitiría obtener señales neuronales de mucha mejor calidad que el electroencefalograma… pero requiere cirugía. Recientemente, declaró que las interfaces cerebro-ordenador son necesarias para confirmar la supremacía de los humanos sobre la inteligencia artificial.» (fuente)

¡Esta tecnología sigue siendo peligrosa! Efectivamente, nosotros hicimos los ordenadores y sabemos exactamente cómo funcionan y cómo «modificarlos». Sin embargo, no hicimos los cerebros y todavía no sabemos muy bien cómo funcionan. Y mucho menos cómo «invadirlos» con seguridad y éxito. Hemos hecho grandes progresos, pero aún no los suficientes.

Cómo funciona tu cerebro ahora, y lo que está por venir

En términos sencillos, tu cerebro se divide en dos secciones principales:

  • El sistema límbico
  • El neocórtex.
    • El sistema límbico es responsable de nuestros impulsos primarios, así como de los relacionados con la supervivencia, como comer y reproducirse. Nuestro neocórtex es el área más avanzada, y es responsable de las funciones lógicas que nos hacen buenos en los idiomas, la tecnología, los negocios y la filosofía.

      El cerebro humano contiene alrededor de 86 billones de células nerviosas llamadas neuronas, cada una de ellas unida individualmente a otras neuronas por medio de conectores llamados axones y dendritas. Cada vez que pensamos, nos movemos o sentimos, las neuronas están trabajando. De hecho, el cerebro genera una enorme cantidad de actividades neuronales. Básicamente, las pequeñas señales eléctricas que se mueven de neurona a neurona son las que hacen el trabajo.

      Hay muchas señales que se pueden utilizar para la BCI. Estas señales se pueden dividir en dos categorías:
      – Picos
      – Potenciales de campo

      Podemos detectar esas señales, interpretarlas y utilizarlas para interactuar con un dispositivo.

      Según Boris Reuderink, consultor de aprendizaje automático de Cortext, «uno de los mayores problemas de las interfaces cerebro-ordenador es que las señales cerebrales son débiles y muy variables. Por eso es difícil entrenar un clasificador y usarlo al día siguiente, y mucho menos utilizarlo en un sujeto diferente.» (fuente)

      Para insertar Neural Lace, se coloca dentro del cráneo una diminuta aguja que contiene la malla enrollada. A continuación, se inyecta la malla y se desvela al inyectarla, abarcando el cerebro.

      La inteligencia artificial o el aprendizaje automático han recibido una gran atención para el desarrollo de aplicaciones BCI con el fin de resolver problemas difíciles en varios dominios, en particular, los campos médico y robótico. La IA/ML se ha convertido desde entonces en la herramienta más eficiente para los sistemas BCI. (fuente)

      Intentemos profundizar un poco más en estos aspectos a continuación. Cada uno de estos aspectos tiene su propio campo de investigación.

      Producción de señales
      Hay dos formas de producir estas señales cerebrales:

      Según Sjoerd Lagarde, ingeniero de software de Quintiq, «la generación activa de señales tiene la ventaja de que la detección de señales es más fácil, ya que se tiene control sobre los estímulos; se sabe, por ejemplo, cuándo se presentan. Esto es más difícil en el caso de que sólo se lean las ondas cerebrales del sujeto»

      Detección de señales
      Hay diferentes formas de detectar las señales cerebrales. Las más conocidas son el EEG y la fMRI, pero también hay otras. El EEG mide la actividad eléctrica del cerebro, la fMRI el flujo sanguíneo en el cerebro. Cada uno de estos métodos tiene sus propias desventajas. Algunos tienen una mejor resolución temporal (pueden detectar la actividad cerebral a medida que se produce), mientras que otros tienen una mejor resolución espacial (pueden señalar la ubicación de la actividad).

      La idea sigue siendo en gran medida la misma para otros tipos de técnicas de medición.

      Procesamiento de la señal
      Uno de los problemas que encontraremos al tratar con datos cerebrales, es que los datos tienden a contener mucho ruido. Cuando se utiliza el EEG, por ejemplo, cosas como el rechinar de los dientes aparecerán en los datos, así como los movimientos de los ojos. Es necesario filtrar este ruido.

      Los datos pueden utilizarse ahora para detectar señales reales. Cuando el sujeto está generando señales de forma activa, solemos ser conscientes del tipo de señales que queremos detectar. Un ejemplo es la onda P300, que es un potencial relacionado con eventos que aparece cuando se presenta un estímulo poco frecuente y relevante para la tarea. Esta onda aparecerá como un gran pico en sus datos y podría probar diferentes técnicas de aprendizaje automático para detectar dichos picos.

      Transducción de señales
      Cuando haya detectado las señales interesantes en sus datos, querrá utilizarlas de alguna manera que sea útil para alguien. El sujeto podría, por ejemplo, utilizar la BCI para controlar un ratón mediante un movimiento imaginario. Uno de los problemas que encontrarás aquí es que necesitas utilizar los datos que recibes del sujeto de la forma más eficiente posible, mientras que al mismo tiempo tienes que tener en cuenta que los BCI pueden cometer errores. Los BCI actuales son relativamente lentos y cometen errores de vez en cuando (Por ejemplo, el ordenador piensa que imaginaste el movimiento de la mano izquierda, mientras que en realidad imaginaste el movimiento de la mano derecha).» (fuente)

      En el caso del Neural Lace, se integra con el cerebro humano. Crea una simbiosis perfecta entre el humano y la máquina.

      Estas dos secciones trabajan simbióticamente entre sí. Una capa de IA o una tercera interfaz podría situarse encima de ellas, enchufándonos a un mundo muy nuevo y avanzado y dándonos la capacidad de estar a la par con nuestros amigos robots de IA.

      Esta conexión podría darnos acceso a un mayor almacenamiento de memoria, a increíbles capacidades de aprendizaje automático y, sí, a una comunicación de tipo telepático con otra persona sin necesidad de hablar.

      «Tienes una extensión de máquina de ti mismo en forma de tu teléfono y tu ordenador y todas tus aplicaciones . . de lejos tienes más poder, más capacidad que la que tenía el presidente de los Estados Unidos hace 30 años», Elon Musk

      Tipos de ICB

      Según Amit Ray, autor de Compassionate Artificial Intelligence, «las ICB más sofisticadas son las ICB «bidireccionales» (ICB), que pueden tanto registrar desde el sistema nervioso como estimularlo.
      Las interfaces cerebro-ordenador pueden clasificarse en tres grupos principales:

      En las técnicas invasivas, hay que utilizar dispositivos especiales para captar datos (señales cerebrales), estos dispositivos se insertan directamente en el cerebro humano mediante una cirugía crítica. En las semi-invasivas, los dispositivos se insertan en el cráneo en la parte superior del cerebro humano. En general, los dispositivos no invasivos se consideran los más seguros y de bajo coste. Sin embargo, estos dispositivos sólo pueden captar señales cerebrales humanas «más débiles» debido a la obstrucción del cráneo. La detección de las señales cerebrales se consigue a través de electrodos colocados en el cuero cabelludo.

      Hay varias formas de desarrollar una interfaz cerebro-ordenador no invasiva, como la EEG (electroencefalografía), la MEG (magnetoencefalografía) o la MRT (tomografía de resonancia magnética). La interfaz cerebro-ordenador basada en el EEG es el tipo de BCI preferido para el estudio. Las señales de EEG se procesan y descodifican en señales de control, que un ordenador o un dispositivo robótico perciben fácilmente. La operación de procesamiento y descodificación es una de las fases más complicadas de la construcción de una BCI de buena calidad. En concreto, esta tarea es tan difícil que, de vez en cuando, las instituciones científicas y varias empresas de software organizan concursos para crear la clasificación de señales EEG para BCI.

      Red neuronal evolutiva y BCI

      LaCNN es un tipo de red neuronal de IA basada en la corteza visual. Tiene la capacidad de aprender las características apropiadas de los datos de entrada de forma automática mediante la optimización de los parámetros de peso de cada filtro a través de la propagación hacia adelante y hacia atrás con el fin de minimizar el error de clasificación.

      La corteza auditiva humana está dispuesta en una organización jerárquica, similar a la corteza visual. En un sistema jerárquico, una serie de regiones cerebrales realiza diferentes tipos de cálculos sobre la información sensorial a medida que ésta fluye por el sistema. Las regiones más tempranas o «córtex visual primario», reaccionan a características simples como el color o la dirección. Las etapas posteriores permiten realizar tareas más complejas, como el reconocimiento de objetos.

      Una de las ventajas de utilizar la técnica de aprendizaje profundo es que requiere un preprocesamiento mínimo, ya que los ajustes óptimos se aprenden automáticamente. En cuanto a las CNN, la extracción de características y la clasificación se integran en una única estructura y se optimizan automáticamente. Además, se introdujeron en la CNN datos de series temporales fNIRS de sujetos humanos. Como la convolución se realiza de forma deslizante, el proceso de extracción de características de la CNN retiene la información temporal de los datos de la serie temporal obtenidos por fNIRS.

      Fuente

      Sin embargo, uno de los mayores problemas en la investigación de la ICB es la no estacionariedad de las señales cerebrales. Este problema hace que sea difícil para un clasificador encontrar patrones realistas en las señales, lo que resulta en malos resultados de clasificación.» (fuente)

      ¿Cómo se puede empezar a aprender sobre BCI desde cero?

      Hosea Siu, estudiante de doctorado de ingeniería aeroespacial, dijo que «Para las interfaces «cerebrales» directas, se necesita un conjunto de electrodos de EEG, y para las interfaces del sistema nervioso periférico, se necesitan electrodos de EMG.

      Una vez que se puedan introducir esos datos en el ordenador, habrá que hacer algo de acondicionamiento de la señal. Cosas como el filtrado de la frecuencia de la señal que está buscando, filtrar el ruido ambiental (el ruido de 60 Hz de las líneas eléctricas es común en los EE.UU.).

      Después, tiene que pensar en lo que realmente está tratando de hacer el sistema. ¿Necesita que detecte un cambio concreto en sus patrones de EEG cuando piensa en el color azul? ¿O necesita que detecte un cambio en su EMG cuando mueve un dedo? ¿Y el ordenador? ¿Debe ejecutar un programa? ¿Teclear algún texto?

      Piensa en cómo vas a etiquetar tus datos. ¿Cómo sabrá inicialmente el ordenador que una señal concreta es significativa?

      Esto es aprendizaje supervisado. Elija su método de clasificación preferido, obtenga muchos datos etiquetados y entrene su sistema. Puedes utilizar métodos como la validación cruzada para comprobar si tus modelos entrenados hacen lo que crees que deben hacer.

      Después de todo esto, podrías tener algo que se parece a una interfaz cerebro-ordenador.» (fuente)

      ¿Dónde puedo encontrar conjuntos de datos para el aprendizaje automático de interfaces cerebro-ordenador?

      Puede encontrar varios conjuntos de datos de EEG disponibles públicamente en el siguiente sitio web:

      • Base de datos de EEG gratuitos disponibles públicamente
      • Interfaz cerebro-ordenador de Berlín
        • Los recientes avances en inteligencia artificial y aprendizaje de refuerzo con tecnología de interfaz neural y la aplicación de varias metodologías de procesamiento de señales nos han permitido comprender mejor y luego utilizar la actividad cerebral para interactuar con ordenadores y otros dispositivos.

          Para más información