Aprendizaje profundo, arquitecturas reutilizables y basadas en problemas para la detección de consolidación en imágenes de rayos X de tórax

Antecedentes y objetivo: En la mayoría de los pacientes que presentan síntomas respiratorios, los hallazgos de la radiografía de tórax juegan un papel clave en el diagnóstico, manejo y seguimiento de la enfermedad. La consolidación es un término común en radiología, que indica un aumento focal de la densidad pulmonar. Cuando las estructuras alveolares se llenan de pus, líquido, células sanguíneas o proteínas tras un proceso patológico pulmonar, puede dar lugar a diferentes tipos de opacidad pulmonar en la radiografía de tórax. Este estudio pretende detectar las consolidaciones en las radiografías de tórax, con cierta precisión, utilizando la inteligencia artificial y especialmente las Redes Neuronales Convolucionales Profundas para ayudar al radiólogo a un mejor diagnóstico.

Métodos: Los conjuntos de datos de imágenes médicas suelen ser relativamente pequeños para ser utilizados para el entrenamiento de una Red Neural Convolucional Profunda (DCNN), por lo que se utiliza la técnica de aprendizaje de transferencia con DCNNs bien conocidas pre-entrenadas con el conjunto de datos de ImageNet para mejorar la precisión de los modelos. El espacio de características de ImageNet es diferente al de las imágenes médicas y, por otro lado, las conocidas DCNN están diseñadas para conseguir el mejor rendimiento en ImageNet. Por lo tanto, no pueden mostrar su mejor rendimiento en imágenes médicas. Para superar este problema, diseñamos una arquitectura basada en el problema que conserva la información de las imágenes para detectar la consolidación en el conjunto de datos de radiografías de tórax pediátricas. Propusimos un enfoque de preprocesamiento de tres pasos para mejorar la generalización de los modelos. Para demostrar la corrección de los resultados numéricos, se aplica una prueba de oclusión para visualizar las salidas del modelo y localizar el área apropiada detectada. Se utiliza un conjunto de datos diferente como validación adicional para investigar la generalización del modelo propuesto.

Resultados: La mejor precisión para detectar la consolidación es del 94,67% obtenida por nuestra arquitectura basada en el problema para el conjunto de datos understudy que supera los trabajos anteriores y las otras arquitecturas.

Conclusiones: Los modelos diseñados pueden ser empleados como herramientas de diagnóstico asistido por ordenador en la práctica real. Discutimos críticamente los conjuntos de datos y los trabajos anteriores basados en ellos y mostramos que sin algunas consideraciones los resultados de los mismos pueden ser engañosos. Creemos que el resultado de la IA sólo debe interpretarse como una consolidación focal. El significado clínico del hallazgo no puede ser interpretado sin la integración de los datos clínicos.