¿Cómo puede la inteligencia artificial mejorar el diagnóstico del cáncer de mama?
El cáncer de mama sigue siendo uno de los más comunes entre las mujeres en todo el mundo. Detectar esta enfermedad a tiempo es crucial para salvar vidas. Las ecografías, especialmente las de tipo bidimensional (2D) y las que usan flujo a color (CDFI), son herramientas clave para evaluar masas en el seno. Sin embargo, incluso para los radiólogos más experimentados, diferenciar entre tipos de masas mamarias puede ser un desafío. Aquí es donde entra en juego la inteligencia artificial (IA).
El problema actual
En China, las masas mamarias se clasifican en cuatro grupos según su tratamiento: masas inflamatorias, adenosis, tumores benignos y tumores malignos. Cada tipo requiere un enfoque clínico diferente. Por ejemplo, las masas inflamatorias, como la mastitis granulomatosa, pueden parecer cáncer en las ecografías, lo que lleva a biopsias innecesarias. Por otro lado, la adenosis esclerosante, un tipo de adenosis, a menudo se confunde con tumores malignos debido a su apariencia irregular.
Los sistemas de diagnóstico asistido por computadora (CAD) actuales se centran principalmente en distinguir entre tumores benignos y malignos. Esto deja un vacío en el diagnóstico de subtipos como la adenosis y las masas inflamatorias. La IA puede ayudar a llenar este vacío, mejorando la precisión del diagnóstico y optimizando el tratamiento.
El estudio y los datos
Un estudio reciente analizó datos de 3,623 pacientes de 13 hospitales en China. Se recopilaron 15,648 imágenes de ecografías realizadas entre enero de 2016 y enero de 2018. Solo se incluyeron casos con confirmación histopatológica, es decir, aquellos en los que se realizó una biopsia o cirugía para confirmar el diagnóstico.
Los pacientes con implantes mamarios, infección por VIH o imágenes de baja calidad fueron excluidos. El conjunto de datos incluyó 1,601 tumores benignos, 1,179 tumores malignos, 572 masas inflamatorias y 271 casos de adenosis. Las imágenes se obtuvieron usando diferentes equipos de ecografía, lo que aseguró una gran variedad en los protocolos de imagen.
La arquitectura de la IA
El sistema de IA utilizado en el estudio se basó en una red neuronal convolucional (CNN), un tipo de modelo de aprendizaje profundo. Esta CNN tenía dos módulos principales: uno para detectar las masas mamarias y otro para clasificarlas.
-
Módulo de detección:
- Extracción de características: Usó una red llamada ResNet-50 para identificar características clave en las imágenes.
- Propuesta de regiones: Identificó áreas sospechosas y eliminó aquellas con baja probabilidad de ser masas.
-
Módulo de clasificación:
- Modelos evaluados: Se probaron tres configuraciones:
- Modelo 2D: Solo usó imágenes en escala de grises.
- Modelo 2D-CDFI: Combinó imágenes 2D y de flujo a color.
- Modelo 2D-CDFI-PW: Añadió datos de flujo pulsado (PW) a las imágenes 2D y CDFI.
- Mecanismos de atención: En el modelo 2D-CDFI-PW, se usaron técnicas para fusionar los datos de flujo pulsado con las imágenes 2D y CDFI.
- Modelos evaluados: Se probaron tres configuraciones:
El entrenamiento del modelo incluyó técnicas como la rotación y el escalado de imágenes para evitar el sobreajuste. También se usó un método llamado «Snapshot Ensembling» para combinar varios modelos y mejorar la precisión.
Resultados clave
Rendimiento según el tipo de imagen
El modelo 2D-CDFI tuvo el mejor rendimiento:
- Precisión: 89.2% frente al 87.9% del modelo 2D y el 88.7% del modelo 2D-CDFI-PW.
- Área bajo la curva (AUC):
- Tumores benignos: 0.94.
- Tumores malignos: 0.96.
- Masas inflamatorias: 0.80.
- Adenosis: 0.81.
La sensibilidad y la especificidad superaron el 90% para tumores benignos y malignos, pero fueron más bajas para masas inflamatorias (55%) y adenosis (46%). Esto se debe a que estas categorías estaban menos representadas en el conjunto de datos.
Tamaño de la masa
El rendimiento del modelo 2D varió ligeramente según el tamaño de la masa:
- ≤1 cm: 81.7%.
- 1–2 cm: 82.3%.
- 2–5 cm: 85.1%.
- >5 cm: 84.6%.
No hubo diferencias significativas entre los grupos, lo que muestra que el modelo es robusto independientemente del tamaño.
Validación en múltiples hospitales
El modelo se validó con datos del Hospital de la Amistad China-Japón (CJ):
- Conjunto de datos CJ (219 casos):
- Modelo 2D: 88.9% de precisión para tumores benignos, 90.2% para malignos.
- Modelo 2D-CDFI: 85.7% de precisión para tumores benignos, 90.9% para malignos.
Hubo diferencias en el rendimiento entre hospitales, lo que refleja la variabilidad en los protocolos de imagen y la prevalencia de ciertas masas.
Comparación con radiólogos
La CNN superó a 37 radiólogos experimentados en una evaluación ciega de 50 imágenes:
- CNN: 89.2% de precisión, tiempo de procesamiento de 400 ms.
- Radiólogos: Precisión media del 30%, tiempo medio de interpretación de 314 segundos.
Esta diferencia resalta el potencial de la IA para reducir los errores de diagnóstico y mejorar la eficiencia en los hospitales.
Implicaciones técnicas y clínicas
- Importancia del flujo a color (CDFI): La integración de CDFI mejoró la precisión al capturar patrones vasculares asociados con tumores malignos.
- Robustez del algoritmo: El modelo funcionó bien en diferentes equipos y tamaños de masas, lo que sugiere que es útil en diversos entornos clínicos.
- Integración en la práctica clínica: El procesamiento en tiempo real permite usar este sistema en hospitales, ayudando a los radiólogos a priorizar casos de alto riesgo.
Limitaciones y futuras direcciones
- Desequilibrio en los datos: Las masas inflamatorias y la adenosis estaban poco representadas, lo que afectó la sensibilidad del modelo.
- Imágenes de flujo pulsado (PW): Se necesitan más datos para evaluar su utilidad.
- Validación prospectiva: Aunque el estudio fue multicéntrico, se requieren pruebas en entornos reales para confirmar su eficacia.
Conclusión
Este estudio muestra que la IA, especialmente con imágenes 2D-CDFI, puede mejorar significativamente el diagnóstico del cáncer de mama al clasificar las masas en cuatro categorías clínicamente relevantes. Al superar a los radiólogos en velocidad y precisión, este modelo ofrece una herramienta valiosa para reducir errores y optimizar el tratamiento.
For educational purposes only.
doi.org/10.1097/CM9.0000000000001329