Evaluación de los criterios de posicionamiento de la mama en el cribado mamográfico: Correlación entre el software de inteligencia artificial y los técnicos radiólogos.

Evaluación de los criterios de posicionamiento de la mama en el cribado mamográfico: Correlación entre el software de inteligencia artificial y los técnicos radiólogos.

24.02.2022

Artículo original: Gunvor G Waade, Anders Skyrud Danielsen, Asne S Holen et al. Assessment of breast positioning criteria in mammographic screening: Agreement between artificial intelligence software and radiographers. J Med Screen. March 9, Vol 28, Issue 4, 2021; pp. 448–455.

DOI: 10.1177%2F0969141321998718

Sociedad: Medical Screening Society.

Palabras clave: artificial intelligence, breast neoplasm, breast screening, mammography, radiography.

Abreviaturas y acrónimos utilizados: inteligencia artificial (IA), técnicos superiores en imagen para el diagnóstico (TSID), perfect, good, moderate, inadequate (PGMI), excellent, adequate, repeat (EAR), mamografía digital (DM), tomosíntesis de mama digital (DBT), craneocaudal (CC), mediolateral oblicua (MLO), correlación intraclase (CCI), sistema de archivo y comunicación de imágenes (PACS) y comunicación y digitalización de imágenes médicas (DICOM).

Línea editorial del número

Journal of Medical Screening es una publicación trimestral interdisciplinaria, proporciona información esencial sobre detección, epidemiología y salud pública. Tiene un factor de impacto de 2.136 y es miembro de la COPE (Committee on Publication Ethics).
En esta edición podemos encontrar 1 revisión sistemática de una extensión del programa de detección de cáncer colorrectal con pruebas inmunoquímicas fecales y otra revisión para la European Commission Initiative on Breast Cancer (Iniciativa de la comisión Europea para el cáncer de mama) acerca de los beneficios y daños de la mamografía de detección del cáncer de mama para mujeres de riesgo. De los artículos originales de la presente edición, la mayoría se centran en la detección del cáncer de mama y de colon y el resto de artículos tratan de la detección prenatal, de pulmón, de próstata y por último un artículo de la comparación de la citología y las pruebas primarias basadas en el virus del papiloma humano en los programas de cribado cervical en los países nórdicos.

Motivos para la selección

Parece que la IA está más dirigida a los radiólogos en nuestras áreas de trabajo, pero los técnicos no deberíamos quedarnos atrás y subirnos a este carro ya que tiene muchas aplicaciones y ha venido para quedarse. He elegido este artículo por la correlación directa entre el software de IA y los técnicos. 

Resumen

La calidad de las imágenes en el cribado mamográfico ha demostrado influir en la tasa de recitación y de detección del cáncer de mama y, en consecuencia, la sensibilidad y la especificidad del cribado. Hay varios factores que afectan a la calidad de la imagen, y la posición de la mama es uno de los principales.

Existen diferentes sistemas de evaluación de la calidad de la imagen:
Los sistemas más utilizados incluyen el sistema PGMI y el EAR. Estos se desarrollaron para la mamografía analógica, en la que la calidad no era posible evaluarla inmediatamente durante el examen de cribado. El Programa de Cribado Noruego ha utilizado una versión modificada y revisada, la más reciente en el 2011. Sin embargo, la clasificación PGMI aparte de requerir mucho tiempo, es subjetiva, ya que la evaluación difiere entre los evaluadores, lo que plantea dudas sobre la fiabilidad y la validez de estos. En 2017, las guías del Reino Unido para el cribado mamográfico afirmaron que el PGMI y la EAR ya no son métodos aceptables para evaluar la calidad de la imagen.

En la actualidad, la mayoría de estudios sobre la calidad de la imagen y el posicionamiento se basan en la DM, y menos en la DBT.

La evaluación del posicionamiento fué realizada por la IA y por cuatro TSID en un estudio doble ciego en 156 mamografías del programa de cribado Noruego, 79 (50,6%) realizadas con DM y 77 (49,4%) realizadas con DBT. Los TSID realizaron la evaluación de manera manual en pantallas de cinco megapíxeles. Un quinto técnico hacía el arbitraje en caso de desacuerdo. La evaluación de la IA se realizó en todos los exámenes incluyendo la población del estudio, utilizando el software de procesamiento de imágenes automatizado que obtiene la información de las imágenes DICOM.

Se utilizaron diez criterios de colocación de la mama; tres para la CC y siete para la MLO, evaluando el aspecto del pezón, la rotación de la mama, el músculo pectoral, el pliegue inframamario y la línea del pezón-pectoral.

Los TSID revisaron las imágenes y discutieron los criterios para llegar a un acuerdo. Se utilizó una herramienta de medición de la distancia en el PACS para medir la línea del pezón-pectoral. Para la evaluación de las observaciones se utilizó la CCI y el coeficiente de fiabilidad interobservador.

El objetivo de este estudio fué determinar la concordancia entre un sistema de IA y los TSID en la evaluación de los criterios de posicionamiento de la mama.

Se observó una concordancia sustancial casi perfecta entre la IA y los técnicos para el criterio de pezón de perfil y una excelente correlación para la línea del pezón-pectoral. Sin embargo, sólo hubo una concordancia de leve a moderada para los demás criterios, y en general una mayor concordancia entre los dos pares de técnicos que entre los técnicos y la IA.

Estos resultados apoyan el uso de la formación de los técnicos para lograr una evaluación más uniforme, que podría conducir a un posicionamiento mamográfico óptimo.

La IA tiene una gran potencial al reducir la subjetividad en la calidad de la imagen y en el posicionamiento de la mama entre los técnicos, y reducir las repeticiones debidas a las preferencias u opiniones de los técnicos. Además, la evaluación inmediata, antes que la mujer abandone la unidad, podría reducir las recitaciones, liberar recursos y hacer que los programas sean más rentables y eficaces. Es necesario investigar si los sistemas de IA proporcionan una medida válida y fiable de los criterios.

Se necesitan definiciones y métodos de evaluación estandarizados, basados en la evidencia, para alcanzar una calidad de imagen óptima en la mamografía.

Valoración Personal

Los criterios seleccionados para la evaluación de las imágenes mamográficas quizás sean muy limitados, ya que sólo incluyen el posicionamiento y hay otros criterios que también influyen en la calidad como la exposición, el movimiento, los artefactos…y que probablemente son más objetivos de valorar por la IA. Además, la población de estudio también es limitada ya que se excluyeron las imágenes de mujeres con implantes mamarios.

Una de las ventajas de la valoración por parte de la IA es la inmediatez, antes que la mujer abandone la Unidad de Mama y se congratulan de poder reducir el número de recitaciones y hacer que los programas de cribado sean más rentables y eficaces. Pero se olvidan de nombrar una consecuencia muy positiva y es el hecho de poder confirmar a las mujeres que la mamografía ha salido técnicamente bien al momento, es un factor muy importante para reducir la ansiedad que causa esta prueba en algunas mujeres.

Cecilia Aynés Suárez
Parc Taulí Hospital Universitari. Sabadell. TSIDMN.

caynes@tauli.cat  @Caynes4

Noticias Relacionadas

Definición de la mortalidad esperada a los 30 días para pacientes sometidos a Radioterapia Paliativa: un metanálisis.
Definición de la mortalidad esperada a los 30 días para pacientes sometidos a Radioterapia Paliativa: un metanálisis.
 Optimización de la proyección anteroposterior de abdomen para pacientes con mayor espesor abdominal.
Optimización de la proyección anteroposterior de abdomen para pacientes con mayor espesor abdominal.
Tomografía computarizada de tórax personalizada(Niveles mínimos de dosis de radiación diagnóstica para la detección de fibrosis, nódulos y neumonía).
Tomografía computarizada de tórax personalizada(Niveles mínimos de dosis de radiación diagnóstica para la detección de fibrosis, nódulos y neumonía).
Estudio de la variabilidad de intensidad de opacificación, por medio de contraste, en estudios de accidentes cerebro vasculares agudos mediante angiografía por tomografía computarizada en centros especializados y atención inicial en Estados Unidos.
Estudio de la variabilidad de intensidad de opacificación, por medio de contraste, en estudios de accidentes cerebro vasculares agudos mediante angiografía por tomografía computarizada en centros especializados y atención inicial en Estados Unidos.