Radiología 3D: ¿Cómo La IA Merlin Unifica Diagnósticos Fiables En Hospitales?

marzo 5, 2026 al DIA

Una IA para radiología logra diagnósticos consistentes usando imágenes 3D de distintos hospitales

Para resolver una de las mayores dudas sobre la inteligencia artificial en medicina, su capacidad para generalizar resultados, un equipo de investigadores de la Universidad de Stanford ha desarrollado un nuevo modelo de visión y lenguaje llamado Merlin. Este sistema aprende de tomografías computarizadas (TC) abdominales volumétricas (3D), informes de radiología y datos de historias clínicas electrónicas. Su gran avance es haber demostrado un rendimiento estable en tres hospitales externos, lo que valida su potencial para una adopción clínica más allá de su entorno de entrenamiento original.

Para impulsar la investigación, el conjunto de datos de visión y lenguaje publicado en código abierto, que comprende 25,494 tomografías y sus informes, es el conjunto de evaluación de Merlin, no su conjunto de entrenamiento.

El desafío: más demanda, menos especialistas y riesgo de errores

El desarrollo de herramientas como Merlin es fundamental para un sector bajo presión. La demanda global de imágenes médicas no para de crecer mientras que la escasez de radiólogos es un problema persistente. Solo en Estados Unidos, se realizan aproximadamente 30 millones de tomografías computarizadas abdominales cada año.

Este desequilibrio ha aumentado la carga de trabajo en la interpretación de pruebas y, con ello, el riesgo para la atención al paciente. Como respuesta, la industria ha impulsado la creación de herramientas de IA para radiología, que ya representan cerca del 75% de todos los dispositivos médicos con IA aprobados por la FDA en EE. UU. A pesar de este avance, una limitación clave para su uso clínico generalizado es que muchos modelos aprobados no han sido evaluados en múltiples centros y pueden rendir por debajo de lo esperado cuando se utilizan con datos externos a los de su entrenamiento. Como hemos analizado en nuestra cobertura anterior, los problemas de fiabilidad y consistencia son, de hecho, uno de los mayores frenos para una adopción segura y generalizada.

Una prueba de fuego superada sin reentrenamiento

La capacidad de generalización de Merlin se puso a prueba evaluando su precisión para clasificar retrospectivamente 30 anomalías abdominales en 37.855 tomografías de tres centros hospitalarios externos. El detalle clave es que se hizo en modo zero-shot, es decir, sin ningún tipo de ajuste o reentrenamiento previo con los datos de los nuevos hospitales.

¿Qué es el aprendizaje zero-shot? Es la capacidad de un modelo de IA para realizar una tarea para la que no ha sido entrenado explícitamente.
Por qué importa: Demuestra que el modelo no solo memoriza patrones, sino que entiende los conceptos subyacentes. Esto lo hace mucho más flexible y fiable para funcionar en entornos nuevos y desconocidos, un requisito indispensable en medicina.
Ejemplo: Es como si un chef que solo ha aprendido a hacer pasteles de fresa pudiera preparar uno de arándanos a la primera, sin receta, porque entiende los principios fundamentales de la repostería.

En todas las ubicaciones, Merlin superó consistentemente a la segunda mejor arquitectura alternativa, logrando una mejora media del 19,7% en la precisión de clasificación. En comparación con el siguiente mejor modelo de visión y lenguaje, su rendimiento fue superior en un 34,4%, 15,7% y 8,9% en cada uno de los tres hospitales. Este sólido desempeño sugiere que el modelo es robusto frente a variaciones en la demografía de los pacientes, los protocolos de imagen o las prácticas de redacción de informes de los radiólogos.

La clave del éxito: visión 3D y entrenamiento multimodal

Los desarrolladores incluyen a los co-primeros autores Ashwin Kumar y Louis Blankemeier, entre otros investigadores afiliados a la Universidad de Stanford, atribuyen el excelente rendimiento de Merlin a dos factores principales: su codificador de imágenes 3D completo y su preentrenamiento multimodal a gran escala. Estos hallazgos abren un camino hacia la creación de sistemas de IA para radiología con un rendimiento robusto en diferentes sistemas de salud, lo que facilitaría una implementación clínica más amplia.

El éxito de Merlin demuestra que el entrenamiento multimodal, utilizando una combinación de imágenes, informes de radiología y datos de historias clínicas, es un enfoque prometedor para desarrollar modelos de IA más fiables y generalizables.

Del laboratorio a la clínica: la carrera por la IA en radiología ya está en marcha

Mientras Merlin representa un avance en la investigación, el sector comercial avanza a pasos agigantados para implementar soluciones similares. Un ejemplo claro es la empresa RadNet, que a través de su filial DeepHealth se ha posicionado como el mayor proveedor mundial de soluciones clínicas de IA para radiología tras adquirir compañías como iCAD y Gleamer.

El objetivo de empresas como RadNet es crear un flujo de trabajo de principio a fin asistido por IA. Esto incluye desde la priorización de casos urgentes hasta la generación de borradores de informes para que el radiólogo los revise, aumentando la eficiencia y la precisión. En la práctica, algunas de estas herramientas ya están mostrando un impacto tangible: una IA de DeepHealth para la detección de cáncer de mama logró aumentar entre un 20% y un 22% la detección temprana de tumores.

El motor de esta expansión comercial es la obtención de autorizaciones regulatorias, como la aprobación de la FDA.

Aprobación de la FDA (Food and Drug Administration): Es la autorización de la agencia reguladora de EE. UU. para comercializar un dispositivo médico o una herramienta de IA.
Por qué importa: Confirma que el producto cumple con estrictos estándares de seguridad y eficacia, funcionando como un sello de confianza indispensable para su uso clínico en hospitales.
Ejemplo: Cuando una empresa anuncia una "aprobación de la FDA", significa que los centros médicos pueden comprar y utilizar legalmente su tecnología para diagnosticar pacientes.

Howard G. Berger, CEO de RadNet, subraya que el objetivo no es reemplazar a los profesionales, sino transformar la sanidad. La IA se ve como una herramienta crítica para hacer frente a la escasez de personal y al aumento de la demanda, mejorando la productividad y la precisión para que los radiólogos puedan centrarse en los casos más complejos.

Próximos pasos: de la validación a la implementación

A pesar de sus prometedores resultados, antes de que Merlin pueda implementarse en un entorno clínico, necesitará una validación prospectiva. Esto implica probarlo en tiempo real con datos nuevos y diversos. También deberá ser evaluado en otras tareas, como la generación automática de informes de radiología y la predicción de la evolución de enfermedades.

Al publicar el modelo y el conjunto de datos en código abierto, la comunidad investigadora puede ahora reproducir y ampliar estos hallazgos. Estos experimentos servirán como base para el futuro de la IA en el diagnóstico por imagen, un campo que ya está pasando de ser una promesa de futuro a una realidad clínica.