Redacción
Los modelos de lenguaje grandes como GPT-4 ofrecen un gran potencial para mejorar el proceso de generación de informes en radiología. En ocasiones, pueden ocurrir errores en estos informes debido a discrepancias entre profesionales, imprecisiones o la elevada carga de trabajo. Una investigación publicada en Radiology, revista de la Sociedad Radiológica de América del Norte (RSNA), muestra los posibles beneficios de integrar la inteligencia artificial (IA) en los departamentos de radiología. En concreto, el trabajo concluye que el modelo de lenguaje GPT-4 iguala el desempeño de los radiólogos en la detección de errores en los informes de radiología y puede reducir el tiempo y el coste asociados a la corrección de los mismos.
Es el primer estudio que compara distintivamente GPT-4 y el desempeño humano en la detección de errores en informes de radiología
“Estudios anteriores han demostrado aplicaciones potenciales de GPT-4 en varias etapas del recorrido del paciente en radiología. Por ejemplo, seleccionar el examen de imagen y el protocolo correctos en función del historial médico de un paciente, transformar informes de radiología de texto libre en informes estructurados o generar automáticamente la sección de impresiones de un informe”, afirma el Dr. Roman J. Gertz, autor principal del estudio y residente en el Departamento de Radiología del Hospital Universitario de Colonia (Alemania).
“Nuestra investigación ofrece un examen novedoso del potencial del GPT-4 de OpenAI”, resalta. Se trata del primer estudio que compara el modelo de lenguaje GPT-4 y el desempeño humano en la detección de errores en informes de radiología, evaluando sus capacidades frente a radiólogos de diversos niveles de experiencia en términos de precisión, velocidad y rentabilidad.
Para el estudio, se recopilaron 200 informes de radiología (rayos X e imágenes por tomografía computarizada y resonancia magnética) entre junio de 2023 y diciembre de 2023 en una sola institución. En concreto, se insertaron intencionalmente 150 errores de cinco categorías de error (omisión, inserción, ortografía, confusión lateral y “otros”) en 100 de los informes. Se encomendó a seis radiólogos (dos radiólogos experimentados, dos “médicos tratantes” y dos residentes) y al GPT-4 la tarea de detectar estos errores.
Los investigadores evaluaron la eficacia de GPT-4 para identificar errores comunes en los informes de radiología, centrándose en el rendimiento, el tiempo y la rentabilidad
Resultados clave del estudio
Los investigadores encontraron que GPT-4 tenía una tasa de detección de errores del 82,7% (124 de 150), frente al 89,3% para los radiólogos experimentados (134 de 150) y el 80,0% para los radiólogos asistentes y residentes de radiología (120 de 150). En el análisis general, GPT-4 detectó menos errores en comparación con el radiólogo senior con mejor desempeño (82,7% frente a 94,7%). Sin embargo, no hubo evidencia de una diferencia en el porcentaje de desempeño promedio en la tasa de detección de errores entre GPT-4 y todos los demás radiólogos. Además, GPT-4 requirió menos tiempo de procesamiento por informe de radiología que incluso el lector humano más rápido. Además, GPT-4 resultó en un coste medio de corrección por informe más bajo que el radiólogo más rentable.
“Esta eficiencia en la detección de errores puede indicar un futuro en el que la IA pueda ayudar a optimizar el flujo de trabajo dentro de los departamentos de radiología, garantizando que los informes sean precisos y estén disponibles rápidamente”, subraya el Dr. Gertz. “Nuestra investigación proporciona un ejemplo concreto de cómo la IA, específicamente a través de aplicaciones como GPT-4, puede revolucionar la atención médica al aumentar la eficiencia, minimizar los errores y garantizar un acceso más amplio a servicios de diagnóstico confiables y asequibles, pasos fundamentales para mejorar los resultados de la atención al paciente”, concluye.