Real World Data - Aplicaciones IA

23 de Abril de 2025

Los datos del sector de salud presentan el crecimiento más acelerado entre todas las industrias

La implementación de nuevas políticas, junto con los descubrimientos científicos y las tecnologías innovadoras en salud, ha impulsado un notable aumento en el volumen y la variedad de los datos disponibles.

La secuenciación genómica combinada con el aumento de medicamentos específicos para biomarcadores ha llevado a un aumento de las pruebas genéticas. A su vez, la tecnología portátil y las aplicaciones de salud recopilan una amplia gama de datos de los usuarios, como la frecuencia cardíaca, la cantidad de  pasos, la ubicación geográfica y más.

Estos factores han llevado al acelerado crecimiento de todo el ecosistema de Real World Data.
Los grandes gigantes tecnológicos, como Facebook, Amazon, Microsoft, Google y Apple,  han centrado su atención en el sector sanitario, cuyo valor se estima en 8,3 billones de dólares.

Desde principios de 2020, se han concretado acuerdos en este ámbito por un valor acumulado de 6.800 millones de dólares.

Microsoft invirtió en IA conversacional para la atención médica y lanzó Microsoft Cloud for Healthcare, una pila tecnológica para organizaciones empresariales de atención médica que combina Inteligencia artificial, automatización y desarrollo de aplicaciones low-code. Por su parte, Google lanzó una herramienta de búsqueda que utiliza inteligencia artificial para diagnosticar afecciones de la piel, una solución de búsqueda de registros médicos electrónicos (EHR) para proveedores y una solución de interoperabilidad para pagadores.

El mercado está creciendo a pasos agigantados y las oportunidades de innovación abundan.

En Cromodata, somos una plataforma especializada en datos
Si bien para entrar en la categoría de “originadores de datos” sería necesario generar datos primarios —como lo hacen los dispositivos médicos, sensores o estudios clínicos— en nuestro caso actuamos como intermediarios entre esas fuentes y quienes consumen los datos. Establecemos relaciones con centros de salud, hospitales, clínicas y otras instituciones que efectivamente producen los datos.

Aunque podríamos ser considerados “agregadores de datos”, en Cromodata nos definimos como una plataforma de datos: recolectamos, limpiamos, estructuramos, tokenizamos y anonimizamos la información, asegurando su calidad y utilidad
A continuación  te presentamos algunas de las áreas del sistema de salud  (Healthcare) relacionadas con el mundo de RWD
Hacé click en los botones de aquí abajo y desplegá
(salud mental, bienestar, aptitud física, nutrición y suplementos, monitoreo remoto)
(pruebas poc, pruebas de laboratorio, tecnología de diagnóstico, soporte de decisiones y salud de  la población)
(telesalud, salud en el hogar, tratamientos primarios, tratamientos específicos, hospitales)
(rehabilitación, asistencia social, cuidados crónicos, cuidados para personas mayores)
(formación y acreditación, salud y seguridad)
(registros de salud, gestión de prácticas, reservas y referencias, análisis de salud)
(wearables, dispositivos médicos, equipamiento médico, imágenes médicas y robótica médica)
(beneficios en salud, salud corporativa, seguro de salud, financiación de activos de salud, propiedades para el sector salud)
(producción de medicamentos, comercialización de medicamentos, logística sanitaria y farmacias)
(descubrimientos, ensayos clínicos, insight clínicos, medicina de precisión, genómica)
Particularidades y Aplicaciones de los Datos del Mundo Real (RWD)
En primer lugar, los datos del mundo real son de carácter observacional, en contraste con los datos obtenidos en entornos controlados, como los ensayos clínicos aleatorizados.

En segundo lugar, una proporción significativa del RWD es no estructurado —como los registros en texto libre o las imágenes médicas— y puede presentar inconsistencias debido a la heterogeneidad en los procesos de documentación entre profesionales, instituciones y sistemas de salud.

En tercer lugar, estos datos pueden generarse a una alta frecuencia temporal, como ocurre con los dispositivos portátiles que capturan mediciones en milisegundos, lo cual deriva en volúmenes de datos extensos, complejos y en constante actualización.

En cuarto lugar, el RWD suele estar incompleto o carecer de información crítica para ciertos análisis, ya que su recolección original no fue diseñada con fines investigativos. Por ejemplo, los datos provenientes de aseguradoras rara vez contienen desenlaces clínicos, mientras que muchos registros asistenciales presentan un seguimiento longitudinal limitado.

En quinto lugar, estos datos pueden estar sujetos a sesgos sistemáticos y errores de medición. Un caso frecuente es el sesgo de selección en datos generados mediante plataformas digitales, dispositivos móviles o wearables, lo que puede comprometer la representatividad de la muestra respecto de la población objetivo.

Entonces, para que los datos RWD sí sean representativos es necesario aplicar técnicas de muestreo y un buen diseño de estudio.
Aplicaciones IA
La inteligencia artificial (IA) está pisando fuerte en la industria de la salud y las ciencias biológicas, y especialidades como la oncología y neurología han incorporado de manera acelerada las herramientas de IA desarrolladas en los últimos años, especialmente del año 2020 en adelante.

Es una ayuda invaluable para asistir a radiólogos y patólogos a leer mamografías, resonancias magnéticas, tomografías computarizadas y dispositivos digitales.

La visión artificial (computer visión), otro campo de la IA, es de hecho una aplicación clave en el diagnóstico por imágenes. A partir de la generación de imágenes 2D, 3D y videos (que pueden ser capturados con un celular, por ejemplo) es posible que sistemas automatizados analicen dichas imágenes, detecten posibles anomalías y generen informes preliminares en tiempo real. Esto no solo reduce los tiempos de diagnóstico, sino que también mejora la precisión y la cobertura médica, especialmente en aquellas zonas aisladas, sin acceso a radiólogos o equipos. Además, estos sistemas pueden integrarse con soluciones de telemedicina, permitiendo que los resultados sean revisados de forma remota por especialistas ubicados en otras regiones del país o del mundo.

Muchas otras especialidades, además de la patología,  han demostrado su aplicabilidad clínica, como la radiología, la oftalmología y la dermatología. Gracias a estos desarrollos ya se han detectado en imágenes y estudios realizados en los últimos dos años múltiples cánceres en etapas tempranas, lo que ha permitido que esos pacientes reciban un tratamiento más inmediato y mejoren su pronóstico.  

Algunas de las aplicaciones de la IA en salud incluyen

La data clínica abarca tanto los datos del Historial Clínico Electrónico (HCE)-es decir data relacionada con internaciones, intervenciones, tratamientos, consultas médicas, diagnósticos, síntomas, análisis de laboratorio e imágenes, y hasta notas de las historias clínicas - como también datos demográficos, resultados de pruebas de laboratorio, procedimientos, datos de patología/histología, imágenes de radiología, datos de microbiología, notas de los proveedores, informes de admisión/alta y progreso, estado funcional, etc.
Datos de pruebas genómicas y genéticas (SNP/paneles); datos multiómicos (proteómica, transcriptómica, metabolómica, lipidómica); y estado de otros biomarcadores.
Son rastreadores de actividad física, dispositivos portátiles y otras aplicaciones de salud para la medición de la actividad y la función corporal. Incluyen a los dispositivos móviles como los teléfonos inteligentes, tablets, dispositivos de monitorización y  asistentes digitales personales. Y también incluyen los dispositivos portátiles, que vendrían a ser los  relojes inteligentes o las pulseras de actividad (Fitbit, Apple Watch, etc.), que monitorean parámetros de salud como ritmo cardíaco, actividad física, niveles de oxígeno en sangre, calidad del sueño y otros.  Incluso otros dispositivos médicos como los monitores de presión arterial, termómetros digitales, oxímetros de pulso, monitores de glucosa en sangre, y cualquier dispositivo  que permita a los pacientes controlar su salud en tiempo real son generadores de datos.
Reclamaciones médicas y otros datos sobre el uso de medicamentos y tratamientos. También incluyen los registros informados por pacientes: encuestas, dietas, hábitos, registros de salud personales, informes de eventos adversos, medidas de calidad de vida, entre otros. Y aquí también se incluyen otros registros de aseguradoras y facturación.
Registros administrativos, terapias concomitantes, datos de punto de venta y reclamaciones médicas.
Factores climáticos, contaminantes, infecciones, hábitos de vida (dietas, hábitos), registros de salud personales, informes de eventos adversos, medidas de calidad de vida, entre otros.
Carga de enfermedad (o disease burden), características clínicas, prevalencia/incidencia, tasas de tratamiento, uso de recursos y costos, control de enfermedades,  medidas de calidad de vida, etc.
Datos históricos sobre condiciones de salud y alergias relacionadas con el paciente y su familia extendida, estado de tabaquismo, consumo de alcohol, hábitos generales y datos demográficos.

🔹Extracción de datos complejos y multimodales para crear un recorrido longitudinal más completo del paciente, que no solo incluya datos clínicos e informados por el paciente, sino que también pueda manejar datos moleculares discretos y continuos.
🔹Uso de IA para interpretar imágenes y videos médicos más allá de la capacidad humana.
🔹Descubrimiento de objetivos fisiológicos y moleculares y modelado de tratamientos facilitados por IA.
🔹Adopción en la IndFlujos de trabajo de IA y tecnología de la nube para mejorar los espacios de trabajo de investigación virtuales e impulsar una mayor colaboración y productividad a escala.

La combinación perfecta: Estadística + IA
La combinación de inferencia estadística y aprendizaje automático (ML) es crucial para mejorar los procesos de generación de evidencia del mundo real (RWE, Real World Evidence), y para entender las relaciones causales en el análisis de datos.

Un enfoque metodológico bien conocido es el aprendizaje dirigido (targeted learning).

El aprendizaje dirigido, o Targeted learning, utiliza tanto inferencia estadística como aprendizaje automático para hacer estimaciones causales más precisas. Este ha sido exitosamente aplicado por ejemplo en la inferencia causal para reglas de tratamiento dinámicas usando datos de registros electrónicos de salud (EHR, por sus siglas en inglés) y la eficacia de los tratamientos para COVID-19.

Teniendo en cuenta todos los avances tecnológicos y metodológicos que fuimos exponiendo, creemos que es adecuado afirmar que el futuro hoy se encuentra en la capacidad de combinar la experiencia en inferencia estadística y el aprendizaje automático (ML, Machine Learning) para generar evidencia del mundo real (RWE) y aprender relaciones causales.

De hecho, uno de los desarrollos metodológicos recientes va en esa dirección: aprovechar los avances en la teoría semiparamétrica y los procesos empíricos, e incorporar los beneficios del aprendizaje automático en la efectividad comparativa utilizando datos del mundo real (RWD).

Este es el verdadero futuro de los datos.
De los datos del mundo real.

Bibliografía:
Thomason, J. (2021). Big tech, big data and the new world of digital health. Global Health Journal, 5(4), 165-168.
Sherman, R. E., Anderson, S. A., Dal Pan, G. J., Gray, G. W., Gross, T., Hunter, N. L., ... & Califf, R. M. (2016). Real-world evidence—what is it and what can it tell us. N Engl J Med, 375(23), 2293-2297.
Liu, F., & Panagiotakos, D. (2022). Real-world data: a brief review of the methods, applications, challenges and opportunities. BMC Medical Research Methodology, 22(1), 287.
US Food and Drug Administration. (2022). Real-world evidence (2022).
Wu, J., Roy, J., & Stewart, W. F. (2010). Prediction modeling using EHR data: challenges, strategies, and a comparison of machine learning approaches. Medical care, 48(6), S106-S113.