Safety y RiesgosNoticia

Herramientas de IA para salud se multiplican sin evaluación independiente

Microsoft, Amazon y OpenAI lanzan chatbots de salud masivos, pero expertos piden más evaluación antes de su liberación pública.

MIT Technology Review31 de marzo de 20264 min de lectura· Generado con IA

Microsoft lanzó Copilot Health este mes, permitiendo a usuarios conectar registros médicos y hacer consultas sobre su salud. Amazon expandió su Health AI más allá de One Medical, mientras OpenAI ya había lanzado ChatGPT Health en enero.

Estas herramientas responden a una demanda clara: Microsoft recibe 50 millones de preguntas de salud diarias, siendo el tema más popular en su app móvil. La tendencia refleja las dificultades de acceso al sistema sanitario tradicional.

El problema de la evaluación limitada

Los expertos coinciden en que estos chatbots podrían mejorar el acceso a información de salud, especialmente para poblaciones con acceso limitado. Sin embargo, expresan preocupación por la falta de evaluación independiente antes del lanzamiento público.

Un estudio reciente del Mount Sinai Health System encontró que ChatGPT Health a veces recomienda demasiada atención para condiciones leves y falla en identificar emergencias. Aunque las empresas incluyen advertencias sobre no usar estas herramientas para diagnóstico, los usuarios tienden a ignorarlas.

Limitaciones en la práctica

Investigaciones de la Universidad de Oxford revelaron una brecha significativa entre el rendimiento de los LLMs en escenarios controlados versus su uso por personas sin conocimiento médico. Los usuarios sin expertise médico lograron determinar condiciones correctamente solo un tercio de las veces, incluso con asistencia de IA.

Las empresas desarrollan sus propias evaluaciones, como HealthBench de OpenAI, pero los expertos consideran insuficiente la autoevaluación en un área de alto riesgo como la salud.

Implicaciones para América Latina

Esta tendencia es particularmente relevante para América Latina, donde el acceso a atención médica es limitado en muchas regiones. Sin embargo, la implementación sin evaluación rigurosa podría agravar disparidades existentes si las herramientas no funcionan adecuadamente para poblaciones vulnerables.

La necesidad de marcos regulatorios específicos para IA en salud se vuelve urgente, especialmente considerando que estos sistemas podrían convertirse en la primera línea de consulta médica para millones de personas en la región.

Fuente original: MIT Technology Review

Este resumen fue generado con asistencia de IA y revisado editorialmente por Algoré.

Herramientas de IA para salud se multiplican sin evaluación independiente

También en Safety y Riesgos