Históricamente, las grandes empresas médicas, las nuevas empresas médicas y gran parte del mundo académico médico han estado sumergidos en el secreto y la investigación patentada. Esto es un resultado directo de la privacidad de los datos médicos y de los pacientes, pero como la IA impulsa todo, desde la medicina de diagnóstico hasta el tratamiento y la atención del paciente, es hora de cambiar el paradigma. Al adoptar los principios de la colaboración de código abierto y encontrar un equilibrio entre proteger la privacidad y compartir conocimientos, la industria puede acelerar y democratizar el ritmo de la innovación y, potencialmente, agilizar un proceso de aprobación de la FDA que puede mantener la innovación como rehén durante hasta una década.
Las soluciones de IA médica prometen ayudar a abordar la escasez de médicos internacionales al proporcionar a los profesionales herramientas que les ayuden a evaluar y tratar a más pacientes más rápidamente. En productos farmacéuticos, dónde se lanza al mercado un nuevo fármaco. A un costo de 2.600 millones de dólares Lleva entre 10 y 15 años y promete impulsar la producción, permitiendo que medicamentos que cambian vidas se lancen más rápido y a menor costo.
Sin embargo, si la herramienta de inteligencia artificial no funciona según lo previsto, los resultados pueden ser desastrosos y provocar diagnósticos erróneos, medicamentos defectuosos e incluso la muerte. Los desarrolladores deben crear IA médica que cumpla con los cinco estándares de confiabilidad, lo que significa que sus modelos funcionan según lo previsto el 99,999 por ciento de las veces, o tal vez más en IA médica.
con Transparencia de código abierto Lo más importante en esta área es que los desarrolladores enfrentan dos desafíos principales: ser más conscientes de la incertidumbre en sus soluciones de IA y luego comunicar esto de manera efectiva a los profesionales.
Ampliando los límites de la IA médica con transparencia de código abierto
Si bien la transparencia del software de código abierto ha ayudado a democratizar la innovación en todo, desde los teléfonos inteligentes hasta Internet, compartir sistemas de inteligencia artificial es más complejo. En lugar de una serie de códigos, los sistemas de IA se basan en el código fuente, los parámetros del modelo, los datos, los hiperparámetros, el código fuente de entrenamiento e inferencia, la generación de números aleatorios y marcos de software auxiliares, y cada componente debe funcionar en armonía para que los modelos funcionen según lo previsto.
Cuando los desarrolladores pueden examinar todas estas partes móviles y comprender el comportamiento del sistema a través del compromiso con el código abierto, se fomenta la innovación y se reducen las fallas. En lugar de reinventar constantemente la rueda o confiar ciegamente en sistemas que no se pueden investigar, pueden generar una transformación real.
con Conjuntos de datos incompletos, sesgados o inconsistentes Los desarrolladores de IA médica suelen estar en el centro del fracaso de los modelos y también enfrentan un desafío importante. Como todos los desarrolladores de IA, necesitan suficientes datos válidos para entrenar sus algoritmos y garantizar que su conjunto de resultados cubra completamente todos los resultados posibles de su modelo. Recuerdo como Google Med-Gemini forma parte del cuerpo– También deben tener cuidado con las alucinaciones.
Con vidas en juego, los conjuntos de datos médicos no sólo deben ser grandes, sino también representativos de poblaciones diversas, de lo contrario, algunos pacientes serán mal diagnosticados o maltratados. Después de un Un estudio sistemático realizado en 2023 sobre 48 modelos de IA en el sector sanitario encontró que la mitad de ellos mostró un alto riesgo de sesgo, lo que refleja la necesidad de que los desarrolladores en el campo corrijan el rumbo de la historia de sesgo en la investigación médica.
En 2019, por ejemplo, un estudio realizado por Revisión de tecnología del MIT demostró que un algoritmo aplicado a 70 millones de pacientes favorecía desproporcionadamente a los pacientes blancos sobre los negros al predecir la necesidad de intervención médica. Una vez que se detectó este sesgo, los investigadores trabajaron con el fabricante del software para verificar la calidad de los datos mientras interactuaban con el modelo, identificar el sesgo en juego, iterar para encontrar una solución y, en última instancia, reducir la varianza en más del 80 por ciento.
Cuando la industria y el mundo académico colaboran, innovan más rápido para crear tecnología en la que podamos confiar.
Y cuando los conjuntos de datos son de código abierto y están disponibles para que cualquiera pueda revisarlos, el público ha demostrado descubrir contenido preocupante incluso antes, tal como lo hizo cuando fue eliminado. 1000 URL que contienen material verificado de abuso sexual infantil En el conjunto de datos LAION 5B que alimenta generadores de imágenes de IA, por ejemplo Propagación estable y vuelo medio..
Más allá de eso, si podemos crear una selección de conjuntos de datos de código abierto, los investigadores y desarrolladores verán que el tiempo entre la innovación, la aprobación y el uso práctico se reducirá astronómicamente.
Obstáculo de datos de HIPAA
Aunque los médicos y los desarrolladores de IA tienen obligaciones legales de proteger la privacidad de los pacientes, las principales empresas han capturado grandes cantidades de datos de pacientes. Estas empresas con fines de lucro desalientan el intercambio de código abierto, lo que hace que la recopilación de datos sea más difícil y costosa.
Más allá de esta tendencia, está la cuestión de cómo publicar datos médicos de fuente abierta cuando están protegidos por la ley. Afortunadamente, la capacidad de mantener el anonimato mejora constantemente y los pacientes están cada vez más abiertos a compartir sus datos médicos por el bien público.
La industria y el gobierno también se han unido para democratizar la innovación médica a través de proyectos como Consorcio de bases de datos de imágenes pulmonares de los NIH (LIDC)– cuyo objetivo es acelerar la investigación y el desarrollo en la detección del cáncer de pulmón mediante la creación de una base de datos disponible públicamente de tomografías computarizadas de pulmón con nódulos anotados. Desde entonces, este esfuerzo de 2007 se ha fusionado con Iniciativa de recursos de bases de datos de imágenes (IDRI) Crear una base de datos de referencia completa para nódulos pulmonares en la tomografía computarizada.
Al mismo tiempo, las principales empresas de tecnología comenzaron a clasificar modelos de “pesos abiertos” como Google Models. Midjima Como “código abierto”. Aunque este es un paso en la dirección correcta, el verdadero código abierto requiere la participación de todos los componentes de los sistemas de IA. Al abrir el acceso y retener las piezas de su propio rompecabezas, estos jugadores están fortaleciendo su posición en el campo de la IA médica al invitar a los desarrolladores a utilizar sus herramientas y modelos. Sin embargo, incluso cuando esto genera innovación, obliga a los desarrolladores a confiar en partes del sistema que no pueden crear. Es un riesgo que no deberían verse obligados a correr.
Rompiendo las barreras de la IA médica con un nuevo paradigma
Si bien los desafíos de equilibrar la privacidad y la colaboración abierta son reales, la IA médica está revolucionando la atención al paciente. Dado que hay demasiado en juego para mantener el status quo, el camino a seguir requiere que la industria priorice el progreso colectivo sobre la ventaja de propiedad.
Al crear marcos sólidos para una IA médica de código abierto, crear incentivos para compartir datos que beneficien a los pacientes y desarrolladores, y fomentar verdaderas asociaciones entre la industria, el mundo académico y el gobierno, podemos construir un futuro en el que las innovaciones que salvan vidas lleguen a más pacientes de manera más rápida y equitativa. Los innovadores que puedan tomar el control de los datos y adoptar la transparencia de la colaboración de código abierto estarán preparados para liderar este cambio.
Acerca del Dr. Jason Corso
Dr. Jason Corso Es cofundador y director científico de Voxel51Es profesor Toyota de Inteligencia Artificial, Ingeniería Eléctrica e Informática en la Universidad de Michigan. Experto en el campo de la visión por computadora, el Dr. Corso ha dedicado más de 20 años a la investigación académica sobre comprensión de videos, robótica y ciencia de datos.












