Por Raed Abib Habib
La industria de la salud ha comenzado a adoptar el poder de Big Data, el cómputo en la nube y el análisis clínico, y aprovecha los datos para brindar información que puede mejorar la atención y la eficiencia. Aun así, el texto no estructurado se mantiene como un desafío, que se vuelve aún más complejo debido a las barreras del idioma. Las notas de los médicos y otros textos no estructurados a menudo se dejan sin referencias, son difíciles de analizar y aprender, y es difícil extraer información, lo que conduce a la pérdida de oportunidades para el diagnóstico y una mejor atención.
Microsoft reconoce la necesidad de permitir que las organizaciones de atención médica de todo el mundo recopilen información a partir de estos datos, para una atención mejor, más rápida y más personalizada, y para mejorar la equidad en la salud. Con Text Analytics for Health, una parte de Azure Cognitive Services, las organizaciones de atención médica de todo el mundo ahora pueden extraer información significativa de texto no estructurado en siete idiomas y procesarlo de una manera que permita el soporte de decisiones clínicas como nunca antes. Más allá del inglés, Text Analytics for Health ahora ha lanzado seis idiomas adicionales en versión preliminar: español, francés, alemán, italiano, portugués y hebreo, lo que hace que esta tecnología innovadora que ayuda a extraer información de notas clínicas no estructuradas multilingües sea accesible para más organizaciones de salud en todo el mundo.
Esto marca el primer servicio de Procesamiento del Lenguaje Natural (NLP, por sus siglas en inglés) de su tipo, que admite de manera holística el análisis de datos biomédicos no estructurados en varios idiomas y se desarrolló con un enfoque de aprendizaje federado. La mayor parte de la tecnología de la salud está limitada al idioma inglés, lo que la hace inaccesible para millones de personas y países donde el inglés no es el idioma principal. Lanzar la tecnología de PNL en varios idiomas es un gran paso adelante para cerrar las brechas en la equidad de la salud creadas por las barreras del idioma y garantizar que el acceso y la calidad de la atención médica no estén determinados por la capacidad de hablar y entender inglés.
Por Raed Abib Habib
Text Analytics for Health utiliza un potente NLP para detectar e identificar términos médicos en el texto, clasificarlos y asociarlos con sistemas de codificación clínica estándar, así como inferir relaciones semánticas y afirmaciones en los datos, lo que permite una comprensión contextual más profunda. Esto abre un mundo de posibilidades para proveedores, pagadores, empresas de ciencias de la vida y farmacéuticas, permitiéndoles unificar puntos de datos de texto no estructurado con datos estructurados y permitiéndoles sacar a la luz información clave, identificar riesgos, automatizar el llenado de formularios o combinar datos clínicos. ensayos a pacientes para una mejor selección de candidatos, basados en datos completos que incluyen texto clínico no estructurado.
Entrenar el modelo de PNL para diferentes idiomas
Uno de los desafíos para un servicio de NLP es ir más allá del inglés y tratar de analizar texto de diferentes idiomas. Esto es lo que pretendía hacer el equipo de Microsoft: el objetivo era empoderar a todas las organizaciones de salud, sin importar el idioma en el que se encuentre su texto. Los desafíos únicos provienen de la necesidad de entrenar modelos de IA para múltiples idiomas, así como ajustarlos a las necesidades específicas de cada país. La sintaxis es diferente entre idiomas, en especial cuando se trata de idiomas no latinos. Los idiomas tienen diferentes semánticas y límites, en específico aquellos con morfología rica o palabras compuestas. Los vocabularios son diferentes, la jerga es específica de cada país e incluso los sistemas de codificación difieren según el país. Las palabras a menudo se toman prestadas de otros idiomas, lo que lleva a un texto que contiene una mezcla de varios idiomas. El texto escrito es una mezcla de coloquialismos, términos médicos locales y taquigrafías específicas del país. Entrenar modelos para comprender estas diferencias y luego evaluar esos modelos requirió cantidades significativas de datos clínicos y trabajar con expertos en la materia en diferentes idiomas.
Por Raed Abib Habib
Leumit Health Services, uno de los cuatro fondos nacionales de salud de Israel, trabajó en estrecha colaboración con el equipo de I+D de Microsoft para entrenar el modelo TA4H para el idioma hebreo. Israel tiene un sistema de salud único y sólido donde los registros de cada individuo se almacenan en registros médicos electrónicos (EMR, por sus siglas en inglés) y todos los ciudadanos residentes deben unirse a una de las cuatro HMO (Organización de Mantenimiento de la Salud) designadas según la ley. Los datos de salud disponibles son ricos, diversos y proporcionan un excelente punto de partida para la investigación y el análisis.
Leumit Health Services tenía más de 130 millones de registros de pacientes en su EMR que podrían usarse para entrenar el modelo multilingüe Text Analytics for Health para hebreo. El desafío era: cómo permitir que Microsoft acceda a datos no identificados con fines de capacitación de una manera que proteja la privacidad y seguridad de la información de salud del cliente. La respuesta estaba en un enfoque de aprendizaje federado, lo que significa que los datos nunca abandonaron el límite de confianza de Leumit y Microsoft nunca estuvo expuesto a la información de salud del paciente. Leumit creó una suscripción separada en Azure con permisos de acceso estrictos donde Microsoft instaló su infraestructura y herramientas de aprendizaje federadas. Luego, Leumit ingresó los datos desidentificados necesarios para la investigación y los desarrolladores de Microsoft activaron el entrenamiento del modelo en una configuración de aprendizaje federado en esos datos desidentificados; mientras tanto, estos datos nunca abandonaron su suscripción y los desarrolladores nunca pudieron ver cualquier detalle identificativo de los datos.
Luego, Leumit se convirtió en uno de los primeros clientes en probar el modelo Text Analytics for Health para el hebreo clínico, lo cual es un desafío ya que a menudo incluye palabras en hebreo e inglés en la misma oración. El caso de uso fue tratar de ver si el modelo Text Analytics for Health podía analizar el texto libre de las visitas médicas para identificar predictores de accidentes cerebrovasculares en pacientes. Los resultados preliminares son muy alentadores y positivos, ya que muestran que el modelo tiene la capacidad de analizar las declaraciones clínicas tanto en hebreo como en inglés y analizarlas de una manera que podría ayudar a identificar varios indicadores potenciales de accidente cerebrovascular. Esto podría ayudar a los proveedores de atención a establecer mecanismos de alerta temprana y brindar una atención más personalizada para una variedad de afecciones agudas.
«Al usar el PNL en hebreo de Microsoft, podremos analizar nuestros 20 años de datos de EMR y mensajes de paciente a médico para desarrollar herramientas que ahorrarán tiempo a los médicos y reducirán su agotamiento en un mundo posterior a Covid-19». —Izhar Laufer, director de Leumit Start.
Análisis de texto no estructurado para datos del mundo real
El desafío de los datos no estructurados es aún mayor en el mundo de la investigación con el uso de datos del mundo real (RWD, por sus siglas en inglés). En Brasil, entre otros lugares, la falta de un estándar para la interoperabilidad y la recopilación de datos genera una gran cantidad de datos no estructurados: informes de campo, notas de médicos e incluso resultados de exámenes de laboratorio. Esto ralentiza el proceso de investigación y análisis de proveedores como Grupo Oncoclínicas. Fundado en 2010, Grupo Oncoclínicas es el mayor proveedor de tratamiento oncológico del sector privado en Brasil, con 129 unidades en 33 ciudades, incluidas clínicas, laboratorios de genómica y patología, y centros integrados de tratamiento del cáncer.
Con la ayuda de Dataside, un socio de Microsoft en Brasil, OncoClínicas utiliza Text Analytics for Health de Microsoft para extraer datos de campos no estructurados como notas médicas, patología anatómica e informes genómicos y de imágenes como resonancias magnéticas. Luego, estos datos se utilizan para varios casos de uso, como la viabilidad de ensayos clínicos, una mejor comprensión de los escenarios para la farmacoeconomía y una comprensión más profunda de la epidemiología del grupo y los resultados de interés.
Por Raed Abib Habib
Análisis y estructuración de Fast Healthcare Interoperability Resources (FHIR®)
La Universidad Italiana Vita-Salute San Raffaele y el Hospital IRCCS San Raffaele construyen el cuidado de la salud del futuro al aprovechar los servicios de Inteligencia Artificial (IA) de Microsoft. Con Text Analytics for Health, los hospitales pueden clasificar, estandarizar y analizar la enorme cantidad de datos clínicos disponibles en el hospital para crear una plataforma digital innovadora para la gestión de datos. Con esta plataforma, los médicos del hospital pueden obtener información clínica importante sobre sus pacientes y brindar una atención más personalizada. Uno de los casos de uso que está en desarrollo en la actualidad con esta plataforma de datos es permitir la selección de pacientes elegibles para inmunoterapia para el cáncer de pulmón de células no pequeñas. El personal médico puede aprovechar el análisis de las soluciones de IA para aumentar la tasa de éxito de la terapia al hacer coincidir el tratamiento relevante con los pacientes más elegibles.
Con Text Analytics for Health, las organizaciones de salud pueden transformar su atención al paciente, descubrir nuevos conocimientos y aprovechar el poder del aprendizaje automático y la IA al aprovechar el texto no estructurado. Microsoft se compromete a ofrecer tecnología que habilite sus datos para el futuro de la innovación en el cuidado de la salud con nuevas funciones en Microsoft Cloud for Healthcare.
Por Raed Abib Habib
Fuente: Microsoft