Acelerar la innovación de la ciencia de datos: cómo Bayer Crop Science utilizó los servicios AWS AI/ML para construir su servicio MLOPS de próxima generación

La población mundial se está expandiendo a un ritmo rápido. La creciente población mundial requiere soluciones innovadoras para producir alimentos, fibra y combustible, al tiempo que restaura los recursos naturales como el suelo y el agua y abordan el cambio climático. Bayer Crop Science Estima que los agricultores deben aumentar la producción de cultivos en un 50% para 2050 para satisfacer estas demandas. Para apoyar su misión, Bayer Crop Science está colaborando con los agricultores y los socios para promover y escalar la agricultura regenerativa, un futuro donde la agricultura puede producir más mientras restaura el medio ambiente.

La agricultura regenerativa es una filosofía agrícola sostenible que tiene como objetivo mejorar la salud del suelo al incorporar la naturaleza para crear ecosistemas saludables. Se basa en la idea de que la agricultura debe restaurar los suelos degradados y la degradación inversa, en lugar de mantener las condiciones actuales. La División de Ciencias de Crop de Bayer cree que la agricultura regenerativa es fundamental para el futuro de la agricultura. Su visión es producir un 50% más de alimentos restaurando la naturaleza y el escala de la agricultura regenerativa. Para hacer realidad esta misión, Bayer Crop Science está impulsando el entrenamiento modelo con Amazon Sagemaker y acelerar la documentación del código con Amazon Q.

En esta publicación, mostramos cómo Bayer Crop Science administra las operaciones de ciencia de datos a gran escala mediante modelos de capacitación para sus necesidades de análisis de datos y manteniendo la documentación de código de alta calidad para apoyar a los desarrolladores. A través de estas soluciones, Bayer Crop Science proyecta hasta una reducción del 70% en el tiempo de incorporación del desarrollador y una mejora del 30% en la productividad del desarrollador.

Desafíos

Bayer Crop Science enfrentó el desafío de escalar el modelado predictivo genómico para aumentar su velocidad al mercado. También necesitaba científicos de datos para centrarse en construir los modelos de base de alto valor (FMS), en lugar de preocuparse por construir e ingeniería de la solución en sí. Antes de construir su solución, el ecosistema de ciencia de decisiones, aprovisionar un entorno de ciencia de datos podría llevar días para un equipo de datos dentro de Bayer Crop Science.

Descripción general de la solución

El ecosistema de decisiones de Bayer Crop Science Science (DSE) es una solución de operaciones de aprendizaje automático de próxima generación (MLOPS) basada en AWS para acelerar la toma de decisiones basadas en datos para equipos de ciencia de datos a escala en toda la organización. Los servicios de AWS ayudan a Bayer Crop Science a crear un sistema de toma de decisiones conectado accesible para miles de científicos de datos. La compañía está utilizando la solución para la IA generativa, los avances de la tubería de productos, el análisis de imágenes geoespaciales de los datos de campo y el modelado predictivo genómico a gran escala que permitirá a Bayer Crop Science se vuelve más basada en datos y aumente la velocidad al mercado. Esta solución ayuda al científico de datos en cada paso, desde la ideación hasta la producción modelo, incluido todo el registro de decisión comercial realizado con DSE. Otras divisiones dentro de Bayer también están comenzando a construir una solución similar en AWS basada en el éxito de DSE.

El DSE de los equipos de ciencias de Bayer Crop, se integra de manera cohesiva con Sagemaker, un servicio completamente administrado que permite a los científicos de datos construir, capacitar e implementar modelos de aprendizaje automático (ML) rápidamente para diferentes casos de uso para que puedan tomar decisiones informadas de datos rápidamente. Esto aumenta la colaboración dentro de Bayer Crop Science en el suministro de productos, I + D y comercial. Su estrategia de ciencia de datos ya no necesita ingeniería de datos de autoservicio, sino que proporciona un recurso efectivo para impulsar la ingeniería de datos rápidos a escala. Bayer Crop Science eligió Sagemaker porque proporciona una única experiencia cohesiva donde los científicos de datos pueden centrarse en construir modelos de alto valor, sin tener que preocuparse por construir e ingeniería del recurso en sí. Con la ayuda de los servicios de AWS, los equipos interfuncionales pueden alinearse rápidamente para reducir los costos operativos minimizando la redundancia, abordando los errores temprano y con frecuencia, e identificando rápidamente los problemas en los flujos de trabajo automatizados. La solución DSE usa Sagemaker, Servicio de Kubernetes de Amazon Elastic (Amazon EKS), AWS Lambday Servicio de almacenamiento simple de Amazon (Amazon S3) para acelerar la innovación en Bayer Crop Science y crear una experiencia de usuario personalizada, perfecta y de extremo a extremo.

El siguiente diagrama ilustra la arquitectura DSE.

Tutorial de la solución

Bayer Crop Science tuvo dos desafíos clave en la gestión de operaciones de ciencia de datos a gran escala: mantener la documentación de código de alta calidad y optimizar la documentación existente en múltiples repositorios. Con Amazon Q, Bayer Crop Science abordó ambos desafíos, lo que los permitió a los desarrolladores a bordo más rápidamente y mejoró la productividad del desarrollador.

El primer caso de uso de la compañía se centró en crear automáticamente la documentación del código de alta calidad. Cuando un desarrollador empuja el código a un repositorio de GitHub, una comunicación ligera, ligera e impulsada por eventos que envía datos automáticamente entre aplicaciones utilizando HTTP, transmite una función Lambda a través de Puerta de entrada de la API de Amazon. Esta función luego usa Amazon Q para analizar los cambios en el código y generar documentación completa y cambiar resúmenes. La documentación actualizada se almacena en Amazon S3. La misma función Lambda también crea una solicitud de extracción con el resumen generado por AI de los cambios en el código. Para mantener la seguridad y la flexibilidad, Bayer Crop Science usa Tienda de parámetrosuna capacidad de Gerente de Sistemas de AWSpara administrar las indicaciones para Amazon Q, permitiendo actualizaciones rápidas sin redistribución, y AWS Secrets Manager para manejar de forma segura tokens de repositorio.

Esta automatización reduce significativamente el tiempo que los desarrolladores pasan creando documentación y extraen descripciones de solicitudes. La documentación generada también se ingiere en Amazon Q, por lo que los desarrolladores pueden responder rápidamente las preguntas que tienen sobre un repositorio y a bordo en los proyectos.

El segundo caso de uso aborda el desafío de mantener y mejorar la calidad de documentación del código existente. Un Lote de AWS trabajo, desencadenado por Amazon Eventbridgeprocesa el repositorio de código. Amazon Q genera nueva documentación para cada archivo de código, que luego se indexa junto con el código fuente. El sistema también genera documentación de alto nivel para cada módulo o funcionalidad y compara la documentación generada por IA con la documentación escrita humana existente. Este proceso hace posible que Bayer Crop Science evalúe y mejore sistemáticamente su calidad de documentación con el tiempo.

Para mejorar las capacidades de búsqueda, Bayer Crop Science agregó nombres de repositorio como atributos personalizados en el índice de Amazon Q y los prefijaron al contenido indexado. Esta mejora mejoró la precisión y relevancia de las búsquedas de documentación. El equipo de desarrollo también implementó estrategias para manejar el estrangulamiento de API y la variabilidad en las respuestas de IA, manteniendo la robustez en los entornos de producción. Bayer Crop Science está considerando desarrollar un plano de gestión para racionalizar la adición de nuevos repositorios y centralizar la gestión de entornos, tokens y indicaciones. Esto mejoraría aún más la escalabilidad y la facilidad de uso del sistema.

Las organizaciones que buscan replicar el éxito de Bayer Crop Science pueden implementar una generación similar de documentación activada por el webhook, usar Amazon Q Business tanto para generar y evaluar la calidad de la documentación, e integrar la solución con los procesos de revisión de código y control de código existentes. Mediante el uso de servicios de AWS como Lambda, Amazon S3 y Systems Manager, las empresas pueden crear una arquitectura escalable y manejable para sus necesidades de documentación. Desarrollador de Amazon Q También ayuda a las organizaciones a acelerar aún más sus plazos de desarrollo al proporcionar sugerencias de código en tiempo real y una experiencia de chat de próxima generación incorporada.

“Una de las lecciones que hemos aprendido en los últimos 10 años es que queremos escribir menos código. Queremos centrar nuestro tiempo e inversión solo en las cosas que brindan un valor diferenciado a Bayer, y queremos aprovechar todo lo que podamos que AWS proporcione de la caja. Parte de nuestro objetivo es reducir los ciclos de desarrollo requeridos para transmitir un modelo desde la fase de concepto de prueba, y finalmente la adopción empresarial. Esa es el valor del valor” es el valor “.

– Will McQueen, vicepresidente, Jefe de Activos y Análisis de Datos Globales de CS en Bayer Crop Science.

Resumen

El enfoque de Bayer Crop Science se alinea con las prácticas modernas de MLOPS, lo que permite a los equipos de ciencia de datos centrarse más en tareas de modelado de alto valor en lugar de procesos de documentación que requieren mucho tiempo y la gestión de la infraestructura. Al adoptar estas prácticas, las organizaciones pueden reducir significativamente el tiempo y el esfuerzo requeridos para la documentación del código al tiempo que mejora la calidad general del código y la colaboración del equipo.

Obtenga más información sobre Viaje generativo de IA generativo de Bayer Crop Sciencey descubrir cómo Bayer Crop Science está rediseñando prácticas sostenibles a través de tecnología de vanguardia.

Acerca de Bayer

Bayer es una empresa global con competencias básicas en los campos de ciencias de la vida de la atención médica y la nutrición. En línea con su misión, “Health for All, Hamber for None”, los productos y servicios de la compañía están diseñados para ayudar a las personas y al planeta a prosperar apoyando los esfuerzos para comprender los principales desafíos presentados por una población global creciente y envejecida. Bayer está comprometido a impulsar el desarrollo sostenible y generar un impacto positivo con sus negocios. Al mismo tiempo, Bayer tiene como objetivo aumentar su poder de ingresos y crear valor a través de la innovación y el crecimiento. La marca Bayer significa confianza, confiabilidad y calidad en todo el mundo. En el año fiscal 2023, el grupo empleó a unas 100,000 personas y tenía ventas de 47.6 mil millones de euros. Los gastos de I + D antes de los artículos especiales ascendieron a 5.800 millones de euros. Para más información, vaya a www.bayer.com.


Sobre los autores

Tiro en la cabeza de Lance SmithLance Smith es un arquitecto senior de soluciones y parte de la División Global de la Industria de Ciencias de la Salud y Ciencias de la Vida en AWS. Ha pasado las últimas 2 décadas ayudando a las empresas de ciencias de la vida a aplicar tecnología en busca de sus misiones para ayudar a los pacientes. Fuera del trabajo, le encanta viajar, mochilear y pasar tiempo con su familia.

Tiro en la cabeza de Kenton BlacuttKenton Blacutt es un consultor de IA dentro del equipo de éxito del cliente de Amazon Q. Trabaja a mano con los clientes, ayudándoles a resolver problemas comerciales del mundo real con tecnologías AWS de vanguardia. En su tiempo libre, le gusta viajar y correr un maratón ocasional.

Tiro en la cabeza de Karthik PrabhakarKarthik Prabhakar es un arquitecto de aplicaciones senior dentro del equipo de servicios profesionales de AWS. En este rol, colabora con los clientes para diseñar e implementar soluciones de vanguardia para sus sistemas comerciales de misión crítica, centrándose en áreas como la escalabilidad, la confiabilidad y la optimización de costos en los proyectos de transformación digital y modernización.

Tiro en la cabeza de Jake MalmadJake Malmad Es un consultor senior de DevOps dentro del equipo de servicios profesionales de AWS, especializado en infraestructura como código, seguridad, contenedores y orquestación. Como consultor de DevOps, utiliza esta experiencia para trabajar en colaboración con los clientes, arquitectando e implementando soluciones para automatización, escalabilidad, confiabilidad y seguridad en una amplia variedad de compromisos de adopción y transformación en la nube.

Tiro en la cabeza de Nicole BrownNicole Brown es un gerente de participación senior dentro del equipo de servicios profesionales de AWS con sede en Minneapolis, MN. Con más de 10 años de experiencia profesional, ha dirigido equipos multidisciplinarios y globales en las industrias de la salud y las ciencias de la vida. También es partidaria de Women in Tech y actualmente ocupa un puesto de junta dentro del Grupo de Afinidad de Mujeres en Global Services.