Las aplicaciones de modelos de lenguaje grande han experimentado un aumento en popularidad. Con sus asombrosas capacidades, se están volviendo cada vez más sofisticados. Al incorporar funciones como el seguimiento del uso de herramientas y el aumento de la recuperación, estos modelos están atrayendo mucha atención en la comunidad de Inteligencia Artificial. Los marcos existentes para crear este tipo de aplicaciones adoptan un enfoque obstinado al dictar a los desarrolladores cómo deben formatear sus mensajes e imponer ciertas limitaciones en materia de personalización y reproducibilidad.
Para abordar estos problemas, un equipo de investigadores de la Universidad de Pensilvania presentó recientemente Kani, un marco de código abierto liviano, extensible y neutral en cuanto a modelos, diseñado específicamente para crear aplicaciones de modelos de lenguaje. Al ofrecer soporte para los elementos centrales de la interacción del chat, Kani se creó con el objetivo de permitir a los desarrolladores agregar una amplia gama de funciones complicadas. La interacción del modelo, la gestión del chat y la llamada de funciones sólidas son algunos de estos elementos esenciales.
Los desarrolladores pueden crear aplicaciones de modelos de lenguaje utilizando los bloques de construcción de Kani sin estar restringidos por estructuras o limitaciones predefinidas, ya que Kani se destaca por su adaptabilidad y personalización. Todas las características fundamentales de Kani se han creado para poder modificarlas fácilmente y el equipo también ha proporcionado documentación extensa. Esto permite a los desarrolladores modificar la funcionalidad del marco para satisfacer sus demandas y requisitos únicos.
Kani es una herramienta útil para una amplia gama de personas, incluidos académicos, aficionados y empresarios. Para mejorar la reproducibilidad de su trabajo, Kani ayuda a los investigadores a crear aplicaciones de modelos de lenguaje al tiempo que permite un control detallado. Incluso con modelos tan potentes como GPT-4 u otros modelos complejos, los usuarios pueden usar Kani para comenzar rápidamente a diseñar aplicaciones con solo unas pocas líneas de código. La versatilidad y durabilidad de Kani también son ventajosas para los trabajadores de la industria, especialmente en áreas como gestión de chat y gestión de funciones.
Kani, que requiere Python 3.10+, simplifica la instalación y consulta del modelo de lenguaje. Instalable mediante pip, ofrece dependencias principales y extras opcionales, como el motor OpenAI. La unidad de procesamiento fundamental en el marco Kani se llama ‘Kani’. Al crear aplicaciones con Kani, el usuario trabajará y manipulará varios objetos Kani, que constan de tres componentes esenciales: motor de inferencia, historial de chat y contexto de función.
Mediante motores de inferencia, un objeto Kani se comunica con modelos lingüísticos. Sin cambiar el código de la aplicación, esta interacción permite a los desarrolladores realizar la transición entre diferentes modelos con facilidad. Kani controla los totales de tokens y los cambios de tema. Garantiza que el contexto del diálogo se mantenga dentro de los límites del modelo y evita que se exceda. Por último, los modelos de lenguaje pueden acceder a funciones invocables a través de Kani. Verifica las llamadas a funciones, ejecuta el código apropiado y luego envía los resultados al motor de inferencia.
En conclusión, Kani se ha presentado como una solución a los problemas que enfrentan los desarrolladores de aplicaciones de modelos de lenguaje. Permite personalización, flexibilidad y un método de código abierto para crear aplicaciones increíbles, ya que permite a los desarrolladores crear aplicaciones ricas en funciones manteniendo el control y la interoperabilidad al ofrecer los elementos fundamentales para la interacción del chat.
Revisar la Papel y GitHub. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de más de 30.000 ml, Comunidad de Facebook de más de 40.000 personas, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.
Si te gusta nuestro trabajo, te encantará nuestra newsletter.
Tanya Malhotra es estudiante de último año de la Universidad de Estudios de Petróleo y Energía, Dehradun, y cursa BTech en Ingeniería en Ciencias de la Computación con especialización en Inteligencia Artificial y Aprendizaje Automático.
Es una entusiasta de la Ciencia de Datos con buen pensamiento analítico y crítico, junto con un ardiente interés en adquirir nuevas habilidades, liderar grupos y gestionar el trabajo de manera organizada.