Perplexity AI presenta el orquestador de inferencia de servidor local híbrido para computadora personal: enrutamiento automático de tareas en el dispositivo y en la nube

Perplexity AI anunció lo que llama el primer orquestador de inferencia de servidor local híbrido en Computex 2026. El sistema está diseñado para enrutar automáticamente tareas de IA entre el dispositivo local de un usuario y los modelos de frontera basados ​​en la nube sin necesidad de que el usuario decida de antemano. Se espera que la función llegue a Perplexity Computer en julio de 2026.

¿Qué es la inferencia agente híbrida?

Para comprender lo que construyó Perplexity, es útil comprender la tensión triple que enfrentan los sistemas de IA.

La precisión exige los modelos más capaces, cuyo funcionamiento es caro. La privacidad exige que algunos datos nunca abandonen el dispositivo. Los costos y la eficiencia energética exigen que no se gaste el cómputo de un modelo de frontera en tareas que un modelo más pequeño puede manejar.

Esa capa de enrutamiento es lo que Perplexity llama inferencia agente híbrida.

Un modelo de IA compacto se ejecuta localmente en el dispositivo del usuario. Este modelo local evalúa cada tarea o subtarea entrante. Determina si la tarea involucra datos confidenciales, si requiere una gran cantidad de cálculo o si se puede manejar completamente en el dispositivo. Según esa evaluación, el trabajo se mantiene local o se envía a un modelo de frontera en la nube.

Perplexity describe este modelo local como el que decide “cuándo los datos confidenciales también deben conservarse localmente”. El sistema está diseñado para solicitar permiso al usuario antes de enviar tareas confidenciales a la nube. Ese diseño aborda una preocupación específica que tienen las empresas sobre la IA agente: la gobernanza de datos: saber adónde van los datos y quién controla esa decisión.

Ejemplos de datos que el sistema debe mantener localmente incluyen registros financieros, información de salud y archivos personales. El trabajo que requiere la capacidad total de un modelo de frontera se ejecuta en el servidor. La mayoría de las tareas reales son una combinación, por lo que el sistema las divide y coordina las partes.

Cómo encaja en la computadora Perplexity

Perplexity Computer es el producto agente multimodelo basado en la nube de la compañía, lanzado en febrero de 2026. Originalmente se ejecutaba completamente en la nube en el nivel de suscripción Perplexity Max ($200/mes).

Personal Computer es un producto independiente y relacionado que lleva las capacidades de Computer al dispositivo local, con acceso a archivos locales, aplicaciones nativas de Mac, la web y los servidores seguros de Perplexity. La computadora personal se lanzó en Mac en abril de 2026. Está prevista la compatibilidad con Windows; hay una lista de espera abierta.

El nuevo orquestador de inferencia híbrido de servidor local es el siguiente paso para las computadoras personales. Anteriormente, incluso dentro de Computadoras personales, la división era relativamente fija: el acceso a archivos locales se producía en el dispositivo, y se ejecutaban cálculos pesados ​​en los servidores de Perplexity. El orquestador cambia eso. El sistema ahora razona sobre dónde debe ejecutarse cada parte de una tarea: no solo qué modelo usar, sino qué ubicación física debe procesarla.

Perplexity Computer coordina hasta 20 modelos de IA en un solo flujo de trabajo. El sistema crea un equipo de agentes y organiza modelos, herramientas y archivos en un solo sistema. El orquestador híbrido extiende esa orquestación para calcular la ubicación misma.

Conclusiones clave

Perplexity AI anunció el primer orquestador de inferencia de servidor local híbrido en Computex 2026, que enruta tareas de IA automáticamente entre modelos en el dispositivo y en la nube. Un modelo local compacto actúa como enrutador: clasifica cada subtarea según la sensibilidad de los datos y los requisitos informáticos antes de enviarla. Los datos confidenciales (registros financieros, archivos de salud) permanecen en el dispositivo; Las tareas de computación pesada se trasladan a modelos de nube de vanguardia, sin necesidad de configuración manual. El marco de orquestación es independiente del modelo y del chip, y se confirma que se ejecuta en hardware Intel Core Ultra Series 3 y NVIDIA RTX Spark. La función llega a Perplexity Computer en julio de 2026, inicialmente en Windows; Personal Computer ya está disponible en Mac con una lista de espera de Windows abierta.

Consulta los detalles técnicos. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 150.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros

Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.