El panorama del modelo de lenguaje grande de Australia: evaluación técnica

Puntos clave

No ha surgido un buque insignia, competitivo globalmente competitivo (como GPT-4, Claude 3.5, Llama 3.1) de Australia. La investigación y el comercio de Australia actualmente dependen principalmente de las LLM internacionales, que se usan con frecuencia pero tienen limitaciones medibles en el contexto cultural y inglés australiano.
Kangaroo LLM es el único proyecto LLM de código abierto, desarrollado localmente, desarrollado localmente. Respaldado por un consorcio de IA Katonic, Rackcorp, NextDC, Hitachi Vantara y Hewlett Packard Enterprise, tiene como objetivo construir un modelo específicamente para el inglés australiano, pero permanece en las primeras fases de recolección de datos y gobernanza, sin pesos de modelos publicados, margen de referencia o despliegue de producción a partir del 2025 de agosto.l
Los modelos internacionales (Claude 3.5 Sonnet, GPT-4, LLAMA 2) son ampliamente accesibles en Australia y se utilizan en investigación, gobierno e industria. Su despliegue en contextos australianos a menudo está sujeto a la soberanía de los datos, la ley de privacidad y los desafíos de ajuste de modelos.
La investigación académica australiana hace contribuciones importantes a la evaluación de LLM, la equidad y la adaptación del dominio, no la arquitectura fundamental. El trabajo en UNSW, Macquarie y la Universidad de Adelaida se centran en la detección de sesgos, aplicaciones médicas y legales, y ajuste de modelos previamente capacitados, no en la construcción de nuevos LLM a gran escala desde cero.
La inversión gubernamental e industrial en IA está creciendo, pero la soberanía de la IA sigue siendo aspiracional. Existe un desarrollo de políticas activas, un mayor capital de riesgo y asociaciones estratégicas de la industria universitaria, pero no hay infraestructura computacional nacional o ecosistema comercial para capacitar grandes LLM de propósito general a escala.

Desarrollo del modelo local: Kangaroo LLM

Kangaroo LLM Es el esfuerzo emblemático de Australia para construir un modelo soberano y de lengua abierta adaptada al inglés y la cultura australianos. El proyecto es administrado por un consorcio sin fines de lucro y tiene como objetivo crear un modelo que comprenda el humor, la jerga y las normas legales/éticas australianas. Sin embargo, a partir de agosto de 2025, Kangaroo LLM es Todavía no es un modelo totalmente capacitado, de referencia o disponible públicamente. Su estado actual se describe mejor de la siguiente manera:

Fogonadura: Katonic AI (plomo), Rackcorp, NextDC, Hitachi Vantara, Hewlett Packard Enterprise.
Misión: Para crear un LLM de código abierto capacitado en contenido web australiano, con soberanía de datos y alineación cultural local como objetivos principales.
Progreso: El proyecto ha identificado 4.2 millones de sitios web australianos para la posible recopilación de datos, con un enfoque inicial en 754,000 sitios. El rastreo se retrasó a fines de 2024 debido a problemas legales y de privacidad, y no se ha publicado ningún conjunto de datos o modelo público.
Enfoque técnico: El rastreador “Kangaroo Bot” respeta robots.txt y permite la opción de exclusión para sitios web. Los datos se procesan en el “conjunto de datos de Vegemighty” y se refinan a través de una “excelente tubería de arrecifes de barrera” para la capacitación de LLM. La arquitectura, el tamaño y la metodología de capacitación del modelo siguen siendo no revelados.
Gobernancia: Opera como una organización sin fines de lucro con mano de obra voluntaria (aproximadamente 100 voluntarios, más de 10 equivalentes a tiempo completo). Se solicita fondos de clientes corporativos y posibles subvenciones del gobierno, pero no se ha anunciado una gran inversión pública o privada.
Línea de tiempo: Originalmente programado para un lanzamiento de octubre de 2024, pero a partir de agosto de 2025, el proyecto aún está en la fase de recopilación de datos y cumplimiento legal, sin fecha de lanzamiento confirmada para un modelo capacitado.
Significado: Kangaroo LLM es un paso simbólico y práctico hacia la soberanía de la IA, pero aún no representa una alternativa técnica a las LLM globales. El éxito dependerá de la financiación sostenida, la ejecución técnica y la adopción por parte de los desarrolladores y empresas australianas.

Despliegue de modelo internacional

Soneto Claude 3.5 (Antrópico), GPT-4 (OpenAi), y Llama 2 (Meta) están disponibles y se usan activamente en la investigación y la industria australiana. Su adopción está impulsada por sus capacidades superiores, facilidad de acceso a través de proveedores de nubes (AWS, Azure, Google Cloud) e integración en flujos de trabajo empresariales.

Soneto Claude 3.5 ha estado disponible en la región de Sydney de AWS desde febrero de 2025, lo que permite a las organizaciones australianas utilizar un LLM de última generación con cumplimiento de la residencia de datos. Este modelo se utiliza en aplicaciones que van desde el servicio al cliente hasta la investigación científica.
GPT-4 y Llama 2 se utilizan ampliamente en universidades australianas, nuevas empresas y corporaciones para prototipos, generación de contenido y automatización de tareas. Su uso a menudo va acompañado de ajuste en conjuntos de datos locales para mejorar la relevancia y la precisión.
Estudio de caso de la Universidad de Sydney: Un equipo usó Claude para analizar los datos acústicos de la ballena, logrando una precisión del 89.4% en la detección de ballenas minke, una mejora significativa sobre los métodos tradicionales (76.5%). Este proyecto demuestra cómo se pueden adaptar las LLM globales para las necesidades científicas locales, pero también destaca la dependencia de Australia en los proveedores de modelos externos.

Contribuciones de investigación

Las instituciones académicas de Australia están activas en la investigación de LLM, pero su enfoque está en Evaluación, equidad, adaptación de dominio y aplicación—No en la construcción de nuevos modelos fundamentales a gran escala.

El punto de referencia de Besstie de UNSW: Un marco de evaluación sistemático para el sentimiento y el sarcasmo en inglés australiano, británico e indio. Revela que los LLM globales tienen un rendimiento constante en el inglés australiano, especialmente para la detección del sarcasmo (puntaje F 0.59 en Reddit, en comparación con 0.81 para el sentimiento). Este trabajo es crítico para comprender las limitaciones de los modelos actuales en los contextos locales.
LLM biomédica de la Universidad de Macquarie: Los investigadores tienen variantes Bert ajustadas (BioBert, Albert) para responder a preguntas médicas, alcanzar los mejores puntajes en las competiciones internacionales. Esto demuestra la fuerza de Australia para adaptar los modelos existentes a dominios especializados, pero no en el desarrollo de nuevas arquitecturas.
CSIRO Data61: Publica una investigación influyente sobre sistemas basados en agentes utilizando LLMS, IA que presenta la privacidad y gestión de riesgos del modelo. Su trabajo es práctico y centrado en políticas, no centrado en el desarrollo fundamental del modelo.
Asociación de la Universidad de Adelaida y CommBank: El Centro CommBank para la IA fundamental, establecido a fines de 2024, tiene como objetivo avanzar en el aprendizaje automático para los servicios financieros, incluida la detección de fraude y la banca personalizada. Esta es una inversión de la industria significativa, pero nuevamente, el enfoque está en la aplicación y el ajuste, no en la construcción de una nueva LLM a gran escala.

Política, inversión y ecosistema

Política del gobierno:
El gobierno australiano ha desarrollado un marco de política de IA basado en el riesgo, con transparencia obligatoria, pruebas y responsabilidad para aplicaciones de alto riesgo. Las reformas de la ley de privacidad en 2024 introdujeron nuevos requisitos para la transparencia de IA, que afectan cómo se seleccionan y implementan los modelos.

Inversión:
El capital de riesgo en las nuevas empresas australianas de IA alcanzó los AUD $ 1.3 mil millones en 2024, y la IA representa casi el 30% de todos los acuerdos de riesgo a principios de 2025. Sin embargo, la mayor parte de esta inversión está en empresas de capas de aplicaciones, no en el desarrollo del modelo fundacional.

Adopción de la industria:
Una encuesta de 2024 encontró que el 71% del personal de la universidad de Australia usa herramientas de IA generativas, principalmente Chatgpt y Claude. La adopción empresarial está creciendo, pero a menudo limitada por los requisitos de soberanía de datos, el cumplimiento de la privacidad y la falta de modelos a medida localmente.

Infraestructura computacional:
Australia no tiene infraestructura computacional soberana a gran escala para el entrenamiento de LLM. La mayoría de los modelos de capacitación e inferencia a gran escala se basan en los proveedores internacionales de la nube, aunque la región de Sydney de AWS ahora es compatible con el soneto Claude 3.5 a escala.

Resumen

El paisaje LLM de Australia se define por Investigación sólida basada en aplicaciones, adopción empresarial en crecimiento y desarrollo de políticas activaspero No Soberano, modelo fundamental a gran escala. Kangaroo LLM es uno de los pocos esfuerzos locales significativos, pero permanece en las primeras etapas y enfrenta importantes obstáculos técnicos y de recursos.

En resumen, Australia es un usuario y adaptador sofisticado de LLMS, pero aún no es un constructor de ellos. Los elementos más importantes son claros: Kangaroo LLM es un paso significativo, pero aún no es una solución; Los modelos globales dominan pero tienen limitaciones locales; Y la investigación y la política australiana son de clase mundial en evaluación y aplicación, no en la innovación fundamental.

Fuentes:

Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias en Ciencias de Datos de la Universidad de Padova. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca por transformar conjuntos de datos complejos en ideas procesables.

El panorama del modelo de lenguaje grande de Australia: evaluación técnica

ByEquipo de 7 minutos

Puntos clave

Desarrollo del modelo local: Kangaroo LLM

Despliegue de modelo internacional

Contribuciones de investigación

Política, inversión y ecosistema

Resumen

Fuentes:

By Equipo de 7 minutos

Related Post

Creación de datos de ajuste supervisados a partir de NVIDIA Open-SWE-Traces: análisis de trayectoria, análisis de parches, presupuestos de tokens y métricas de uso de herramientas

Cómo Cara es pionera en la IA de dominio específico para corretaje de seguros empresariales con AWS

Perplexity lanza Computer for Counsel: una capa agente multimodelo para flujos de trabajo legales

You missed

Mo’Nique arrastra a Oprah por comentarios virales de Whitney Houston

Los científicos encontraron microplásticos en los erizos y la explicación es inquietante: ScienceAlert

una aeronáutica polaca inicia un plan para producir en Burgos robots aéreos de vigilancia y ataque

París prohíbe beber en público durante la ola de calor « Euro Weekly News