Compañía
Anunciamos nuestro novedoso método de marca de agua para texto y video generados por IA y cómo incorporaremos SynthID a productos clave de Google.
Las herramientas de IA generativa (y las grandes tecnologías de modelos de lenguaje detrás de ellas) han capturado la imaginación del público. Desde ayudar con las tareas laborales hasta mejorar la creatividad, estas herramientas se están convirtiendo rápidamente en parte de productos que utilizan millones de personas en su vida diaria.
Estas tecnologías pueden ser enormemente beneficiosas, pero a medida que su uso se vuelve cada vez más popular, aumenta el riesgo de que las personas causen daños accidentales o intencionales, como difundir información errónea y phishing, si el contenido generado por IA no se identifica adecuadamente. Es por eso el año pasado lanzamos SynthIDnuestro novedoso conjunto de herramientas digitales para poner marcas de agua en contenido generado por IA.
Hoy nos estamos expandiendo Capacidades de SynthID a poner marcas de agua en el texto generado por IA en el Aplicación Gemini y experiencia weby vídeo en veonuestro modelo de vídeo generativo más capaz.
SynthID para texto está diseñado para complementar los modelos de generación de texto de IA más disponibles y para implementarse a escala, mientras que SynthID para video se basa en nuestro método de marca de agua de imagen y audio para incluir todos los cuadros en los videos generados. Este método innovador incorpora una marca de agua imperceptible sin afectar la calidad, precisión, creatividad o velocidad del proceso de generación de texto o video.
SynthID no es una solución milagrosa para identificar contenido generado por IA, pero es un componente importante para desarrollar herramientas de identificación de IA más confiables y puede ayudar a millones de personas a tomar decisiones informadas sobre cómo interactúan con el contenido generado por IA. A finales de este verano, estamos planeando abrir SynthID para marcas de agua de texto, de modo que los desarrolladores puedan construir con esta tecnología e incorporarla en sus modelos.
Cómo funciona la marca de agua de texto
Los modelos de lenguaje grandes generan secuencias de texto cuando se les da un mensaje como “Explícame la mecánica cuántica como si tuviera cinco años” o “¿Cuál es tu fruta favorita?”. Los LLM predicen qué token probablemente sigue a otro, un token a la vez.
Los tokens son los componentes básicos que utiliza un modelo generativo para procesar información. En este caso, pueden ser un solo carácter, palabra o parte de una frase. A cada token posible se le asigna una puntuación, que es el porcentaje de probabilidad de que sea el correcto. Es más probable que se utilicen tokens con puntuaciones más altas. Los LLM repiten estos pasos para construir una respuesta coherente.
SynthID está diseñado para incrustar marcas de agua imperceptibles directamente en el proceso de generación de texto. Para ello, introduce información adicional en la distribución de tokens en el punto de generación modulando la probabilidad de que se generen tokens, todo sin comprometer la calidad, precisión, creatividad o velocidad de la generación de texto.
SynthID ajusta la puntuación de probabilidad de los tokens generados por un modelo de lenguaje grande.
El patrón final de puntuaciones para las elecciones de palabras del modelo combinado con las puntuaciones de probabilidad ajustadas se considera la marca de agua. Este patrón de puntuaciones se compara con el patrón esperado de puntuaciones para texto con y sin marca de agua, lo que ayuda a SynthID a detectar si una herramienta de inteligencia artificial generó el texto o si podría provenir de otras fuentes.
Un fragmento de texto generado por Gemini con la marca de agua resaltada en azul.
Los beneficios y limitaciones de esta técnica.
SynthID para marcas de agua de texto funciona mejor cuando un modelo de lenguaje genera respuestas más largas y de diversas maneras, como cuando se le solicita que genere un ensayo, un guión de teatro o variaciones en un correo electrónico.
Funciona bien incluso bajo algunas transformaciones, como recortar fragmentos de texto, modificar algunas palabras y parafrasear ligeramente. Sin embargo, sus puntuaciones de confianza pueden reducirse considerablemente cuando un texto generado por IA se reescribe o traduce completamente a otro idioma.
La marca de agua de texto SynthID es menos efectiva en las respuestas a indicaciones fácticas porque hay menos oportunidades de ajustar la distribución del token sin afectar la precisión fáctica. Esto incluye preguntas como “¿Cuál es la capital de Francia?” o consultas en las que se espera poca o ninguna variación, como “recitar un poema de William Wordsworth”.
Muchas herramientas de detección de IA disponibles actualmente utilizan algoritmos para etiquetar y clasificar datos, conocidos como clasificadores. Estos clasificadores a menudo sólo funcionan bien en tareas específicas, lo que los hace menos flexibles. Cuando se aplica el mismo clasificador en diferentes tipos de plataformas y contenidos, su rendimiento no siempre es confiable o consistente. Esto puede provocar que un texto esté mal etiquetado, lo que puede causar problemas, por ejemplo, cuando el texto podría identificarse incorrectamente como generado por IA.
SynthID funciona eficazmente por sí solo, pero también se puede combinar con otros enfoques de detección de IA para brindar una mejor cobertura en todos los tipos de contenido y plataformas. Si bien esta técnica no está diseñada para impedir directamente que adversarios motivados, como ciberatacantes o piratas informáticos, causen daño, sí puede dificultar el uso de contenido generado por IA con fines maliciosos.
Cómo funciona la marca de agua de vídeo
En la I/O de este año anunciamos veo, nuestro modelo de vídeo generativo más capaz. Si bien las tecnologías de generación de video no están tan ampliamente disponibles como las tecnologías de generación de imágenes, están evolucionando rápidamente y será cada vez más importante ayudar a las personas a saber si un video es generado por una IA o no.
Los vídeos se componen de fotogramas individuales o imágenes fijas. Por eso desarrollamos una técnica de marca de agua inspirada en nuestra herramienta SynthID para imágenes. Esta técnica incorpora una marca de agua directamente en los píxeles de cada cuadro de video, haciéndolo imperceptible para el ojo humano, pero detectable para su identificación.
Dotar a las personas de conocimientos sobre cuándo interactúan con medios generados por IA puede desempeñar un papel importante para ayudar a prevenir la difusión de información errónea. A partir de hoy, todos los vídeos generados por Veo en VídeoFX tendrá una marca de agua de SynthID.
SynthID para marcas de agua de video marca cada fotograma de un video generado
Llevando SynthID al ecosistema de IA más amplio
La tecnología de marca de agua de texto de SynthID está diseñada para ser compatible con la mayoría de los modelos de generación de texto de IA y para escalar a diferentes tipos de contenido y plataformas. Para ayudar a prevenir el uso indebido generalizado del contenido generado por IA, estamos trabajando para llevar esta tecnología al ecosistema de IA más amplio.
Este verano, planeamos publicar más sobre nuestra tecnología de marcas de agua de texto en un artículo de investigación detallado, y abriremos las marcas de agua de texto SynthID a través de nuestra versión actualizada. Kit de herramientas de IA generativa responsableque proporciona orientación y herramientas esenciales para crear aplicaciones de IA más seguras, para que los desarrolladores puedan construir con esta tecnología e incorporarla a sus modelos.