Tecnociencia

Google ahora puede insertar marcas de agua en textos y vídeos generados con IA

Google ha expandido el alcance de SynthID, su tecnología para insertar marcas de agua en contenidos creados con inteligencia artificial. Ahora también funciona en textos y vídeos.

Google lleva tiempo trabajando en el desarrollo de herramientas para identificar y detectar contenidos hechos con inteligencia artificial. En 2023, la compañía introdujo SynthID, una utilidad que podía incorporar marcas de agua imperceptibles para los humanos en imágenes y canciones creadas con IA. Y ahora está expandiendo esa tecnología a otros dos campos cruciales: la generación de textos y vídeos.

En el marco del I/O 2024, Google DeepMind anunció que SynthID ahora es capaz de insertar marcas de agua en textos creados usando el chatbot Gemini y las experiencias web integradas con la inteligencia artificial homónima. En el caso del vídeo, esta función está disponible en Veoel nuevo modelo de texto a vídeo que compite con Sora (OpenAI).

Desde Google aclaran que SynthID no es infalible, pero que es crucial para el desarrollo de herramientas que permitan detectar si ciertos contenidos provienen o no de una inteligencia artificial. En una era en la que los deepfakes abundan y donde es más fácil que nunca engañar al ojo o al oído humano, insertar marcas de agua se presenta como la opción más potable para certificar la legitimidad de ciertos tipos de archivos y documentos.

Lo interesante es que Google ha prometido hacer de código abierto la versión de SynthID para aplicar marcas de agua en textos generados con IA. Esto permitirá que desarrolladores de otros modelos usen la misma tecnología que hoy ya se encuentra disponible en Gemini.

Cómo funcionan las nuevas marcas de agua para texto y vídeo de SynthID

Cómo funcionan las nuevas marcas de agua para texto y vídeo de SynthID | Google

En el caso de los vídeos creados con Veo, Google indica que todos llevan una marca de agua de SynthID. Para introducirlas, la compañía ha tomado como base la tecnología aplicada en la generación de imágenes fijas y la ha llevado a otro nivel. Si bien los de Mountain View no han brindado detalles muy específicos, sí han indicado que la marca identificatoria se «imprime» en los píxeles de cada fotograma de los vídeos generados con IA.

Google insiste en que las marcas de agua de SynthID son imposibles de detectar a simple vista, pero que se pueden encontrar rápidamente con un software de identificación. En el caso del texto creado con inteligencia artificial, el proceso es un tanto más complejo.

Los chatbots y modelos de generación de texto utilizan tokens y un sistema de predicción para generar frases o párrafos completos. Lo que hace la IA es otorgarle a cada token un puntaje que representa el porcentaje de probabilidad de que sea el correcto a la hora de formular una respuesta coherente al prompt introducido por el usuario.

Con SynthID, Google ha desarrollado un método que permite generar la marca de agua en el momento en el que se crea el texto. Así lo explican los investigadores de DeepMind:

«SynthID está diseñado para incrustar marcas de agua imperceptibles directamente en el proceso de generación de texto. Para ello, introduce información adicional en la distribución de tokens en el punto de generación, modulando la probabilidad de que se generen tokens; todo esto sin comprometer la calidad, precisión, creatividad o velocidad de la generación de texto.

El patrón final de puntuaciones para las elecciones de palabras del modelo, combinado con las puntuaciones de probabilidad ajustadas, es considerado la marca de agua. Este patrón de puntuaciones se compara con el patrón esperado de puntuaciones para texto con y sin marca de agua, lo que ayuda a SynthID a detectar si una herramienta de inteligencia artificial generó el texto o si podría provenir de otras fuentes».

Google DeepMind.

Google menciona que las marcas de agua para texto de SynthID funcionan mejor cuando los usuarios solicitan la generación de textos largos o con variaciones. Por ejemplo, cuando alguien le pide a Gemini que genere un ensayo o distintas versiones de un mismo texto para enviar por correo electrónico. Y la marca identificatoria sigue funcionando incluso cuando el texto sufre algunas modificaciones.

No obstante, la compañía sabe que la herramienta todavía está sujeta a limitaciones. Los algoritmos de identificación pueden no encontrar la marca de agua si el texto se reescribe o se traduce a otro idioma, por ejemplo. De todos modos, es un paso al frente muy interesante. En próximos meses, los californianos abrirán esta herramienta y darán a conocer cómo funciona en mayor detalle.