Meta tampoco utilizó chats privados en sus servicios de mensajería como datos de entrenamiento para el modelo y tomó medidas para filtrar los detalles privados de los conjuntos de datos públicos utilizados para el entrenamiento.
FORBES STAFF
Meta Platforms utilizó mensajes públicos en Facebook e Instagram para entrenar partes de su nuevo asistente virtual Meta AI, pero excluyó las publicaciones privadas compartidas sólo con familiares y amigos en un esfuerzo por respetar la privacidad de los consumidores, dijo un ejecutivo de la compañía a Reuters en una entrevista.
Meta tampoco utilizó chats privados en sus servicios de mensajería como datos de entrenamiento para el modelo y tomó medidas para filtrar los detalles privados de los conjuntos de datos públicos utilizados para el entrenamiento, dijo el presidente de Asuntos Globales de Meta, Nick Clegg, hablando al margen de la conferencia anual Connect de la compañía esta semana.
“Hemos intentado excluir los conjuntos de datos en los que predomina la información personal”, dijo Clegg, añadiendo que la “gran mayoría” de los datos utilizados por Meta para el entrenamiento eran públicos.
Citó LinkedIn como ejemplo de sitio web cuyo contenido Meta decidió deliberadamente no utilizar por motivos de privacidad.
Los comentarios de Clegg se producen en un momento en el que empresas tecnológicas como Meta, OpenAI y Google (de Alphabet) han sido criticadas por utilizar información extraída de Internet sin permiso para entrenar sus modelos de IA, que ingieren cantidades ingentes de datos para resumir información y generar imágenes.
Las empresas están sopesando cómo gestionar los materiales privados o protegidos por derechos de autor usados en ese proceso que sus sistemas de IA pueden reproducir, al tiempo que se enfrentan a demandas de autores que les acusan de infringir los derechos de autor.
Meta AI fue el producto más significativo entre las primeras herramientas de IA orientadas al consumidor que la empresa dio a conocer el miércoles en su conferencia anual de productos, Connect, el consejero delegado Mark Zuckerberg. El evento de este año estuvo dominado por la inteligencia artificial, a diferencia de las conferencias anteriores, que se centraron en la realidad aumentada y virtual.
Meta ha creado el asistente utilizando un modelo personalizado basado en el potente modelo de lenguaje de gran tamaño Llama 2, que la empresa lanzó para uso comercial público en julio, así como un nuevo modelo llamado Emu que genera imágenes en respuesta a las indicaciones de texto, dijo.
El producto podrá generar texto, audio e imágenes y tendrá acceso a información en tiempo real a través de una asociación con el motor de búsqueda Bing de Microsoft.
Las publicaciones públicas de Facebook e Instagram que se utilizaron para entrenar a Meta AI incluían texto y fotos, explicó Clegg.
Esas publicaciones se utilizaron para entrenar a Emu en los elementos de generación de imágenes del producto, mientras que las funciones de chat se basaron en Llama 2, a las que se añadieron algunos conjuntos de datos públicos y anotados, según declaró a Reuters un portavoz de Meta.
Las interacciones con Meta AI también se pueden utilizar para mejorar las funciones en el futuro, dijo el portavoz.
Clegg dijo que Meta impuso restricciones de seguridad sobre qué contenidos podía generar la herramienta Meta AI, como la prohibición de crear imágenes fotorrealistas de personajes públicos.
En cuanto a los materiales protegidos por derechos de autor, Clegg dijo que esperaba una “buena cantidad de litigios” sobre la cuestión de “si el contenido creativo está cubierto o no por la doctrina de uso justo existente”, que permite el uso limitado de obras protegidas para fines tales como comentarios, investigación y parodia.
“Creemos que sí, pero tengo la firme sospecha de que va a ser objeto de litigio”, dijo Clegg.
Algunas empresas con herramientas de generación de imágenes facilitan la reproducción de personajes icónicos como Mickey Mouse, mientras que otras han pagado por los materiales o han evitado deliberadamente incluirlos en los datos de entrenamiento.
OpenAI, por ejemplo, firmó este verano un acuerdo de seis años con el proveedor de contenidos Shutterstock para utilizar sus bibliotecas de imágenes, vídeos y música con fines de entrenamiento.
A la pregunta de si Meta había tomado medidas para evitar la reproducción de imágenes protegidas por derechos de autor, un portavoz de Meta se remitió a las nuevas condiciones de servicio que prohíben a los usuarios generar contenidos que violen la privacidad y los derechos de propiedad intelectual.
Con información de Reuters.