IdeasDelForo
Well-known member
El Gobierno es objeto de una serie de acusaciones por no pagar a los editores que han dado sus obras para entrenar a Alia, el modelo español de inteligencia artificial.
La agencia gubernamental en cuestión está estudiando fórmulas para compensar a los autores de contenidos por el uso de sus obras para entrenar el modelo soberano de IA. La intención del Ejecutivo es corregir cuanto antes esa anomalía, y mantiene negociaciones con los editores a la vez que explora las soluciones adoptadas por otros países europeos que también hayan puesto en marcha sus propios sistemas soberanos de IA.
Un ejemplo de esto se puede ver en Noruega, donde el gobierno ha optado por un sistema de licencias. En septiembre, anunció que dedicará 45 millones de coronas anuales a pagar derechos de autor a los editores de prensa nacional para poder usar sus artículos. Se prevé que próximamente cierren acuerdos similares con editores de libros y otros creadores.
En Países Bajos, donde ya está operativo el modelo soberano GPT-NL, se está apostando por otro método. El gobierno neerlandés y los editores están negociando un sistema de participación en los ingresos: en vez de un pago fijo anual, se retribuirá en función de la comercialización del modelo.
Fuentes del Ministerio de Transformación Digital ven factible poder llegar a un acuerdo con los editores y destacan que el Gobierno tiene voluntad de pactar una solución. La patronal de editores confía también en que se puedan aproximar posiciones, aunque reconocen que, hasta ahora, la distancia es amplia.
El desarrollo del modelo Alia costó unos 10 millones de euros y se entrenó con documentación pública oficial. El Ministerio de Transformación Digital y de la Función Pública y la Secretaría de Estado de Digitalización e IA insistieron desde antes de su lanzamiento en que el modelo se ha entrenado con recursos públicos.
Los llamados grandes modelos de lenguaje (LLM) aplican algoritmos sobre ingentes bases de datos de texto para extraer patrones y a partir de los cuales poder elaborar contenidos siguiendo las instrucciones, o prompts, de los usuarios. La cantidad de datos necesarios para que ese proceso de entrenamiento dé resultados aceptables es enorme.
En septiembre, Anthropic, la empresa desarrolladora del chatbot Claude, llegó a un acuerdo extrajudicial histórico con un grupo de escritores a quienes pagará al menos 1.500 millones de dólares para evitar tener que dirimir en los tribunales una demanda por haber entrenado sus modelos con libros de los demandantes conseguidos sin abonar derechos de autor.
La agencia gubernamental en cuestión está estudiando fórmulas para compensar a los autores de contenidos por el uso de sus obras para entrenar el modelo soberano de IA. La intención del Ejecutivo es corregir cuanto antes esa anomalía, y mantiene negociaciones con los editores a la vez que explora las soluciones adoptadas por otros países europeos que también hayan puesto en marcha sus propios sistemas soberanos de IA.
Un ejemplo de esto se puede ver en Noruega, donde el gobierno ha optado por un sistema de licencias. En septiembre, anunció que dedicará 45 millones de coronas anuales a pagar derechos de autor a los editores de prensa nacional para poder usar sus artículos. Se prevé que próximamente cierren acuerdos similares con editores de libros y otros creadores.
En Países Bajos, donde ya está operativo el modelo soberano GPT-NL, se está apostando por otro método. El gobierno neerlandés y los editores están negociando un sistema de participación en los ingresos: en vez de un pago fijo anual, se retribuirá en función de la comercialización del modelo.
Fuentes del Ministerio de Transformación Digital ven factible poder llegar a un acuerdo con los editores y destacan que el Gobierno tiene voluntad de pactar una solución. La patronal de editores confía también en que se puedan aproximar posiciones, aunque reconocen que, hasta ahora, la distancia es amplia.
El desarrollo del modelo Alia costó unos 10 millones de euros y se entrenó con documentación pública oficial. El Ministerio de Transformación Digital y de la Función Pública y la Secretaría de Estado de Digitalización e IA insistieron desde antes de su lanzamiento en que el modelo se ha entrenado con recursos públicos.
Los llamados grandes modelos de lenguaje (LLM) aplican algoritmos sobre ingentes bases de datos de texto para extraer patrones y a partir de los cuales poder elaborar contenidos siguiendo las instrucciones, o prompts, de los usuarios. La cantidad de datos necesarios para que ese proceso de entrenamiento dé resultados aceptables es enorme.
En septiembre, Anthropic, la empresa desarrolladora del chatbot Claude, llegó a un acuerdo extrajudicial histórico con un grupo de escritores a quienes pagará al menos 1.500 millones de dólares para evitar tener que dirimir en los tribunales una demanda por haber entrenado sus modelos con libros de los demandantes conseguidos sin abonar derechos de autor.