Desconectada Y Ética: Así es la IA que realmente va a cambiar el mundo
¿Y si para crear una buena IA no tuvieras que robar datos?
“Es robar. No es una opinión, es un hecho”.
Así de rotunda es Anastasia Stasenko, CEO y cofundadora de Pleias, cuando habla de entrenar modelos de inteligencia artificial con datos protegidos por derechos de autor. Sus palabras son un dardo directo al corazón de un debate que sacude al mundo tecnológico: ¿rastrear millones de artículos y sitios web para entrenar a una IA es un “uso justo” o simplemente una "infracción de copyright a escala masiva"? La preocupación no es teórica, y la protección de la propiedad intelectual de gigantes como Disney ya está frenando el desarrollo de la IA generativa.
Esta pregunta ya no es solo para tecnólogos. Legisladores de todo el mundo, como en la India, están formando comités para decidir si las leyes de derechos de autor necesitan una actualización urgente para la era de la IA.
La IA requiere cantidades absurdas de data. ¿Es realidad o práctica común?
Data es la palabra en inglés que se refiere a información y datos. La industria de la IA afirma que se necesitan cantidades incontables de información para crear una Inteligencia Artificial potente, es por eso que busca en la nube (básicamente todo lo que está en internet) para entrenar sus modelos.
En Pleias decidieron desafiar esa creencia. “Estábamos en un estado de ánimo un poco rebelde”, explica. “Y nosotros dijimos: ‘Vamos a intentarlo’”.
En lugar de imitar los sistemas gigantescos de los grandes laboratorios, su empresa entrena “modelos de lenguaje compactos”. Piensa en ellos no como una enciclopedia universal, sino como un manual de experto: más pequeños, más enfocados y sin necesidad de haber leído cada rincón de internet.
Para lograrlo, Pleias lanzó el Common Corpus (el conjunto de datos abiertos y de origen ético más grande del mundo para entrenar IA). Contiene más de 2 billones de "tokens" que son los pedacitos de texto que la IA procesa, como si cortara una pizza en porciones antes de comérsela. Este recurso ya está siendo utilizado por varios países para desarrollar sus propios modelos de lenguaje "soberanos", que podríamos argumentar que tan soberano o imparcial un gobierno puede entrenar a su IA, pero dejaremos ese tema para otro momento.
La clave está en la desconexión: una IA para el mundo real
La mayoría de los LLM´s (osea chatbots por los que estamos sustituyendo google) que usas, como ChatGPT, dependen de una conexión constante a la nube. Cada pregunta que haces viaja a un centro de datos en alguna parte del mundo para ser procesada. Los sistemas de Pleias, en cambio, están diseñados para funcionar sin conexión a internet.
“Lo que esto significa en la práctica es que un modelo puede funcionar en tu dispositivo sin necesidad de estar conectado”, aclara Stasenko. Es como la diferencia entre ver una película en streaming y tenerla descargada en tu portátil. Una necesita wifi constante; la otra funciona en cualquier lugar.
La empresa ya ha puesto a prueba esta tecnología en Senegal y la República Democrática del Congo, creando asistentes de IA para salud y educación que funcionan íntegramente offline. Estos sistemas corren en teléfonos Android de bajo coste y en hardware tan básico como una Raspberry Pi. En lugar de enviar tus preguntas a la otra punta del mundo, el sistema busca las respuestas en documentos guardados localmente. Esto reduce los costes a casi cero y elimina la dependencia de tener buena cobertura.
Stasenko ve un potencial enorme en este enfoque, especialmente para países como la India, donde el acceso a internet y la prestación de servicios públicos siguen siendo un desafío. Esta visión llega en un momento clave, ya que el país está diseñando su propia estrategia de IA con actores globales de peso. “Creo que la India ha experimentado de primera mano lo desigual que es la distribución del poder en la IA”, afirma. “Necesitamos descentralizar, no solo en términos de concentración económica, sino también en habilidades tecnológicas e infraestructura”.
El futuro no es una IA más grande, sino una IA para todos
Lo que Stasenko y su equipo proponen va más allá de la tecnología. Es una visión sobre el futuro de la inteligencia artificial: un futuro con “más diversidad, más descentralización y, como resultado, más democratización”.
Dicho de otra forma, buscan un mundo donde cualquier país pueda construir sus propias soluciones a nivel local, sin depender de un puñado de empresas gigantes. Seguramente esto también traerá desventajas como un atraso en la información más novedosa en salud por ejemplo, por otro lado, puede ser usado sin internet, con datos locales que pueda tener menos bias (preferencia) al momento de predecir, por ejemplo.
La próxima vez que uses una IA, pregúntate de dónde viene. ¿Cómo fue entrenada? La alternativa ya se está construyendo y no se basa en tener más datos, sino en tener mejores ideas.
El objetivo de Pleias es que la IA se convierta en una herramienta para el bien público, accesible para todos y en cualquier lugar. Incluso donde no llega internet.