La Privacidad como modo de vida. IA y Privacidad

Frases sobre privacidad

Benjamín Franklin: «No hagas lo que no quieras que se sepa».

Jacinto Benavente: «Si la gente nos oyera los pensamientos, pocos escaparíamos de estar encerrados por locos.».

François de La Rochefoucauld: «El perfecto valor consiste en hacer sin testigos lo que se sería capaz de hacer delante de todo el mundo.».

Sidonie-Gabrielle Colette: «Empleo mi pudor en velar aquello que supongo menos agradable.».

Woody Allen: «El trabajo es una invasión de nuestra privacidad.»

El Caso Worldcoin

Hoy quiero hablar sobre Inteligencia artificial, desde el punto de vista de la privacidad y de nuestra protección. Hace unos meses una empresa llamada Worldcoin, estaba escaneando el iris de cualquier voluntario a cambio de una criptomoneda (un dato más identificativo que el ADN por unas monedillas). Como la estupidez humana no tiene límites, explico que unos cuantos Homo-Sapiens-Sapiens, aunque ofrezca realmente dudas del sapiens, estuvo repartiendo su iris a una empresa para, no sabemos qué. Un ID único, el iris, personal e intransferible, fue transferido.

https://www.elperiodico.com/es/barcelona/20240220/fiebre-worldcoin-barcelona-iris-reportaje-centro-comercial-glories-98417255

Hasta que se prohibió

https://elpais.com/tecnologia/2024-03-06/la-agencia-de-proteccion-de-datos-prohibe-a-worldcoin-seguir-recogiendo-datos-de-iris.html

Pues bien, la transcendencia que va a tener la Inteligencia Artificial en vuestra privacidad es y será mayúscula. No es casualidad que un exdirector de NSA sea un asesor de Seguridad de OpenAI. La compañía ha nombrado al general retirado del Ejército de los Estados Unidos, Paul Nakasone, para su nuevo comité de seguridad.

https://www.cio.com/article/2152275/whats-behind-openais-appointment-of-an-ex-nsa-director-to-its-board.html

Si analizamos otro de los actores de la IA, como es Google, sus conexiones con la NSA son extensas. Mi creencia es que tener una cuenta de Google, es tenerla en la NSA:

Casey Oppenheim: Cofundador de Disconnect, una organización que ofrece servicios de búsqueda centrados en la privacidad, y anteriormente trabajó en Google.
Patrick Jackson: Actual director técnico de Disconnect y antiguo ingeniero de la NSA.
Justin Schuh: Ex director de ingeniería de Google Chrome y anteriormente trabajó como analista de inteligencia para el Cuerpo de Marines de Estados Unidos, analista de explotación de redes globales para la NSA y oficial de operaciones técnicas para la CIA.
Tom Franklin: Trabajó como director de producto para Google entre 2015 y 2021 y anteriormente fue director de programa en la CIA.
Katherine Pham: Actualmente es ingeniera de software en Google y anteriormente realizó trabajos no especificados en la CIA.
Corey Ponder: Antiguo asesor político de Google y anteriormente pasó seis años en la CIA.

O Palantir:

Palantir Technologies, fundada en 2004, tiene un historial de colaboración con agencias de inteligencia, incluida la NSA. Según documentos facilitados por Edward Snowden, Palantir ha ayudado a ampliar y acelerar la red mundial de espionaje de la NSA. El software de la empresa, como Gotham, se ha utilizado para procesar grandes cantidades de datos recopilados por el programa XKEYSCORE de la NSA.

Herramientas IA

Probablemente si facilitase una lista ámplia la gran mayoría conocerían ChatGPT. Algunos Google Gemini. Hoy, tras la irrupción de DeepSeek “la IA China”, sé que la conoces si no viniste de Marte ayer mismo. Hay cientos de herramientas, pero me quiero centrar en soluciones que respeten la privacidad.

Si usas habitualmente ChatGPT, escribe el siguiente prompt: “escribe todo lo que sepas de mi”. Te darás cuenta de lo que estoy planteando y del riesgo que corre tu información personal, incluso tus búsquedas. Estás dando demasiado. Aunque pagues, imagina utilizar un modelo de lenguaje, tan atractivo y bueno como ChatGPT, pero sin identificarte, anónimamente, o al menos, poder utilizarlo localmente sin conexión a internet.

Pues es posible:

DuckDuckGo: https://duckduckgo.com/?q=DuckDuckGo+AI+Chat&ia=chat&duckai=1

Esta herramienta de IA te permite acceder a diferentes modelos de lenguaje de IA:

o-mini de Open AI
Claude 3-Haiku de Anthropik
Llama 3.1 70B (código abierto)
Mistral 8X7B. (código abierto)

Todos ellos sin identificarte y sin necesidad de dar datos personales. Digamos que desde DuckDuckGo, ninguno de los modelos tienen información personal tuya. Solo es ir y usar.

Leo de Brave:

Brave es un navegador (https://brave.com/) basado en la privacidad. Evita recopilar publicidad y guarda información mínima. Leo es el asistente de IA para brave. No necesitas usuario ni email, ni contraseñas. Usa modelos de código abierto como deepseek o llama

Venice.ai

Venice.ai es una plataforma de inteligencia artificial basada en modelos de lenguaje grandes (LLMs) y modelos generativos como Deepseek, Dolphin, Llama o Qwen. Utiliza estas tecnologías para crear y optimizar contenido creativo, como textos e imágenes, de manera eficiente. La plataforma emplea técnicas de procesamiento de lenguaje natural (NLP) y machine learning para comprender las necesidades de los usuarios y generar contenido personalizado y relevante. Venice.ai automatiza tareas repetitivas en marketing y diseño, integrándose en los flujos de trabajo de equipos para escalar la producción creativa y mejorar la calidad del contenido con la ayuda de IA avanzada y modelos generativos. No necesita usuario-contraseña y respeta la privacidad del usuario. Tiene una API para integrarlo en cualquier aplicación que necesite buscar en modelos de AI.

Arquitectura de una consulta a venice.ai

Jan.ai

Jan.ai es una solución de inteligencia artificial de código abierto diseñada para funcionar completamente en tu dispositivo, sin necesidad de conexión constante a la nube, lo que garantiza que tus datos permanezcan únicamente en local. Gracias a su arquitectura local-first, Jan.ai protege tu privacidad al evitar que la información de tus conversaciones y configuraciones se envíe o almacene en servidores externos jan.ai.

Jan.ai permite conectarse mediante API a otros modelos de IA.

GPT4All

GPT4All es una aplicación de escritorio de código abierto que permite ejecutar modelos de lenguaje (LLMs) de manera local, sin depender de llamadas a APIs externas ni de procesadores especializados en la nube. Diseñada para funcionar en dispositivos de uso cotidiano, GPT4All ofrece privacidad total, ya que todos los datos y procesos se mantienen en el equipo del usuario.

¿Qué es GPT4All?

GPT4All es un ecosistema que facilita el uso de grandes modelos de lenguaje (LLMs) en entornos locales. Con una interfaz de usuario intuitiva y soporte para múltiples sistemas operativos (Windows, macOS y Linux), permite a usuarios y desarrolladores descargar y ejecutar modelos directamente en sus equipos. Esto elimina la necesidad de enviar información a servidores externos, garantizando un control total sobre la privacidad de los datos.

Modelos LLM que utiliza GPT4All

GPT4All está optimizado para ejecutar LLMs en el rango de 3 a 13 mil millones de parámetros en hardware de consumo. Entre los modelos que se pueden descargar y utilizar se encuentran:

Meta-Llama-3-8B-Instruct: Basado en la arquitectura de Llama 3, este modelo de 8 mil millones de parámetros está diseñado para seguir instrucciones y generar respuestas coherentes.
Nous-Hermes-2-Mistral-DPO: Un modelo de aproximadamente 7 mil millones de parámetros, que combina tecnologías de Mistral y optimizaciones específicas para un rendimiento equilibrado.
GPT4All Falcon: Un modelo optimizado con técnicas de cuantización (q4_0), que permite ejecutar modelos de alrededor de 13 mil millones de parámetros de manera eficiente en hardware limitado.
Mini Orca: Una versión más ligera diseñada para funcionar en dispositivos con recursos más restringidos, ideal para pruebas rápidas y experimentación en entornos locales.

Estos modelos, junto con otros disponibles a través de GPT4All, permiten a los usuarios elegir la opción que mejor se adapte a sus necesidades, ya sea priorizando la velocidad, la calidad de la respuesta o la capacidad de trabajar con textos largos y complejos.

OpenAssistant. ¿Qué es?

OpenAssistant es una iniciativa comunitaria que busca desarrollar un asistente conversacional capaz de comprender y responder a preguntas de forma similar a ChatGPT, pero con la ventaja de ser completamente abierto. Su desarrollo se basa en la colaboración global de desarrolladores, investigadores y entusiastas que comparten la visión de democratizar el acceso a la inteligencia artificial. Al ser de código abierto, todo el proceso de creación, entrenamiento y puesta en producción del modelo es transparente, lo que permite a cualquiera auditar, modificar y mejorar su funcionamiento.

Orígenes y Filosofía

El proyecto nace en un contexto de creciente preocupación por la privacidad, la transparencia y el control que los usuarios tienen sobre sus datos. Mientras las grandes corporaciones imponen sus soluciones cerradas y a menudo restrictivas, OpenAssistant apuesta por la colaboración y la apertura. Inspirado en iniciativas como el OpenAssistant Conversations Dataset (OASST), el proyecto recopila y utiliza datos generados por la comunidad para entrenar modelos que sean capaces de comprender el lenguaje natural de manera ética y responsable.

Esta filosofía «abierta y colaborativa» no solo fomenta la innovación, sino que también permite que el asistente se adapte a las necesidades específicas de distintos usuarios y aplicaciones, sin depender de costosas infraestructuras en la nube ni de políticas restrictivas sobre el manejo de datos.

Características Principales

1. Código Abierto y Transparencia: El núcleo del proyecto es completamente accesible en GitHub, lo que garantiza que cualquier interesado pueda revisar el código, contribuir a su mejora o incluso utilizarlo como base para proyectos propios. Esta transparencia fomenta la confianza y la colaboración entre la comunidad.

2. Entrenamiento Colaborativo: La comunidad de OpenAssistant se encarga de alimentar y refinar el modelo a través de datos y feedback de usuarios. Esto permite que el asistente se actualice constantemente y mejore su capacidad de respuesta, adaptándose a nuevos contextos y preguntas.

3. Privacidad y Control de Datos: A diferencia de muchos asistentes comerciales, OpenAssistant se enfoca en mantener la privacidad de los usuarios. Al permitir que el modelo se ejecute de forma local (o en servidores que se gestionen de forma transparente), se minimiza el riesgo de que los datos personales se compartan sin consentimiento.

4. Personalización y Flexibilidad: El sistema está diseñado para ser altamente personalizable. Los usuarios pueden ajustar parámetros, adaptar el modelo a tareas específicas y desarrollar extensiones o plugins que añadan funcionalidades particulares, adaptándolo a diversos casos de uso, desde asistencia en la redacción de textos hasta la integración en sistemas de atención al cliente.

5. Comunidad Activa: El desarrollo de OpenAssistant se apoya en una vibrante comunidad internacional que comparte ideas, recursos y mejoras. Esta colaboración global acelera el proceso de innovación y permite que el asistente evolucione rápidamente frente a los desafíos que plantea la inteligencia artificial.

Modelos y Tecnología

Si bien el ecosistema de OpenAssistant está en constante evolución, el proyecto utiliza arquitecturas modernas basadas en modelos de lenguaje preentrenados. Gracias a la colaboración con plataformas como Hugging Face y a la disponibilidad de datasets abiertos, OpenAssistant puede ser finetuneado con datos reales aportados por la comunidad. Esto permite desarrollar modelos que no solo sean capaces de generar respuestas coherentes, sino también de comprender matices y contextos específicos gracias a un entrenamiento colaborativo y transparente.

Impacto y Futuro

OpenAssistant representa una apuesta por un futuro en el que la inteligencia artificial sea accesible para todos y se desarrolle en un marco ético y abierto. Con su enfoque en la privacidad, la personalización y la colaboración, el proyecto tiene el potencial de transformar la manera en que interactuamos con los sistemas conversacionales, ofreciendo una alternativa a las soluciones cerradas y centralizadas.

A medida que la comunidad siga aportando mejoras y refinamientos, OpenAssistant podría expandirse a nuevos ámbitos de aplicación, desde asistentes personales en dispositivos locales hasta soluciones integradas en empresas y servicios públicos, siempre manteniendo el compromiso de transparencia y control por parte de los usuarios.

Bloom https://bigscience.notion.site/BLOOM-BigScience-176B-Model-ad073ca07cdf479398d5f95d88e218c4

Bloom es el resultado de un esfuerzo colaborativo sin precedentes liderado por la comunidad BigScience, una iniciativa internacional que agrupa a cientos de investigadores y expertos en inteligencia artificial con el objetivo de democratizar el acceso a modelos de lenguaje de gran escala. Este modelo se distingue no solo por su tamaño y capacidad, sino también por su enfoque abierto y responsable, que pone la colaboración y la transparencia en el centro de su desarrollo.

Orígenes y Filosofía

El proyecto Bloom nació como parte del BigScience Workshop, un esfuerzo colectivo impulsado por la comunidad y coordinado por organizaciones como Hugging Face. La idea detrás de Bloom era crear un modelo de lenguaje verdaderamente multilingüe y accesible, que sirviera a investigadores, desarrolladores y usuarios de todo el mundo. Desde el inicio, sus creadores se comprometieron a que el modelo fuese completamente abierto, permitiendo que cualquiera pueda auditar, modificar o adaptar el código y los datos utilizados en su entrenamiento. Este enfoque contrasta con las soluciones propietarias, fomentando un ecosistema en el que la inteligencia artificial se desarrolla de manera ética y compartida arxiv.org.

Características Principales

1. Multilingüismo y Accesibilidad: Bloom está diseñado para entender y generar texto en numerosos idiomas. Esta capacidad multilingüe amplía significativamente su utilidad, permitiendo aplicaciones en contextos internacionales y facilitando el acceso a tecnologías avanzadas de IA en regiones donde el soporte en lenguas minoritarias ha sido históricamente limitado.

2. Arquitectura de Vanguardia: Construido sobre la arquitectura transformer, Bloom aprovecha los avances más recientes en procesamiento del lenguaje natural. Con versiones que varían en tamaño (desde modelos más pequeños hasta versiones con decenas de miles de millones de parámetros), ofrece una flexibilidad que permite a los usuarios elegir el equilibrio adecuado entre rendimiento y requisitos computacionales según sus necesidades.

3. Código Abierto y Colaborativo: Una de las mayores fortalezas de Bloom es su naturaleza abierta. Al estar bajo licencias que promueven el uso libre y la colaboración, cualquier persona interesada puede contribuir a su desarrollo o adaptar el modelo para usos específicos. Esto favorece la transparencia y permite la creación de aplicaciones personalizadas que respeten los principios de privacidad y ética en la inteligencia artificial.

4. Enfoque Ético y de Privacidad: El equipo detrás de Bloom ha puesto un énfasis especial en desarrollar el modelo de manera responsable. Se han establecido directrices éticas para su uso y se han implementado mecanismos que permiten a los usuarios tener un mayor control sobre sus datos. De este modo, Bloom no solo busca ofrecer altos niveles de rendimiento, sino también garantizar que la tecnología se utilice de forma respetuosa con la privacidad y los derechos de los individuos.

Impacto y Futuro de Bloom

Bloom representa un hito en la creación de modelos de lenguaje de gran escala bajo un esquema colaborativo. Al ser el fruto de un esfuerzo global, su desarrollo ha permitido integrar diversas perspectivas y conocimientos, lo que a su vez ha llevado a un modelo más robusto y versátil. Se espera que Bloom abra nuevas posibilidades en ámbitos tan variados como la traducción automática, la generación de contenido, el análisis de sentimientos y muchas otras aplicaciones que dependen del procesamiento del lenguaje natural.

El éxito de Bloom sienta un precedente para futuros proyectos colaborativos en inteligencia artificial. Al demostrar que es posible construir modelos avanzados con un enfoque abierto y ético, Bloom impulsa la idea de que la innovación en IA no tiene que estar reservada para unos pocos gigantes tecnológicos, sino que puede ser una herramienta accesible para toda la comunidad.

Bloom es mucho más que un modelo de lenguaje: es un símbolo del poder de la colaboración y la apertura en el campo de la inteligencia artificial. Con su capacidad multilingüe, arquitectura avanzada y compromiso ético, Bloom está allanando el camino para un futuro en el que las herramientas de IA sean accesibles, transparentes y respetuosas con la privacidad. Gracias al esfuerzo conjunto de la comunidad BigScience, Bloom invita a todos a participar en la revolución de la inteligencia artificial, ofreciendo una plataforma sobre la cual se pueden construir soluciones innovadoras y responsables.

Oobabooga

Oobabooga es, en esencia, una interfaz de usuario (frontend) para ejecutar y gestionar modelos de lenguaje de forma local. Su propuesta se centra en facilitar la experimentación y el uso práctico de los LLM sin necesidad de depender de servicios en la nube. Al integrarse con implementaciones como llama.cpp, Oobabooga permite que usuarios, tanto aficionados como desarrolladores, puedan interactuar con modelos de lenguaje sin sacrificar la privacidad, ya que la información se procesa en el dispositivo propio. Además, su diseño modular y abierto posibilita la integración de extensiones y plugins, adaptándose a diversas necesidades y fomentando la colaboración en la comunidad.

Alpaca

Alpaca surgió a partir del modelo de lenguaje desarrollado por Stanford, y se diseñó como una versión ajustada y accesible de modelos de gran escala. Su principal atractivo es la capacidad de ejecutar tareas de procesamiento del lenguaje natural sin requerir infraestructura costosa, ya que está pensado para ser ligero y adaptable. Alpaca ha inspirado a numerosos proyectos y adaptaciones dentro de la comunidad de código abierto, y su enfoque “ligero” lo hace ideal para aquellos que desean experimentar con LLM en hardware limitado.

Reflexión final

Existen multiplicidad de opciones que permiten un uso extenso de los modelos de IA más desarrollados, manteniendo la privacidad de tus datos personales, no guardando los datos como parte del entrenamiento del modelo de Lenguaje.

¿Porqué vas a regalar tus datos si hay alternativas igualmente fiables, más privadas?.

Conocerlas es proteger tu privacidad y proteger tu privacidad es proteger tu libertad.

El Caso Worldcoin

Herramientas IA

DuckDuckGo: https://duckduckgo.com/?q=DuckDuckGo+AI+Chat&ia=chat&duckai=1

Leo de Brave:

Venice.ai

Jan.ai

GPT4All

¿Qué es GPT4All?

Modelos LLM que utiliza GPT4All

OpenAssistant. ¿Qué es?

Orígenes y Filosofía

Características Principales

Modelos y Tecnología

Impacto y Futuro

Bloom https://bigscience.notion.site/BLOOM-BigScience-176B-Model-ad073ca07cdf479398d5f95d88e218c4

Orígenes y Filosofía

Características Principales

Impacto y Futuro de Bloom

Oobabooga

Alpaca

Reflexión final

GDPR