En estos trepidantes tiempos de evolución tecnológica está a la orden del día recibir el impacto de cientos de noticias sobre una nueva herramienta que va a cambiar el paradigma de evolución humana.
En los últimos tiempos hemos tenido muchos ejemplos de ello: la robótica, las criptomonedas, el metaverso…
La realidad es que estamos en el periodo histórico con mayor ritmo de cambio, eso es innegable. Pero no por ello tenemos que pensar que todo lo que llega va a acabar con el ser humano tal como lo conocemos.
En los últimos tiempos está de moda hablar de Inteligencia Artificial.
Los tecnófobos la describirán como la última maléfica invención tecnológica que va a destruir el mundo tal como lo conocemos, mientras que los tecnófilos dirán que cualquiera que no la utilice está perdiendo el tiempo porque tiene la capacidad de completarte y acelerarte en tu camino, sea cual sea el lugar al que quieras llegar.
Pero la Inteligencia Artificial no es una moda, al contrario, se habla de ella desde la segunda guerra mundial.
¿Por qué ahora hay ese boom de información sobre la I.A., entonces?
Pues por un aspecto bastante fundamental para que sea viable: la potencia de cálculo.
Como siempre menciono, el conocimiento es información y es poder. En este caso un poder imprescindible para no dejarse llevar por cantos de sirena (alarmistas o eufóricos).
¿Qué es la Inteligencia Artificial?
Pese a que hoy en día se tilda de I.A. a un sinfín de procesos y algoritmos de programación, mi intención es aclarar un poco lo que yo considero I.A.
En general, podríamos considerar que hablamos de I.A. en dos casos, aunque esto depende mucho de la opinión de expertos, que difieren unos de otros. Por un lado tenemos el machine learning (aprendizaje máquina) y por otro el deep learning (aprendizaje profundo).
Me gustaría hablar un poquito de ambas cosas, espero no ser demasiado técnico.
Machine Learning
Estamos ante aprendizaje máquina cuando, mediante procesos matemáticos, elaboramos un algoritmo (una secuencia de instrucciones) que permite a una máquina sacar patrones de una serie de datos y, de esta forma, aprender sobre los mismos para poder predecir con la llegada de un nuevo dato.
En general el punto de partida es siempre similar. Tenemos un conjunto de datos que tienen unas variables (llamadas predictores) que influyen en el valor que toma la variable a predecir.
Esto se entiende mucho mejor con un ejemplo. Podemos tener un conjunto de datos de apartamentos que tienen variables tales como número de habitaciones, número de baños, localización, metros cuadrados y otras tantas más. Con ese conjunto de variables predictoras tenemos, además, un precio ya conocido de ese piso.
El aprendizaje máquina tratará de ver de qué forma todas esas variables influyen en el precio de ese piso, de forma que se puedan obtener patrones y predecir qué precio debería tener un piso en función de su número de habitaciones, baños, metros cuadrados…
El proceso de entrenamiento consiste en dar a la máquina una parte del conjunto de datos y ponerla a trabajar para obtener un modelo que pueda predecir el precio. Luego se prueba ese modelo con otra parte del conjunto de datos que no se ha usado para obtener el modelo y así vemos si para ese conjunto de datos está prediciendo bien el precio.
En ese caso conseguimos un modelo entrenado y listo para ser puesto en funcionamiento.
Todo este trabajo, llamado entrenamiento, es una mezcla de oficio y conocimiento por parte de la persona que elabora el modelo y de potencia de cálculo de la máquina para poder probar más y más opciones hasta dar con la más útil.
Y esta es una de las razones por las que la I.A. está en auge… Casi todos los modelos son obtenidos con una o varias partes donde se emplea la fuerza bruta, es decir, repetir y repetir hasta llegar a un patrón.
Es en este momento de la historia donde tenemos máquinas que nos permiten potencia de cálculo para obtener modelos que generalizan bien, es decir, que son capaces de funcionar bien en nuevos datos aplicando lo aprendido con los datos existentes.
Un ejemplo gráfico
Veamos un ejemplo gráfico para entender un poco el proceso. Imaginemos un caso muy sencillo, tenemos una variable x predictora y una variable y que es el valor a predecir.
Los puntos de la siguiente gráfica muestran los valores conocidos con los que tenemos que aprender la tendencia, y la línea roja muestra el aprendizaje al que debería llegar el modelo de machine learning:
Si vamos probando diferentes opciones de funciones tratando de buscar el mejor modelo podríamos definir funciones (en verde) de diferente grado, es decir, elevadas a diferente exponente, en busca de la que más se parezca a esa línea roja:
El problema es que para llegar a esa función verde y decidir cuál se adapta mejor al caso hay que probar mucho. En el caso anterior, tremendamente sencillo para una máquina, el que mejor se adapta al rojo es la función de grado 3, la del centro.
En los modelos de machine learning que usamos el número de parámetros (variables) no es uno, como en nuestro ejemplo, sino miles o cientos de miles… Por ello la importancia de disponer de potencia de cálculo.
Deep Learning
En el caso del deep learning estamos en un campo de desarrollo algo distinto. No profundizaré demasiado por ser técnicamente más complejo.
La forma de enfocar el problema se estructura de manera diferente, intentando imitar lo que sabemos del cerebro humano.
Se disponen muchas capas seguidas de algo llamado neuronas (por similitud con el cerebro humano) y las neuronas de cada capa están interconectadas con las de la capa siguiente.
El proceso es algo más complejo, pero se basa en que la información de entrada va viajando por las neuronas, que tienen una función de activación que permitirá que la información siga viajando a otras neuronas si, al llegar, tiene unos valores concretos, y si no fuese así no dejarán que siga progresando en sucesivas capas.
En el camino de la información de unas capas a otras se efectúan operaciones matemáticas con la información con el objetivo de potenciar unas características u otras de la misma, de forma que cada capa va filtrando y obteniendo patrones.
Es un proceso más complejo pero, de nuevo, depende mucho de la habilidad para establecer cuántas capas de neuronas se disponen y qué operaciones se realizan entre unas neuronas y otras, un campo de conocimiento totalmente basado en la práctica y el conocimiento (como los oficios).
Y también depende de la capacidad de la máquina para repetir y repetir hasta encontrar un resultado que pueda generalizar bien para datos nuevos.
Entonces… ¿todo es matemáticas?
He aquí el quid de la cuestión. Todo el campo de aprendizaje y modelado dentro de la I.A. se basa en las matemáticas.
Dado que en su descomposición más básica toda información almacenada en una máquina se guarda mediante unos y ceros, cualquier información puede ser tratada de forma matemática (ya sea una imagen, un vídeo, un texto) y trabajar con ella para obtener patrones.
Cuando comprendes realmente cómo funciona algo como Chat GPT ves claramente su potencial y para todo lo que puede ser usado. Pero también ves claras sus limitaciones y por qué esas voces de alarma no tienen argumentos sólidos.
George Box tiene una famosa frase, del año 1976, que dice: “All models are wrong, some are useful.” (Todos los modelos son erróneos, algunos son útiles).
Si, las máquinas son mejores que nosotros repitiendo y obteniendo patrones. Y si, esto hace que nos puedan sustituir en tareas basadas en eso mismo, repetir y obtener patrones, e incluso crear cosas como la siguiente imagen, generada por Midjourney:
Sin embargo, si todo lo que sustenta a la I.A. es una aplicación (más o menos compleja) de principios matemáticos, la pregunta que debería ser relevante es si las matemáticas son capaces de expresar cualquier cosa.
Y aquí está la piedra angular de mi forma de enfocar el problema. Bajo mi perspectiva las matemáticas son un lenguaje muy complejo, y capaz de muchas cosas. Pero, bajo mi criterio, no es un lenguaje divino, omnipotente.
Por lo tanto, si bien la Inteligencia Artificial nos trae una manera muy interesante de ver el mundo, detectar patrones y poder predecir o reproducir información por la vía de las matemáticas es una forma limitada de observar la realidad.
Una forma limitada como también lo es la forma humana de entender el mundo.
Hacer que la inteligencia artificial sea una herramienta que nos ayude en nuestro camino evolutivo hacia convertirnos en seres más humanos pasa por entenderla para quitar poder a aquellos que, constantemente, nos usurpan la tecnología, patrimonio de la humanidad.
¡Las herramientas tecnológicas no pueden pertenecer únicamente a las esferas de poder y gobierno!
Os animo a profundizar y preguntar sobre este tema, desde Humánica trabajamos para dar a la gente la capacidad de entender la tecnología y poder utilizarla con conocimiento y salud.
En el siglo XXI el poder está en el conocimiento .la IA es una herramienta que puede empoderar al hombre , liberarlo y hacerlo ocuparse de temas más humanos
muy buen articulo enhorabuena Alfredo