Qué es una red neuronal, sin matemáticas avanzadas

Cada vez que sale una noticia sobre inteligencia artificial aparece la misma palabra, red neuronal. Y casi siempre con la misma imagen mental detrás: un cerebro electrónico, una conciencia digital, algo casi vivo. Esa imagen estorba más que ayuda. Las redes neuronales no son cerebros, son una herramienta matemática que se inspira en cómo funciona una neurona, nada más.
Una red neuronal es un sistema que se inspira en las neuronas humanas: muchas unidades simples conectadas que trabajan juntas. Cada una, por sí sola, apenas decide. Lo interesante pasa al juntarlas: se especializan, se reparten el trabajo, y entre todas reconocen patrones que ninguna lograría sola. Por eso se llaman redes neuronales artificiales, no cerebros artificiales.
A partir de ahí, sin entrar en cálculo diferencial ni en álgebra lineal avanzada, se puede entender lo que hay dentro. Vamos por partes.
¿Qué hace una neurona artificial?
Una neurona artificial recibe varios números, hace una cuenta muy concreta y devuelve un solo número. La cuenta tiene tres pasos:
- Multiplica cada número de entrada por un peso (otro número, suyo, que se ajusta durante el entrenamiento).
- Suma todos esos productos.
- Aplica una función de activación: si el resultado supera cierto umbral, la neurona "se enciende" y devuelve un valor cercano a 1. Si no, devuelve un valor cercano a 0.
Eso es todo. No hay magia, no hay pensamiento, no hay intuición. Una neurona artificial es una calculadora con tres operaciones: multiplicar, sumar y decidir si enciende.
Si te imaginas un interruptor que se activa cuando la suma de sus entradas pesadas pasa de un punto, ya entiendes cómo funciona una neurona. Lo único especial es que los pesos no son fijos, se aprenden con el tiempo.
¿Por qué una sola no decide gran cosa?
Imagina puntos repartidos en una hoja, unos azules y otros naranjas. Una neurona solo sabe trazar una línea recta y decidir qué hay a cada lado. A veces eso basta:
Y aquí viene la pregunta interesante: ¿cómo encuentra la neurona esa línea? No la trae puesta de fábrica. Empieza en cualquier sitio y se va ajustando: prueba una posición, mira cuántos puntos clasifica mal, se mueve un poco en una dirección que reduzca los errores, y vuelve a probar. Paso a paso, la línea se acerca a la que separa bien:
Cómo se hace ese ajuste es el tema del próximo artículo sobre algoritmos evolutivos. Aquí basta con la imagen: la neurona aprende moviendo su línea hasta donde mejor le va.
Cuántas neuronas hacen falta depende del problema. Con los casos de arriba basta una. Hay otros donde una sola se queda corta:
En el primer caso (naranjas en diagonal), con dos neuronas basta: una traza una línea, la otra traza la otra, y entre las dos encierran los naranjas. Para algunos problemas dos son suficientes.
En el segundo caso, los naranjas forman un grupo redondeado. La frontera ideal sería un círculo, y un círculo no se puede dibujar con líneas rectas: harían falta infinitas. Pero con cuatro ya se aproxima, con ocho aún más, con unas cuantas decenas la aproximación es tan buena como necesites.
Esa es la idea. Una neurona dice poco. Para algunos problemas dos son suficientes. Para otros harían falta infinitas en teoría, pero con un número limitado la aproximación ya es suficientemente buena. Cuantas más, más fina la frontera, y casi nunca se llega a perfecto porque casi nunca hace falta. Los problemas que se pueden resolver con una sola línea recta se llaman linealmente separables. La mayoría de los problemas interesantes (gatos y perros, voces, caras, lenguaje) no lo son.
He ilustrado todos los ejemplos en dos dimensiones para que se vean, pero en el mundo real un problema puede tener cualquier cantidad de aspectos a considerar, y cada aspecto es una dimensión. Una foto de gato no son dos números, son miles (uno por píxel). Un texto no son dos, son cientos (uno por palabra). Las neuronas funcionan igual: trazan líneas en una hoja, planos en 3D, y en muchas dimensiones hacen lo mismo aunque ya no se pueda dibujar. La intuición es la misma, la geometría es invisible.
Hay casos aún más exigentes. Mira esta doble espiral:
Aquí no basta con cuatro líneas, ni con veinte. La frontera entre los naranjas y los azules gira sobre sí misma dos veces. Para separarlas no llega con poner muchas líneas en paralelo, hace falta que unas neuronas miren lo que han detectado otras y combinen ese trabajo. Es decir, hace falta organizarlas en capas. De eso va el siguiente apartado.
¿Qué cambia al juntarlas en capas?
Aquí está el truco. Si pones varias neuronas en una primera capa, cada una mirando lo mismo pero con pesos distintos, cada una se especializa en detectar una cosa diferente. Una se hace experta en "tiene orejas puntiagudas", otra en "tiene hocico largo", otra en "tiene rabo enroscado". Ninguna decide aún si es gato o perro, solo detectan rasgos.
Después conectas esa primera capa a una segunda capa de neuronas. Esta no mira la imagen original, mira lo que dijeron las neuronas anteriores. Y combina: si la de "orejas puntiagudas" se ha encendido y la de "hocico corto" también, eso suma puntos para gato. Si se han encendido "hocico largo" y "rabo enroscado", suma puntos para perro.
Cuantas más capas, más fina es la combinación. Las primeras capas detectan rasgos básicos (líneas, curvas, manchas), las del medio combinan rasgos en partes (orejas, ojos, hocicos), las últimas combinan partes en conceptos (gato, perro, conejo).
A esto se le llama aprendizaje profundo, deep learning en inglés. Profundo no quiere decir inteligente, quiere decir literalmente que hay muchas capas. Lo único especial es que ninguna persona programa qué tiene que detectar cada neurona. Eso emerge solo durante el entrenamiento, que es el tema del siguiente artículo.
¿Por qué se llaman redes neuronales y no cerebros?
Porque no son cerebros. Una neurona humana es mucho más rica que su versión artificial: tiene neurotransmisores, plasticidad, conexiones que crecen y mueren, ritmos eléctricos, contexto químico. Una neurona artificial es una suma con un umbral. La inspiración es real pero la diferencia de complejidad es brutal.
Llamarlas cerebros artificiales sería como llamar avión a un cometa porque ambos vuelan. La forma es parecida, el principio remoto es el mismo, pero la cosa es otra. Las redes neuronales son herramientas matemáticas potentes que han transformado lo que un ordenador puede hacer, sin necesidad de ser cerebros para conseguirlo.
Mantener esta distinción cambia cómo lees las noticias. Cuando alguien dice "la IA piensa", lo que está pasando dentro es una multiplicación de matrices muy grande. Cuando alguien dice "la IA aprende", lo que está pasando es que se ajustan unos pesos. Cuando alguien dice "la IA decide", está convirtiendo unos números en otros. Todo eso es real y todo eso es impresionante, pero ninguna parte requiere conciencia.
¿Cómo lo veo funcionando con mis propias manos?
He preparado un juego para que entiendas la idea desde dentro sin instalar nada ni mirar fórmulas. Es una red neuronal muy pequeña, con solo 22 números (pesos), que aprende a jugar al dilema del prisionero, un juego de estrategia simple.
Mira 5 cosas (las últimas jugadas), las pasa por 3 neuronas internas y decide entre dos opciones: cooperar o traicionar. Puedes cambiar la arquitectura (más neuronas, más capas), ver cómo se conectan, mirar los pesos uno por uno y, sobre todo, llevártela a competir contra otras estrategias en el juego principal.
Es la misma maquinaria que hay dentro de ChatGPT, solo que ChatGPT tiene miles de millones de pesos en vez de 22. El principio es idéntico. La escala es lo que cambia.
Cuando juegues, fíjate en una cosa: la red empieza con números al azar y va mejorando sola sin que nadie le diga la respuesta. Cómo aprende, sin maestro, es otra pieza interesante. Esa es la conversación del siguiente artículo: los algoritmos evolutivos, que es el motor que afina los pesos hasta que la red juega bien.
Si quieres entender el contexto más amplio (qué es exactamente la inteligencia artificial, dónde encajan las redes neuronales dentro de ella, qué diferencia hay con un programa "normal"), te lo cuento entero en Inteligencia artificial y machine learning: qué es cada cosa.
