Redes neuronales y el backprop del artista compresor

¿Cómo describirías tu pieza musical favorita?

De tratar de hacerlo, tal vez empezaría por describir los sonidos en relación a categorías, géneros. Pero lo más importante para mi es el aspecto emocional e intelectual. Al final, la música la percibo más allá de mis sentidos. La satisfacción de consumir arte no sucede en los receptores del cuerpo humano, sino en el procesamiento de esta información. Al percibir una obra de arte, esa información es transformada y modificada de tal forma que nuestra mente la interprete de acuerdo a la informacion contextual y las memorias que tenemos disponibles. El resultado es una respuesta emocional que se traduce en activación hormonal u otros procesos fisiológicos.

¿Cómo sucede esta síntesis de información que el artista plasma en una obra?

La obra de arte contiene una cantidad finita de información que provoca reacciones muy complejas en diferentes individuos. El artista parte del conocimiento de arquetipos y símbolos colectivos. Hasta cierto punto, el artista tiene la capacidad de predecir respuestas de individuos que comparten un marco cultural. Estos símbolos se expresan principalmente a través del contenido de la obra. El qué nos dice la obra. El cómo es algo más complejo. La yuxtaposición de contenido y forma es lo que provee la estructura que activa diferentes reacciones neuronales que terminan en una respuesta en el receptor del arte.

En el campo de machine learning existen una familia de algoritmos conocidos como neural networks o redes neuronales. Estas redes consisten en una serie de operaciones no-lineales que transforman un input para producir un output. Las redes se usan como emuladores de otros procesos mucho más costosos. Por ejemplo, los convolutional neural networks (CNN) se usan para reconocer imágenes. Uno de estos CNNs puede ser calibrado para identificar entre gatos y perros. En la práctica, el algoritmo sería presentado con una imagen y éste determinaría si se trata de un gato o un perro.

1_9ng9AxixrDUGvVfKA7dypg

El algoritmo es agnóstico: no tiene conocimiento de lo que significa ser un perro o un gato. Pero al ser calibrado, se convierte en capaz de determinar las características más fundamentales que hacen un perro a un perro. En teoría, los cerebros humanos hacen algo similar. Podemos describir con palabras a un perro o a un gato pero díficilmente podríamos encontrar una clara delimitación entre estos dos, en base a sus características visuales. Sin embargo, hay transformaciones de las imagenes de estas dos categorías en las que es posible demarcar una diferencia clara. En matemáticas hay algo conocido como manifold hypothesis que alude a este concepto: todas las formas, bajo transformaciones homeomórficas, son separables. Imaginen un nudo. En teoría, hay transformaciones isotópicas que deshacen este nudo. Una vez que un objeto ha sido sujeto a estas transformaciones, el nudo es separable. En el ejemplo del clasificador, los dos lazos del nudo son gato y perro.

A mi me parece que nuestros cerebros procesan el mundo de una forma similar a una red neuronal. La complejidad del cerebro humano es mucho, mucho mayor a la de los algoritmos. Sin embargo, nuestro cerebro toma algo tan complejo como una obra de arte y produce algo que entendemos y que trasciende las palabras. Es decir, nuestro lenguaje no ofrece esa transformación adecuada para describir el significado del arte. El significado se esconde bajo algo más fundamental que sólo se vislumbra en una serie de transformaciones que parten de un marco referencial único a cada individuo.

Pero lo más increíble es la compilación que hace el artista. El artista toma ese marco de referencia individual en el que puede conceptualizar sus emociones o sus ideas y lo traduce a una representación física que es capaz de transmitir esta información a otro ser humano. Es decir, el artista, de alguna forma, ejecuta la acción inversa a la de interpretar el arte.

La clasificación entre gatos y perros de la que hemos hablado sucede en un proceso llamado forward propagation. Durante este proceso, la imagen del gato es transformada para ser separable y clasificable. Sin embargo, cuando se calibra la red neuronal, se hace a través de algo conocido como back propagation (backprop). Este proceso consiste en calcular gradientes del output con respecto a los filtros o kernels del algoritmo. Es decir, calibra los parametros de estos filtros para realizar las transformaciones adecuadas para identificar entre un perro y un gato.

El artista, me parece, ejecuta un backprop. Calibra la forma y el contenido de su obra de tal forma que produzca la respuesta que él o ella desea. Todo esto sucede sin que el artista lo haga conscientemente. Probablemente sea a través de la intuición o de mecanismos que no entendemos o no conocemos. Pero el resultado de una obra de arte efectiva es un impulso de información sintetizada que al interactuar con nuestros receptores neuronales, produce respuestas que el artista transmite, pero en formas que el artista jamás pudo predecir porque carece del marco referencial del receptor. Esta cuota de información debe ser interpretable por otros humanos. De ahí que sea necesaria una gran sensibilidad para generar la encriptación adecuada.

Jurgen Schmidhuber tiene una serie de teorías en las que trata de explicar el arte, el humor, el placer, etc. Schmidhuber parte del principio de complejidad informática de Kolmogorov que habla de la información comprimida más pequeña que es computable. Algo así entiendo el papel del artista. La obra de arte más efectiva es esa compresión de informacion intransmitible a través del lenguaje, pero que es descomprimible por nuestra red neuronal biológica.

No pretendo comparar el nivel de complejidad de los algoritmos que utilizamos en machine learning a los mecanismos biológicos. Sólo creo que podemos entendernos a nostros mismos a través de las formas creativas en que utilizamos matemáticas para transformar el mundo perceptible (y también aquel que no lo es).

femmefractale288

Anuncios