Ciencia Entrevistas

Dot CSV: «Nos movemos hacia un futuro donde las máquinas serán capaces de generar texto indistinguible del que un humano puede escribir»

Carlos Santana Vega (Las Palmas de Gran Canaria, 1992), es uno de los divulgadores de Inteligencia Artificial (IA) en YouTube más conocidos en nuestro idioma gracias a su canal Dot CSV. En él analiza las últimas tendencias en este ámbito, explicándolas de una manera sencilla y amena para que todo el mundo pueda entenderlas e incluso aprender a programarlas.

¿Qué significa el nombre Dot CSV?

Pues surge de una broma del propio mundillo de la Inteligencia Artificial y el análisis de datos. Generalmente para trabajar con ficheros de datos, se usa un formato de archivo llamado .csv (similar a cómo un fichero de audio es .mp3). Ese «punto CSV» en inglés sería «Dot CSV», y además coincide con las iniciales de mi nombre: Carlos Santana Vega. Era una oportunidad muy buena como para dejarla pasar.

¿Cuándo se te ocurrió crear un canal de youtube para divulgar sobre la inteligencia artificial (IA)?

Pues la idea de crear un canal de youtube sobre Inteligencia Artificial surgió hace unos años, cuando aún no existía el proyecto Dot CSV. Lo que quería era encontrar una forma de difundir este tema de una forma amena y accesible para todos. Sin embargo, al principio no me decidía a lanzarme y lo dejé en el olvido. Fue en el verano de 2017 cuando volví a pensar en ello. Vi que el tema de la inteligencia artificial estaba en pleno auge y que cada vez eran más las personas interesadas en aprender sobre ella. Así que decidí dar el salto y comencé a crear contenido para el canal.

Cuando se habla de inteligencias artificiales, la gente suele pensar en términos de ciencia ficción. Lo cierto es que ya vivimos rodeados de IA, ¿verdad?

Exactamente. La inteligencia artificial es una tecnología que está presente en nuestra vida diaria. Ya usemos un asistente virtual como Siri, Google Now o Alexa, o una aplicación de traducción como Google Translate, estamos usando inteligencia artificial. Cada vez que entramos a Spotify, Netflix o Youtube, el contenido que se nos muestra ha sido seleccionado en base a nuestras preferencias por una IA.

Además, la inteligencia artificial está jugando un papel cada vez más importante en nuestra sociedad. Se está usando en diversos campos como la medicina, el transporte, la agricultura o la economía, por ejemplo.

Y la tendencia es que esto irá a más.

¿Qué diferencia hay entre el concepto de inteligencia artificial y el machine learning?

El concepto de inteligencia artificial es mucho más amplio que el de machine learning. La inteligencia artificial se refiere a la capacidad que tienen las máquinas para realizar tareas que nosotros, humanos, asociamos como inteligentes, como resolver problemas, tomar decisiones o aprender de experiencias.

El machine learning, por su parte, es una subdisciplina de la inteligencia artificial que se centra en el aprendizaje automático, es decir, en la capacidad de las máquinas para aprender por sí mismas a partir de datos. Por tanto, esta inteligencia artificial que va a ejecutar la máquina puede tener su origen porque alguien la ha preprogramado para ello, o más interesante aún, porque ella sola ha aprendido… ¡automáticamente!

¿Entender machine learning nos ayuda a entender cómo piensa el ser humano? ¿O es al revés?

Se trata de una vía de doble sentido. Por un lado, el campo del Machine Learning se ha nutrido bastante de lo que otros campos de estudio nos han podido aportar en cuanto al funcionamiento del cerebro humano. No es casualidad que el tipo de algoritmo más popular de aprendizaje automático se denomine «red neuronal artificial». Los investigadores de este campo de estudio se han inspirado bastante en el funcionamiento de las redes neuronales biológicas. Conceptos como «neuronas», «atención» y «aprendizaje» son utilizados con frecuencia.

Pero inspirarse no significa que funcionen igual, ni siquiera parecido. De la misma forma que podemos decir que el diseño de un avión se inspira en el vuelo de las aves, aunque su ejecución sea muy diferente. Y como decía antes, esto es una vía de doble sentido. Ahora que hay una rama de la ingeniería capaz de crear estos enormes modelos de aprendizaje, y de desarrollar inteligencia artificialmente, surge un nuevo interés desde las ramas biológicas por estudiar y aplicar este tipo de modelos al entendimiento del cerebro.

¿Cómo se programa una inteligencia artificial que, por ejemplo, aprende a pintar cuadros?

Pues existen varias alternativas, pero si te tuviera que hablar de una de las más populares te hablaría de las «Redes Generativas Adversarias» (GANs en inglés). Y es que, plantean una propuesta muy atractiva: vamos a coger a dos IAs y vamos a hacer que compitan en el objetivo que tienen que cumplir. Por un lado, vamos a tener a una IA capaz de generar imágenes, que no son más que un conjunto de píxeles, que a su vez están representados como números. Si la IA aprende a generar la combinación correcta de números, podría generar una imagen de un perro, de una casa o de la Mona Lisa. Y así lo hará.

Si queremos que aprenda a generar imágenes de cuadros, pues cogeremos un montón de imágenes de cuadros famosos y se lo daremos para que aprenda cuáles son las combinaciones de píxeles que hacen que un cuadro sea un cuadro. Y esa será su tarea.

Pero es que al mismo tiempo vamos a tener a otra IA, cuya tarea será observar las imágenes que la otra produzca. Y su objetivo será saber identificar si esa imagen es real o falsa. Por un lado, tienes a un ladrón falsificando billetes (la red generadora) y por el otro, al policía que intenta detectar si esos billetes son falsos o no (la red discriminadora, se llama).

Así, durante el entrenamiento, cada red se hará cada vez más potente, y cuanto más aprende una, más tendrá que aprender la otra. Si una aprende a distinguir mejor los billetes falsos, la otra tendrá que esforzarse en crear mejores falsificaciones. Decimos así que esas dos redes son adversarias.

De ahí el nombre de las «Redes Generativas Adversarias», que son una de las herramientas más potentes jamás desarrolladas para la generación de imágenes artificiales.

En uno de tus vídeos dices que la siguiente Gran Revolución está en el área del procesamiento del lenguaje natural. ¿Por qué?

Pues porque al final todos hablamos, leemos y nos comunicamos a través del lenguaje. Y en la actualidad estamos consiguiendo que las máquinas sean capaces de entenderlo y generarlo. Esto nos abre un sinfín de posibilidades en el campo de la inteligencia artificial. Por ejemplo, podremos construir máquinas que sean capaces de comunicarse con nosotros, de entender nuestro lenguaje y de responder a nuestras preguntas. O de poder controlar un software cualquiera, por ejemplo el que uso yo para editar mis vídeos, sin tocar el ratón: simplemente pidiéndole a la IA con lenguaje natural qué quiero hacer: «corta el vídeo diez segundos», «sube el volumen a la pista tres», etc.

Nos movemos hacia un futuro donde las máquinas serán capaces de generar texto indistinguible del que un humano puede escribir. De hecho… Te invito a que vuelvas a leer la pregunta número tres (en cursiva) y que me digas si te habías dado cuenta de que la respuesta la había escrito una IA 🙂

¿Qué repercusiones puede tener unir el desarrollo de inteligencias artificiales a la computación cuántica?

Es muy incierto. A día de hoy la computación cuántica aún tiene mucho que demostrar en su promesa de ofrecernos un aumento exponencial en la capacidad de computación para algunos problemas. Es un camino que se está recorriendo y donde mucho talento y organizaciones están invirtiendo recursos.

Pero aún así, de conseguirse, no sabemos si la IA (o los algoritmos que la hacen funcionar) estarán en ese privilegiado grupo de problemas que la computación cuántica acelerará. Es incierto que se logre, en algún punto, que podamos hablar de Inteligencia Artificial Cuántica. Y aún es más incierto intentar predecir la enorme revolución científico tecnológica que se podría desencadenar si algún día esto llegara a funcionar.

¿Podrías explicarnos qué es eso que llaman inteligencia artificial fuerte?

Actualmente, la IA que desarrollamos es muy buena a la hora de resolver tareas. Pero tareas muy concretas. Por ejemplo, una IA a la que se le enseña a clasificar perros y gatos será muy buena en esa tarea, pero no intentes que te clasifique dragones y dinosaurios. A este tipo de IAs es a lo que nos solemos referir como débil o estrecha: una IA que sí resuelve bien su tarea, pero solo esa tarea.

En cambio, estamos acostumbrados a ver en la naturaleza ejemplos de inteligencias y aprendizajes que van más allá de unas pocas tareas. Nosotros los humanos podemos aprender un lenguaje, respirar, preparar la comida, completar el Wordle del día, y mucho más. Un único cerebro es capaz de aprender a lo largo de una vida todas estas tareas. Esta versatilidad es a lo que se aspira con lo que llamamos Inteligencia Artificial fuerte. Un objetivo muy deseado en el que se está trabajando.

¿Crees que llegaremos a ver la existencia de una inteligencia artificial consciente?

Yo te diría que no, pero estoy acostumbrado a que el mundo de la IA me sorprenda. Es bastante improbable. El ritmo de progreso del campo de la Inteligencia Artificial en los últimos años ha sido espectacular, logrando en muy poquito tiempo lo que se creía imposible. Pero aun así, te puedo decir que el camino recorrido no nos está acercando al concepto de conciencia artificial. Inteligencia y conciencia son cosas muy diferentes. La pregunta también es: si se consigue… ¿cómo lo podríamos saber?

Y de todo lo que puede hacer una IA que has visto hasta el momento, ¿con qué has alucinado más?

Ser capaz de dominar el lenguaje y poder generarlo era algo que no esperaba ver en el corto plazo. Y sin embargo, de un año para otro pasamos de IAs que apenas sabían juntar más de 5 palabras sin liarse, a espectaculares modelos del lenguaje que son capaces de generar párrafos y párrafos en diferentes idiomas y con más elocuencia que muchas personas.

Después de estudiar un doble grado en ingeniería informática y ADE hiciste un máster en Helsinki sobre ciencia de datos. ¿Qué es un científico de datos y por qué es tan importante hoy en día?

Creo que no pillo a nadie por sorpresa si le digo que actualmente vivimos en una sociedad digitalizada que genera ingentes cantidades de datos por segundo. La llegada de los ordenadores, Internet, la computación móvil, etc. ha propiciado que todo, todo, todo pueda ser registrado, medido y analizado. Si la materia prima son los datos, la Ciencia de Datos será la que se encargue de extraer de ellos la información más importante.

Por ejemplo, tú puedes tener a un equipo de jugadores de fútbol de los cuales tienes registrado datos de todos sus movimientos, estadísticas, histórico de partidos, etc. y un científico de datos se encargará de aplicar las metodologías y herramientas necesarias para extraer de estos datos, por ejemplo, cuáles son las jugadas óptimas para ganar un partido. Extraer el valor que se esconde en los datos, a través del análisis, la estadística, el machine learning, la ingeniería de sistemas, etc. es de lo que se ocupa un Científico de Datos.

¿Qué lenguaje de programación recomendarías a quien quiera aprender a programar una IA?

Aprender a programar en realidad consiste en aprender dos cosas fundamentales: primero aprender la lógica de la programación. Esto es, aprender como descomponer un problema en sus partes y desarrollar un algoritmo que lo solucione, y segundo aprender un lenguaje de programación que te permita traducir esa solución que has encontrado a instrucciones que la máquina pueda entender.

Para lo primero, recomiendo empezar con algún lenguaje introductorio tipo Scratch. Para lo segundo, una vez ya entiendes la lógica de la programación, empezar con un lenguaje de sintaxis amable como Python es una muy buena opción. Además de que te abrirá las puertas a poder programar Inteligencia Artificial.

¿Por qué son tan importantes las derivadas?

Pues son importantes (muy importantes) a dos niveles. En primer lugar, porque ejemplifican muy bien eso de que «¿para qué voy a estudiar esto si realmente no tiene utilidad?». Es una frase peligrosa que en muchos casos refleja que al alumno no se le ha sabido transmitir la utilidad de lo que aprende. Un fenómeno que es bastante común en asignaturas como las matemáticas.

Lo que subyace tras esta pregunta, por ejemplo, cuando se le enseña a un alumno qué es una derivada, es que lo que te quiere transmitir es su frustración de no saber por qué en vez de estar quedando con sus amigos, leyendo un libro o jugando al Minecraft, tiene que estar aprendiendo unas herramientas para las que nadie realmente le ha dicho para qué sirven. La gestión de la motivación es importantísima.

Pero… ¿y si de repente te contaran que esto de las derivadas tiene muchísima utilidad, por ejemplo, en el desarrollo de videojuegos, para poder programar físicas de saltos y movimientos como las que vemos en el Fortnite? O más interesante (al menos para mí), que las derivadas juegan un papel fundamental en el proceso de entrenamiento de la Inteligencia Artificial. Al final una derivada es una herramienta matemática que te permite saber como una medida va a cambiar cuando vamos modificando aquellos parámetros de las que depende. Por ejemplo: si aumento en una hora el tiempo que dedico a estudiar matemáticas cada día, ¿cuánto aumentará mi calificación final al acabar el curso? Una derivada podría darte ese valor, y si te das cuenta, es una información valiosísima para saber si deberías de aumentar o no el tiempo dedicado a estudiar (spoiler: aumentar es buena idea).

Esta misma idea, usar la información que nos aportan las derivadas para que la IAs modernas puedan modificar su comportamiento y mejorarse con el objetivo de que cada vez tomen mejores decisiones, es el motivo por el que las derivadas (y otras herramientas matemáticas que vemos en el instituto) son tan importantes.

¿Qué es un sesgo en IA y cómo podemos evitarlo?

Un sesgo en inteligencia artificial es una característica o tendencia de un algoritmo que influye en los resultados de una clasificación o decisión. Por ejemplo, si yo te pido que te imagines la siguiente historia: «afortunadamente, con la experiencia de haber trabajado durante veinte años haciendo cirugía torácica en un hospital, y tras siete horas de operación, acabó salvando la vida del paciente», posiblemente la mayoría se habrá imaginado a un protagonista masculino en esta historia (la mayoría, no todos). Si eso sucede es porque en nuestra cabeza también tenemos sesgos aprendidos que poco a poco estamos deconstruyendo.

De la misma forma, la IA puede aprender estos sesgos. Al final, estos sistemas se entrenan a partir de datos que capturamos como reflejo de nuestra sociedad, y es fácil que muchos de los sesgos con los que convivimos acaben transmitidos a la IA. De ahí que no sea raro ver a sistemas como el traductor de Google, hasta hace no mucho, traducían siempre la frase «he/she’s a doctor» en la forma masculina y «he/she’s a nurse» en la forma femenina. Eso es un sesgo (de género) aprendido y que además contribuye a que este sesgo siga existiendo.

Para evitar estos sesgos, es importante que los algoritmos sean diseñados de forma neutral y objetiva, sin ninguna influencia externa. También es importante que se realicen pruebas de impacto para comprobar cómo afectan los algoritmos a las personas y a la sociedad en general. Actualmente, en el caso concreto del Google Translate, para una traducción como «the doctor» ya te ofrece ambas versiones, en masculino y femenino, como respuesta.

¿Es importante la ética en el desarrollo de una IA?

Definitivamente, la ética es un aspecto fundamental en el desarrollo de inteligencia artificial. Es importante que los algoritmos sean éticamente correctos y que respeten los derechos y la dignidad de las personas. De esta forma, se podrá garantizar que la inteligencia artificial será beneficiosa para todos y no tendrá consecuencias negativas, como las comentadas en el párrafo anterior.

Al final, como ocurre con toda nueva tecnología disruptiva, sí, hay que atender a las oportunidades, pero también a las amenazas que estas puedan generar. Como se le dijo a Spiderman: «Un gran poder conlleva una gran responsabilidad». Y esa responsabilidad requiere de unos buenos marcos éticos bien definidos en los que todos los actuales participantes del ecosistema de la IA aceptemos estar.

¿Podrías darnos el nombre de divulgadoras o investigadoras en IA que sirvan de inspiración para nuestras jóvenes lectoras?

Pues curiosamente, si hoy podemos estar hablando de Inteligencia Artificial, Machine Learning y Redes Neuronales en la forma en la que se hace, es gracias a una importante investigadora: Fei-fei Li. Como todo en la ciencia, el progreso de un campo de estudio no recae en una sola persona, sino en el trabajo que cientos de investigadores e investigadoras han ido desarrollando a lo largo de los años.

Pero sucede que, a principios de la década de 2010, todo lo que se había desarrollado en Inteligencia Artificial en las décadas anteriores generaba poco interés a nivel académico e industrial. La gran revolución moderna de la IA que estamos viviendo ahora tuvo su origen en una competición organizada por esta investigadora, quien junto a su equipo conformó un enorme conjunto de datos de imágenes y organizó una competición para que equipos de todo el mundo pudieran participar en la resolución de un problema: clasificar esas imágenes.

Fue en esa competición donde un equipo presentó una solución basada en Redes Neuronales y que pulverizó los resultados en comparación al resto de equipos. Ahí fue donde la industria y la academia volvió a interesarse por la Inteligencia Artificial y lo que nos lleva a que en solo diez años hayamos conseguido tantas cosas impresionantes.

Sin el papel de esta investigadora, creando esta competición y este enorme conjunto de datos, que aún a día de hoy juega un papel importantísimo en el desarrollo de nuevas inteligencias artificiales, no estaríamos donde estamos hoy.

Contar con estos referentes es importantísimo para que tanto lectores como lectoras se puedan ver reflejadas. En ese sentido invito también a vuestro público a conocer a Nerea Luis, doctora en Inteligencia Artificial, y cuya participación tanto en la industria como en la divulgación de la IA, la convierte en uno de los grandes referentes de este país.

¿Qué película o serie crees que aborda el tema de la inteligencia artificial de una forma más verosímil?

Pues sinceramente no tiendo a consumir mucha ciencia ficción sobre robots o Inteligencia Artificial por esto mismo, me cuesta encontrar buenos ejemplos que se aproximen a la realidad de este mundillo. Pero diría que Her, o su equivalente en la gran serie Black Mirror en su capítulo «Be Right Back», desarrollan un buen trabajo. La premisa de estas obras es que en un futuro no tan lejano, los asistentes de voz estarán tan avanzados que no será extraño relacionarnos emocionalmente con ellos a un mayor nivel. Y no se equivocaban.

No porque estas obras hayan realizado un análisis riguroso de las capacidades de los chatbots en el momento en el que desarrollaron sus guiones, ya que, por aquel entonces, los asistentes de voz funcionaban bastante mal. No, lo que ha sucedido es que en muy poco tiempo la IA ha avanzado tanto, que la ciencia ficción planteada en estas películas se aproxima más a ser sólo ciencia. Y actualmente contamos con asistentes de voz tan avanzados, que no tardaremos en ver ejemplos de relaciones entre humanos y máquinas cada vez más estrechos.

¿Qué te gusta hacer cuando no estás divulgando en tu canal?

Disfruto siendo consciente de que tengo tiempo libre. Al final el canal de YouTube es muy exigente, y al ser un proyecto donde los límites te los pones tú, es muy fácil acabar dedicándole más horas de las que debería.

Por eso, cuando logro encontrar un rato para quedar con mis amigos, leer, jugar a la consola, o sentarme un rato a estudiar y programar en el ordenador, los disfruto el doble siendo autoconsciente de que eso es tiempo de calidad.