Cómo media manzana se convierte en una manzana entera

Podcast con Stefan Sedlacek, Director General de TOLERANT Software

En una entrevista podcast, el Director General de TOLERANT Software, Stefan Sedlacek, reveló cómo funciona la búsqueda tolerante a fallos en las herramientas de calidad de datos y la tecnología que hay detrás. La entrevista fue realizada por Ashley Steele. Puede escuchar el podcast en alemán aquí.

Ashley Steele: TOLERANT Software: una empresa consolidada con una visión clara. Dirigirse a los clientes adecuados de la forma adecuada. El aseguramiento de la calidad de los datos de los clientes es la actividad principal de TOLERANT Software. El tema de la «inteligencia artificial» está de plena actualidad y se debate con frecuencia. Pero, ¿qué es exactamente la inteligencia artificial? ¿Qué tecnologías se utilizan? ¿Cuáles son las oportunidades y los riesgos? Stefan Sedlacek, Director General de TOLERANT Software, nos ofrece una visión actual de este tema e informa sobre cómo y desde cuándo utiliza TOLERANT Software la inteligencia artificial para resolver el problema de la calidad de los datos de los clientes.

Ashley Steele: Hola Stefan, ¿cómo estás hoy?

Stefan Sedlacek: Hola Ashley. Muchas gracias. Me va muy bien. Muchas gracias a ti.

Ashley Steele: Encantada de conocerle. Hoy hemos elegido un tema muy interesante.

Stefan Sedlacek: Sí, yo también lo creo.

Ashley Steele: Por un lado, el tema de la inteligencia artificial en general, como he dicho en la introducción. Está muy de actualidad. Se habla mucho de ello. Y por otro lado, TOLERANT Match, la calidad de los datos de los clientes y el uso de la inteligencia artificial en sus productos. Así que es un tema amplio y apasionante. Pero empecemos con el tema de la inteligencia artificial en general. ¿Cuáles son las motivaciones de la inteligencia artificial? ¿Qué está ocurriendo en la actualidad y a qué se debe el actual revuelo en torno a la inteligencia artificial?

Stefan Sedlacek: Sí, ¿qué motiva a las personas en el contexto de la IA? Es una buena pregunta. Creo que el tema sólo ha estado en la mente de la gente durante unos pocos años. El desarrollo existe desde hace mucho tiempo. Sin embargo, muy poca gente se interesó por él al principio porque los avances se produjeron inicialmente en el ámbito de la investigación y el mundo académico. En relativamente poco tiempo, digamos tres o cuatro años, las aplicaciones han salido del ámbito de la investigación y se han hecho accesibles a un público más amplio. Citaré como ejemplo DeepL. Creo que todo el mundo conoce esta herramienta de traducción. Ya ha causado bastante revuelo el hecho de que exista un motor de traducción que funciona mucho mejor que lo que Google ha puesto a disposición de los usuarios.

Ashley Steele: Y ChatGPT es la otra palabra de moda o aplicación que es relativamente nueva en el mercado y está siendo utilizada por un amplio público.

Stefan Sedlacek: Exacto. En el último año, más o menos, se han añadido aplicaciones aún más interesantes, como ChatGPT, como has mencionado. Una máquina que puede responder a preguntas como un humano. A la gente le pica la curiosidad. O generadores de imágenes que pueden crear imágenes artísticas a partir de un texto descriptivo. Ya no se necesita ninguna «habilidad» especial para crear imágenes bonitas. Con unas pocas palabras y conocimientos de IA se pueden conseguir resultados realmente fantásticos.

Ashley Steele: Es impresionante lo que se ve en esta zona.

Stefan Sedlacek: Sí, es impresionante. Y, por supuesto, ahora la gente se pregunta hasta dónde puede llegar esto. ¿Hasta qué punto puedo beneficiarme personalmente de ello? ¿Qué peligros entraña para mí y para mi entorno?

Ashley Steele: Sí, estaba a punto de preguntar eso. Por un lado, se trata de generar una imagen, por ejemplo una colina con flores y un caballo. Y eso se genera. O le das a ChatGPT un texto o un currículum y entonces se mejora. Son cosas que también benefician al consumidor medio (si se me permite la expresión). Este es exactamente el punto que ha mencionado. ¿Cuáles son los peligros de la inteligencia artificial? ¿Perderé mi trabajo? ¿Se producirá un cambio en el mercado laboral? ¿O existen otros peligros?

Stefan Sedlacek: Creo que en estos momentos todavía se están evaluando los riesgos. Hay bastantes teorías, especialmente sobre el tema de la pérdida de puestos de trabajo. Algunos estudios parten de la base de que el uso de la IA y la robótica puede automatizar muchas profesiones y que esto provocará una gran pérdida de empleo. Se puede criticar el hecho de que se trate principalmente de consideraciones teóricas. No significa necesariamente que vaya a haber realmente una pérdida de empleo como consecuencia del uso de una nueva herramienta. También puede significar que la nueva herramienta, es decir, la IA, permitirá hacer más trabajo en menos tiempo. Y más eficacia. El grado de eficiencia de la IA y el volumen de trabajo es indeterminado, lo que no significa que realmente tenga que haber una cantidad finita de trabajo. En este sentido, por lo que se refiere a la cuestión de la pérdida de puestos de trabajo, el peligro existe quizás en determinados ámbitos, pero no hay que exagerarlo.

Ashley Steele: Quizá se produzca un cambio, pero entonces también surge la pregunta: si nos alejamos de estos peligros, ¿qué oportunidades trae consigo la inteligencia artificial? ¿Qué cambios habrá?

Stefan Sedlacek: Sí, las oportunidades están, por supuesto, detrás de los nuevos campos de aplicación que pueden abrirse con la IA. Lo cierto es que el reconocimiento y la emisión de voz no funcionarían tan bien como lo hacen actualmente sin la tecnología de IA. Estamos ante un campo de aplicación totalmente nuevo. La IA me ayuda personalmente como artista o usuario a generar imágenes, sobre todo en el ámbito de la creación de prototipos, por ejemplo. Eso no existía hasta hace poco. La IA es una gran herramienta para producir resultados rápidamente y en poco tiempo. Por supuesto, también puedes generar más ventas si puedes trabajar más rápido.

Ashley Steele: Y eso también encaja en este tema general de la agilidad y la creación de prototipos y así sucesivamente. Probar cosas rápidamente. Obtener la opinión del cliente. Eso sin duda ayuda en esa área. Pero entonces tal vez una pregunta provocativa de mi parte. O dos preguntas. Conocemos nuestra forma de vida. ¿Puede la IA convertirse en una forma de vida? ¿Cómo de inteligente puede llegar a ser la IA? ¿Puede la IA ser más inteligente que nosotros los humanos? ¿Puede la IA pensar mejor? ¿Existe este peligro o no?

Stefan Sedlacek: Es una pregunta muy interesante. Si a veces leemos los titulares de los periódicos, también hay gente que advierte de que la IA podría convertirse en una forma de vida. Por el momento, yo diría simplemente que todo lo que va en esta dirección y todas las consideraciones que van en esta dirección son hasta cierto punto marketing. Incluso las declaraciones de los desarrolladores de que la IA puede ser peor que una bomba nuclear tienen que verse realmente como marketing, en mi opinión. La gente quiere decirnos que lo que han creado es tan grandilocuente que todo el mundo debería echarle un vistazo. Basándome en la tecnología actual, diría que una IA no puede evolucionar hasta convertirse en una forma de vida.

Ashley Steele: Así que no necesito tener miedo en este momento.

Stefan Sedlacek: No, no te preocupes. Una herramienta típica como ChatGPT siempre se activa desde el exterior hasta que produce un resultado. Por tanto, ChatGPT funciona de forma muy determinista y no es autorreflexivo. Por supuesto, ahora cabría plantearse si a un modelo lingüístico de este tipo habría que dotarlo también de funciones autorreflexivas para que se cuestione, amplíe y mejore a sí mismo. Probablemente esto ya se ha hecho hasta cierto punto, pero incluso tales funciones no insuflarían conciencia a una red neuronal como ChatGPT.

Ashley Steele: Permítame interrumpirle un momento. Ha mencionado un par de palabras de moda, como ChatGPT. Ha hablado de modelos lingüísticos. Y ha hablado de redes neuronales. Demos tres pasos atrás. ¿ChatGPT es una aplicación o una tecnología? Y si ChatGPT es una aplicación, ¿qué tecnologías hay detrás? Acaba de mencionar algunas palabras de moda. ¿Podría explicarnos un poco cómo funcionan los modelos lingüísticos y las redes neuronales desde un punto de vista tecnológico? Quizá utilizando el ejemplo de ChatGPT u otro ejemplo.

Stefan Sedlacek: Bien, ChatGPT es, por supuesto, una aplicación. No es una tecnología en sí misma. ChatGPT se basa en modelos lingüísticos acoplados a redes neuronales. Y ahora la pregunta: ¿qué es un modelo lingüístico? Un modelo lingüístico es, básicamente, un programa informático que entiende las preguntas naturales y puede generarlas por sí mismo. Se basa en un modelo estadístico que reconoce patrones en datos textuales y lingüísticos y los utiliza para evaluar los textos y predecir textos o datos lingüísticos futuros. Con este análisis de estos modelos lingüísticos, ChatGPT salta a sus redes neuronales preentrenadas. Ahora la pregunta: ¿Qué es una red neuronal?

Exactamente. Acabas de leerme la mente, Stefan. Exactamente. ¿Qué son las redes neuronales?

Stefan Sedlacek: También es un término de la informática, que se refiere a analizar bien grandes cantidades de datos no estructurados. De hecho, las redes neuronales son capaces de analizar volúmenes tan grandes y encontrar patrones en ellos. Los datos no estructurados típicos son imágenes, vídeos, sonidos, es decir, todos los datos que producimos en grandes cantidades en nuestra vida cotidiana. El término «redes neuronales» procede de la biología. Tenemos algo parecido en el cerebro humano, es decir, una neurona, una célula nerviosa que está conectada a otras células nerviosas y transmite señales a las otras neuronas o células nerviosas dependiendo de cómo estén conectadas. Una red neuronal artificial funciona de forma muy similar. Aquí hay una neurona simulada en forma de fórmula matemática que procesa una entrada y genera una salida al exterior. Muchas neuronas artificiales trabajan juntas para crear una red neuronal artificial. Se puede decir que un nodo de la red neuronal reacciona a un valor o a un estímulo que viene del exterior. A continuación, transmite un nuevo valor según una determinada regla de cálculo. Muchos de esos valores y nodos producen entonces un resultado global que, en última instancia, nos permite decidir si una imagen mostrada es una manzana o una pera.

Ashley Steele: Aha, vale, lo pillo. Has hecho un gran trabajo explicándolo. He entendido que hay algo más que un modelo lingüístico y algo más que una red neuronal. Pero también se trata de la memoria asociativa. Eso también juega un papel en la IA, si lo he entendido bien. ¿Qué es la memoria asociativa? ¿Es mejor? ¿Es peor? ¿Es otra cosa? ¿O son las tres cosas juntas? ¿Puede explicar un poco cómo se relacionan estos tres términos?

Stefan Sedlacek: Exacto, además de los temas tan manidos de las «redes neuronales» y los «modelos lingüísticos», hay otros métodos en el campo de la IA. Uno de ellos es la memoria asociativa. Funciona de forma algo más sencilla que una red neuronal. Una memoria asociativa es una memoria de contenido direccionable. En otras palabras, una forma de memoria que trabaja con asociaciones de contenido para acceder a contenidos individuales de la memoria. Otra forma de describirla sería decir que se accede a un contenido de memoria introduciendo un valor o una dirección de memoria. Esto es bastante informático, pero permítanme explicarles cuál es la ventaja. La ventaja de esta tecnología, tal y como se utiliza en el software TOLERANT, es que se puede acceder a los resultados incluso si los datos de entrada no están completos. Incluso si -siguiendo con el ejemplo de la manzana- sólo tuvieras media manzana, el sistema deduciría que detrás hay una manzana entera.

Ashley Steele: Bien, llevemos este ejemplo un poco más lejos usando TOLERANT Match. Si he entendido bien, TOLERANT Match utiliza una memoria asociativa.

Stefan Sedlacek: Así es. Exacto. La propia TOLERANT Match tiene como base tecnológica la memoria asociativa. Para nosotros, esta tecnología tiene un propósito ligeramente distinto al de las redes neuronales, por ejemplo. Cada tecnología tiene sus puntos fuertes para su ámbito de aplicación. La tecnología de la memoria asociativa, tal y como nosotros la utilizamos, se adapta muy bien a los datos estructurados.

Ashley Steele: Perdone, ¿puedo interrumpirle un momento? TOLERANT Match se refiere a la calidad de los datos de los clientes, de las direcciones… Por ejemplo: ¿Mi nombre se escribe A-S-H-L-E-Y o A-S-C-H-L-E-Y? Las grafías son parecidas, pero no iguales. Gracias al uso de la IA basada en la memoria asociativa, estas incoherencias, es decir, las coincidencias que no coinciden al 100%, se reconocen y luego se encuentran realmente. ¿Lo he entendido bien?

Stefan Sedlacek: Lo has explicado muy bien. Así es. El problema básico es siempre que se quiere encontrar la información correcta para una consulta a partir de un gran conjunto de datos. Se trata entonces de una subpregunta: «¿Cuál es la dirección correcta para una dirección buscada?». O: «¿Es una persona idéntica a una gran lista de políticos?». O: «¿Cuál es el nombre correcto del fabricante de un vehículo si alguien introduce ‘2007 BMW Serie 3 2 puertas’ en un formulario de Internet?». La tecnología de memoria asociativa accede entonces a grandes cantidades de datos estructurados en segundo plano y puede generar realmente la respuesta correcta a partir de estas consultas tan sencillas.

Ashley Steele: ¿Significa eso que los resultados son mejores con la tecnología TL Match AI? ¿Es mayor la probabilidad de que las consultas de los clientes se interpreten correctamente, incluso en caso de errores ortográficos, con TL Match?

Stefan Sedlacek: Así es.

Ashley Steele: Pero entonces una pregunta: ¿Cómo aprende un sistema de IA? ¿Cómo se puede comprobar si los resultados del sistema de IA son buenos o malos? ¿Cómo funciona el proceso de aprendizaje de un sistema de IA? ¿Qué proceso hay detrás? ¿Se puede estar realmente seguro de que los resultados proporcionados por TOLERANT Match son correctos?

Stefan Sedlacek: Muy buena pregunta. Los sistemas convencionales de IA con redes neuronales requieren un número relativamente elevado de sesiones de entrenamiento. Para ello, se presentan al sistema datos cuyo tipo y estructura ya se conocen. En principio, el resultado está predefinido. Esto permite al sistema aprender a procesar los datos. Si el sistema arroja resultados incorrectos, se ajusta la función de procesamiento en los nodos individuales mediante la retroalimentación adecuada.
Con TOLERANT Match, es un poco más sencillo. Sólo tenemos un paso de entrenamiento. Tomamos los datos que recibimos de forma estructurada y utilizamos una fórmula de cálculo matemático para descomponer la información que recibimos de forma que encaje en nuestra matriz de memoria asociativa. Aunque esto también es un paso de entrenamiento, sólo hay que realizarlo una vez. Con las redes neuronales, los tramos de entrenamiento son mucho más largos.
Entonces, ¿cómo se sabe si los resultados son buenos o no? En realidad, se
trata de un proyecto que todavía está en fase de investigación en informática. No se sabe exactamente porque las muchas secciones de entrenamiento de los sistemas de IA cambian los nodos de tal manera que los resultados no son predecibles ni comprensibles. Así que hay que probar el sistema. Tienes que estar seguro de que estas pruebas son tan precisas que, en última instancia, puedes decir que el sistema está configurado correctamente.

Ashley Steele: Así que esto sigue siendo un proceso continuo. Así que no se prueba una sola vez. Bueno, usted dijo al principio de la introducción que el bombo de la IA sólo ha existido durante 2-3 años. ¿Cuánto tiempo has estado utilizando la inteligencia artificial en TOLERANT Match? ¿También sólo durante los últimos 2-3 años? ¿Habíais hecho otra cosa antes y luego os habéis subido al carro de la IA? ¿Cómo lo hicieron?

Stefan Sedlacek: No, en realidad hemos tenido este tema en el radar durante mucho tiempo. Llevamos utilizándolo desde que se fundó la empresa, es decir, desde 2009.

Ashley Steele: ¿Desde 2009? Así que ustedes fueron pioneros en el uso de estas tecnologías aquí.

Stefan Sedlacek: Sí, por así decirlo. Tuvimos una empresa predecesora que hizo algo parecido. El tema nos vino impuesto. La primera vez que entré en contacto con el tema fue cuando se cambiaron los códigos postales en Alemania. De eso hace ya mucho tiempo. Fue en 1992/1993, cuando ya había muchos sistemas de direcciones y la pregunta era: «¿Cómo paso de un código postal de 4 dígitos a uno de 5?». Fue un cambio realmente duro para muchas empresas de la época. Por supuesto, mucho ha llovido desde entonces en términos de tecnología, pero entonces era una verdadera lucha. Y fue entonces cuando surgió este tema. Fue la primera vez que entré en contacto con él.

Ashley Steele: Si reflexiono un poco, es un tema muy complicado. Desde mi punto de vista, has hecho un buen trabajo explicando lo que hay detrás. Espero que el público lo vea de la misma manera. Lo que me ha parecido interesante al final es que no han esperado hasta 2020 para utilizar la tecnología, sino que llevan utilizando la IA desde el desarrollo de los productos TOLERANT Match y TOLERANT Move, es decir, desde 2009, como usted ha dicho. Realmente son pioneros en ese sentido. También creo -como pueden ver sus clientes- que fue una decisión acertada confiar en esa tecnología e integrarla en el software.

Stefan Sedlacek: Sí, también estamos muy orgullosos de ello.

Ashley Steele: Stefan, muchas gracias. Era un tema muy técnico y complicado. Pero lo has explicado muy bien y con claridad. Lo dejo aquí. Hasta dentro de unos días y hasta el próximo tema de TOLERANT del que podamos hablar.

Stefan Sedlacek: Gracias, Ashley, espero con impaciencia nuestro próximo tema.

Ashley Steele: Gracias, Stefan, todo lo mejor.

Stefan Sedlacek: Todo lo mejor, cuídate.