Borges, big data y yo
eBook - ePub

Borges, big data y yo

Guía nerd (y un poco rea) para perderse en el laberinto borgeano

Walter Sosa Escudero

Compartir libro
  1. 176 páginas
  2. Spanish
  3. ePUB (apto para móviles)
  4. Disponible en iOS y Android
eBook - ePub

Borges, big data y yo

Guía nerd (y un poco rea) para perderse en el laberinto borgeano

Walter Sosa Escudero

Detalles del libro
Vista previa del libro
Índice
Citas

Información del libro

Ya se dijo todo sobre Borges. ¿Ya se dijo todo sobre Borges? Pues no. A su obra vasta y generosa no se accede por una sola puerta de entrada, sino por una infinidad de ventanas, pasadizos y claraboyas hacia un universo que, una vez conocido, ya no se puede ni se quiere abandonar. En este libro fascinante y adictivo, Walter Sosa Escudero propone una de esas entradas: la ciencia de datos. En efecto, los números, infinitos, mapas, algoritmos, chances y corazonadas, ficciones y realidades están tan presentes en la obra de Borges como en la práctica estadística y el uso hoy omnipresente de big data. De la mano de un relato cómplice –en el que la admiración no impide el "juego" con la obra–, los datos y algoritmos se revelan como guías privilegiados para descubrir a un Borges humano, complejo pero accesible, siempre desafiante.Literatura, ciencia, poesía, estadística y computación se entrelazan y se bifurcan en estas páginas para iluminar nuestro tiempo de manera particularmente apropiada: en medio de la revolución de big data y algoritmos, ciertos fenómenos cruciales siguen siendo esquivos a la predicción. Son esas incertidumbres y azares los que la obra de Borges –el escritor que científicas y científicos idolatran sin grietas– nos ayuda a entender (e incluso, a veces, a disfrutar).Entre su propia experiencia como lector (y sobre todo re-lector) de la obra borgeana, y el conocimiento más actualizado sobre datos y estadística, Sosa Escudero tiende un puente irresistible, tan apto para que transiten por él los recién llegados como quienes buscan una mirada renovada sobre una obra que conocen bien. Encontrarán aquí referencias a sus cuentos más celebrados pero también fragmentos del Borges poeta, ensayista y gran conversador, consejos para armar o completar una biblioteca borgeana y sugerencias para encarar primeras, segundas y terceras lecturas. Prepárense para una travesía asombrosa y larga, quizás infinita.

Preguntas frecuentes

¿Cómo cancelo mi suscripción?
Simplemente, dirígete a la sección ajustes de la cuenta y haz clic en «Cancelar suscripción». Así de sencillo. Después de cancelar tu suscripción, esta permanecerá activa el tiempo restante que hayas pagado. Obtén más información aquí.
¿Cómo descargo los libros?
Por el momento, todos nuestros libros ePub adaptables a dispositivos móviles se pueden descargar a través de la aplicación. La mayor parte de nuestros PDF también se puede descargar y ya estamos trabajando para que el resto también sea descargable. Obtén más información aquí.
¿En qué se diferencian los planes de precios?
Ambos planes te permiten acceder por completo a la biblioteca y a todas las funciones de Perlego. Las únicas diferencias son el precio y el período de suscripción: con el plan anual ahorrarás en torno a un 30 % en comparación con 12 meses de un plan mensual.
¿Qué es Perlego?
Somos un servicio de suscripción de libros de texto en línea que te permite acceder a toda una biblioteca en línea por menos de lo que cuesta un libro al mes. Con más de un millón de libros sobre más de 1000 categorías, ¡tenemos todo lo que necesitas! Obtén más información aquí.
¿Perlego ofrece la función de texto a voz?
Busca el símbolo de lectura en voz alta en tu próximo libro para ver si puedes escucharlo. La herramienta de lectura en voz alta lee el texto en voz alta por ti, resaltando el texto a medida que se lee. Puedes pausarla, acelerarla y ralentizarla. Obtén más información aquí.
¿Es Borges, big data y yo un PDF/ePUB en línea?
Sí, puedes acceder a Borges, big data y yo de Walter Sosa Escudero en formato PDF o ePUB, así como a otros libros populares de Matemáticas y Probabilidad y estadística. Tenemos más de un millón de libros disponibles en nuestro catálogo para que explores.

Información

Año
2020
ISBN
9789878010441
Edición
1
Categoría
Matemáticas
1. Borges y la kryptonita de la ciencia de datos
“Funes el memorioso”, “Del rigor en la ciencia”
“Una idea, un paper, dos ideas, dos papers”, me dijo una vez Rolf Mantel, uno de mis mentores. “Paper” es la forma rápida de llamar a un artículo científico de investigación, de pocas páginas y contenido directo. Un error de investigador novato es atiborrar al lector con varias ideas que compiten entre sí, cuando posiblemente lo mejor sea separarlas en distintos escritos. Y como esta es nuestra primera incursión en el universo de Borges y los datos, les propongo una suerte de danza iniciática alrededor de una sola idea, central en el mundo de la estadística y en el de Borges: la tensión entre la realidad y sus representaciones. ¿Y qué implica ese tema, esa danza? El gran desafío del “análisis de datos” no es dar cuenta de los datos sino de lo que los datos quieren decir; los datos son meras manifestaciones de las verdades que los generan. Es decir, si en la radio dicen “son las 10.15 hs y la temperatura es de 23 ºC”, cualquier mortal intenta entender qué quiere decir ese dato, qué pretende implicar, para decidir cómo vestirse o si pintar una pared al aire libre. Lo mismo ocurre con las cifras de pobreza o de la cantidad de infectados durante la pandemia de Covid-19: el desafío está en lo que los datos significan, más allá de ellos mismos.
En esta primera incursión en el universo de Jorge Luis Borges exploraremos “Funes el memorioso” y “Del rigor en la ciencia”, dos relatos centrales de su obra. Como dijimos en la Introducción, Funes es un muchacho con una memoria prodigiosa pero incapaz de “ver” a través de los datos: para Funes los datos son tanto un punto de partida como de llegada y, por consiguiente, él es algo así como la negación misma de la estadística y de la ciencia, que pretenden ir de los datos a lo que estos quieren significar. Para Funes los datos son tan solo datos, que no implican ni son implicados por nada. Amigos de Funes parecen ser los cartógrafos de “Del rigor en la ciencia” que, en búsqueda de la perfección, puestos a hacer un mapa de un imperio terminan haciendo uno ¡del mismo tamaño que el imperio! Un mapa tan preciso como inútil.
Entonces, empezamos de modo simple. Estos dos relatos cumplirán el doble propósito de meternos en el universo de Borges y en el de los datos. Ya más en confianza, en los próximos capítulos abriremos el abanico de ideas y de relatos de Borges. Todo a su tiempo.
Funes es big data sin estadística
Nosotros, de un vistazo, percibimos tres copas en una mesa; Funes, todos los vástagos y racimos y frutos que comprende una parra. Sabía las formas de las nubes australes del amanecer del treinta de abril de mil ochocientos ochenta y dos y podía compararlas en el recuerdo con las vetas de un libro en pasta española que solo había mirado una vez y con las líneas de la espuma que un remo levantó en el Río Negro la víspera de la acción del Quebracho.
Como ya hemos mencionado, Ireneo Funes es el protagonista de “Funes el memorioso”, un cuento central en la obra de Borges. Poseedor de una memoria prodigiosa, Funes podía (y quería) recordar detalles insignificantes para cualquier otro mortal, tanto que reproducir los eventos de un día le tomaba… ¡veinticuatro horas! Lo llamativo en Funes es su capacidad para recordar detalles pero también su necesidad de hacerlo, y su postura terca y escéptica ante cualquier intento de abstracción. Funes opina que “pensar es olvidar diferencias, es generalizar, abstraer”. Sigue Borges: “En el abarrotado mundo de Funes no había sino detalles, casi inmediatos”.
El siguiente ejemplo ilustra la reticencia de Funes a la abstracción y da una contundente muestra del finísimo humor de Borges, que repetidas veces encontraremos en este libro y del que ya les advertí en la Introducción:
En lugar de siete mil trece, decía (por ejemplo) Máximo Pérez; en lugar de siete mil catorce, El Ferrocarril; otros números eran Luis Melián Lafinur, Olimar, azufre, los bastos, la ballena, el gas, la caldera, Napoleón, Agustín de Vedia. En lugar de quinientos, decía nueve. […] Yo traté de explicarle que esa rapsodia de voces inconexas era precisamente lo contrario de un sistema de numeración. Le dije que decir 365 era decir tres centenas, seis decenas, cinco unidades: análisis que no existe en los “números” El Negro Timoteo o manta de carne.
La necesidad de lidiar con datos es tan vieja como la información y las sociedades y, en consecuencia, tanto lo es la estadística. Pero en el siglo XX es cuando alcanza su mayoría de edad, de la mano de Ronald Fisher, uno de sus padres fundadores. La opinión pública y la economía en las disciplinas sociales, y la experimentación en las ciencias naturales, avanzan rápidamente al finalizar la Segunda Guerra Mundial, y en la década de 1950 se afianza la estadística como disciplina científica. Los enormes progresos tecnológicos que bajan los costos de recolección y procesamiento de datos, el surgimiento de la computación personal y, en nuestros días, la internet, tuvieron un fuerte impacto en esa trayectoria. Así y todo, la estadística como ciencia ha vivido aislada, a un costado de la matemática, valiéndose de los avances computacionales e interactuando con las disciplinas que la utilizan más enfáticamente, como la biología, la psicología, la economía, la agronomía o la meteorología.
Pero en los últimos años las cosas han cambiado radicalmente, producto de las interacciones electrónicas que dejan “huellas digitales” que pueden ser usadas como datos. A modo de ejemplo, escribo este capítulo en un bonito café de Buenos Aires en mi computadora personal conectada a internet. Sin que yo haga nada, el “gran hermano” se dio cuenta de dónde estoy, y, a través de las redes sociales a las cuales pertenezco, está enviando información sobre mi edad, ubicación geográfica, gustos musicales y otros hábitos. Datos, datos y más datos.
“Big data” es la designación, cada vez más usual, para esta profusión de datos generados por dispositivos interconectados, como las computadoras, los teléfonos celulares, la tecnología de localización geográfica (GPS), las tarjetas de crédito o cualquier cosa que por su operatoria tenga que interactuar electrónicamente con otra.
Esta “piñata de datos” excede el continente de la estadística, que, en relación con los datos mismos, y abusando de la imagen anterior, parece un párvulo que con un cucharón intenta atrapar los cientos de caramelos que caen del techo. Así, la computación, la matemática, la comunicación, la ingeniería, el diseño y muchas otras disciplinas se disputan el dominio de big data, como niñitos en un cumpleaños, desesperados y agitados debajo de la lluvia de golosinas.
Pero a la larga, el enorme desafío de la estadística es uno de “señal y ruido”, en el cual más datos son la mejor opción solo si contribuyen a mejorar la calidad de la señal y no a aumentar el barullo. Un día, Daniel Heymann, mi entrañable profesor de macroeconomía, en el medio de una considerable crisis económica me dijo: “’Cuchame, pibe, ¿te imaginás el quilombo que se armaría si hubiese una medición diaria del PBI?” (“’cuchame”, y no “escuchame”, era la señal que anticipaba la irrupción de una de las máximas épicas por las que Heymann, un sabio, es admirado por todos los economistas). En casi todos los países, el PBI se mide una vez al año, porque es costosísimo hacerlo y porque lo que se pretende medir se mueve con relativa lentitud. Si en la Argentina cada vez que se publica ese indicador se arma un escándalo mediático de proporciones, cuesta imaginar qué sucedería si se pudiese monitorear en tiempo real, como si fuese la cotización del dólar o la temperatura de una ciudad. La cuestión, entonces, es que lo que se pretende del PBI es que sea un resumen confiable y estable, a lo cual los movimientos de cortísimo plazo solo agregan ruido. En el mismo sentido, a las personas hipertensas les recomiendan que se midan la presión arterial con cierta frecuencia (tal vez diaria) y no cada cinco minutos, o a las personas sanas se les pide un análisis de sangre anual.
Y en este contexto, el vendaval de datos de big data es una buena noticia solo si contribuye a mejorar la señal sin aumentar el ruido, o si es capaz de proveer información útil allí donde antes había solo silencio y oscuridad. En definitiva, las ventajas de big data no vienen de la masividad de datos per se sino de que se los observe a través de alguna tecnología o modelo que permita usarlos y notar si es cierto que contribuyen más al orden que al caos.
“Big data es Funes sin estadística”, escribió Stephen Stigler –profesor de la Universidad de Chicago, y máxima autoridad en la historia de la materia–, en un reciente libro titulado Los siete pilares de la sabiduría estadística. La frase, casi un tuit, tuvo un impacto inmediato y causó una enorme polémica en la profesión.
Puesta en contexto, la frase de Stigler tiene un mensaje claro, escéptico y socarrón en relación con big data: a contramano de la postura de Funes, los datos en sí mismos no tienen entidad y su masividad se traducirá en una mejora solo a través de algún tipo de procesamiento que, como anticipamos, pueda ver más allá de ellos. Stigler relativiza el fenómeno de big data y lo subsume a la estadística, actitud esperable de quien milita en una disciplina histórica, que ve amenazada su hegemonía sobre el análisis de datos.
Ni lerdo ni perezoso, y a raíz de los dichos de Stigler, Xiao Li Meng, director del departamento de Estadística de la Universidad de Harvard (quizás el más prestigioso del mundo), dictó un curso cuyo título es, precisamente, “Ireneo Funes y Big Data”, para revisar las relaciones existentes entre el personaje de Borges, el reciente libro de Stigler y el análisis de datos. El programa del curso es fascinante, ya que invita a la discusión tanto técnica como filosófica del fenómeno de big data en la sociedad. A contramano de las propuestas de éxito cortoplacista de algunas sospechosas instituciones educativas (muchas de ellas en el ámbito de ciencia de datos), ese programa de Meng dice que “este curso está destinado a aquellos alumnos cuya felicidad pasa por entender los fundamentos filosóficos del razonamiento bajo incertidumbre”, promesa que habría hecho huir despavorido al Funes de Borges, suspicaz de las elucubraciones de todo tipo.
¡Mamá, mamá, mi promedio armónico es 5,8065!
“¿Qué hora son, Ireneo?”, pregunta Bernardo, primo del narrador, en el cuento. “Faltan cuatro minutos para las ocho”, responde “el cronométrico Funes” sin consultar reloj alguno, provocando el asombro de Borges. Habilidad característica de este pobre muchacho (en el momento del relato tiene unos 20 años), capaz de percibir detalles ínfimos donde el resto de los mortales solo ve trazos gruesos.
Una circunferencia en un pizarrón, un triángulo rectángulo, un rombo, son formas que podemos intuir plenamente; lo mismo le pasaba a Ireneo con las aborrascadas crines de un potro, con una punta de ganado en una cuchilla, con el fuego cambiante y con la innumerable ceniza, con las muchas caras de un muerto en un largo velorio.
Hay dos rasgos llamativos en la actitud de Funes. El primero es la capacidad de medir el tiempo sin reloj y con precisión asombrosa. Y el segundo es la necesidad de comunicarlo con exactitud similar. Aun munido de un reloj con agujas –como los que circulaban allá por 1887, el año del relato–, cualquiera de nosotros habría redondeado a “las ocho menos cinco”; sin embargo, y sin reloj, Funes elige decir la hora con una precisión de minutos. Pero si bien sorprendente, llama la atención que la precisión del joven “cronométrico” no parece infinita ni bastante menos, por lo menos si nos avenimos a las puntillosas descripciones de Borges en el cuento.
El tiempo transcurre en forma continua, de modo que la precisión de un reloj podría ser infinitamente pequeña, al menos en teoría. En 2005, un poco más de cien años después de los eventos que involucran a Funes y Borges, la reconocida empresa Tag Heuer lanzó con bombos y platillos el modelo de reloj pulsera más preciso de su historia, el “Calibre 360”, que permite monitorear el tiempo con una precisión de una centésima de segundo, muy lejos del “Chaque heure pour la minorie”, el pretencioso reloj sobre el que bromeaba Les Luthiers. De acuerdo con el genial grupo humorístico-musical argentino, ese “¡flor de relós!” venía “para la dama y el caballero, / con minutero y con segundero” y garantizaba el ascenso social y las conquistas amatorias. Ahora bien, nuestro Funes no consulta ningún reloj, de modo que es una incógnita si puede percibir el tiempo con precisión de minutos o más finamente. Puede que sea cierto que el memorioso perciba el tiempo en forma continua (acorde a sus asombrosas habilidades), pero elige comunicarlo en forma discreta (en minutos), aviniéndose a una convención social, lo cual requiere un mínimo ejercicio de abstracción (un redondeo), actividad de la cual reniega manifiestamente. O tal vez su grado de precisión no es infinito, y su percepción del tiempo en minutos y sin un reloj, aun sorprendente, solo lo deja un poco más allá de lo que podría hacer cualquier persona, pero lejos de la performance del “Calibre 360”.
En definitiva, no queda claro cuánto es que Funes no abstrae porque no quiere o porque no puede. El propio Borges (un Borges de 1887, antes de su nacimiento) parece acusar esta duda cuando dice “Funes no me entendió o no quiso entenderme”, luego de explicarle el disparate implícito en el extraño sistema de numeración antes referido, en el cual a cada entero Funes le asigna un nombre (“la ballena”, por ejemplo) sin relación alguna con las “unidades, decenas, centenas, etc.” con las que se machaca a los niños en la primaria.
Las convenciones o redondeos a los que Funes se avino (o que no pudo evitar) son parte fundamental de la estadística y de cualquier disciplina que maneje o comunique datos y, si vamos al caso, del conocimiento científico y la vida misma. A modo de ejemplo, las calificaciones de la escuela se enuncian en promedios, entendidos como resúmenes representativos de una realidad compleja. Si las notas de Agostina en un semestre fueron 4, 6 y 10, el promedio es 6,666, que quizás algún profesor de alma caritativa redondee y lleve a 7, eximiéndola de exámenes recuperatorios, porque la regla es que se aprueba con 7 de, precisamente, promedio. Ante la duda, las discusiones entre alumnos, padres y profesores parecen enfocarse en el criterio para el redondeo (para arriba, para abajo). Pero llama la atención que todos aceptan ciegamente el uso del promedio, que no es el único resumen del “centro” de los datos. La mediana, por ejemplo, es el valor que parte a los datos por la mitad, vale decir, el que deja por arriba y por debajo la misma cantidad de observaciones. Y como el lector astuto habrá notado, en el caso de Agostina da 6, condenándola a dar un examen recuperatorio, sin lugar a redondeos.
El promedio y la mediana son solo dos de los muchísimos métodos usados en estadística para reflejar el “centro” de los datos. A cualquier estudiante de estadística le hablaron de la moda, de los medias armónicas o geométricas, de los promedios ponderados o de las medias podadas; nuevamente, unos pocos ejemplos de los tantos que existen para resumir datos. La elección del promedio no es casual, y explican su popularidad tanto sus propiedades matemáticas como su facilidad de cómputo y el hecho de que todo el mundo parece entenderlo.
Entonces, el servicio de la estadística consiste en aportar no solo fórmulas o algoritmos sino también consensos para facilitar la vida cotidiana. Si Agostina llegase a su casa diciendo “la media armónica de mis notas es 5,8065: tengo que dar recuperatorio”, muy posiblemente la discusión pase del 5,8065 a “qué cuernos es la media armónica y por qué el profesor la usa para evaluarte”.
Un ejemplo más realista y contundente acerca de la necesidad de adoptar convenciones se refiere al problema de la medición de la pobreza. No existe ninguna forma obvia de medir la pobreza de un país, quizás como reflejo de lo elusivo que resulta definir qué significa que una persona sea pobre, noción que involucra aspectos económicos, sociales, psicológicos, biológicos y culturales, entre muchos otros. En definitiva, cualquier medición de la pobreza no deja de ser una consecuencia de lo que antes se acuerde acerca de qué es ser pobre. Un trabajo de Miguel Székely y Nora Lustig muestra que aun restringiendo la noción de ser pobre a tener bajos ingresos (una simplificación grosera), solo sobre la base de alterar definiciones y estándares de cómo medir el ingreso, existen unas 6000 formas de medir la pobreza. Así, munidos de los mismos datos, distintos analistas podrían discrepar en sus mediciones de pobreza, por el simple hecho de haber adoptado metodologías distintas.
Tal como habría hecho nuestro Ireneo Funes, Székely y Lustig procedieron a computar todas las medidas de pobreza posibles. Los resultados son sorprendentes y decepcionantes: aun con los mismos datos, las mediciones alternativas en América Latina en los años noventa dan que hay entre un 12,7% y un 65,8% de hogares pobres. Con eso, un monumental ejercicio estadístico dice que, si dejásemos hablar a todas las medidas de pobreza, no agregarían mucho de decisivo a la afirmación “la tasa de pobreza ronda entre el 0 y el 100%”, tontera que sabíamos sin apelar a ningún dato.
La única forma operativa de resolver este problema es adoptar ...

Índice