Thu. Jan 8th, 2026

Peter Wang es CEO y cofundador de la plataforma de ciencia de datos Anaconda. También es co-creador de la comunidad y conferencias PyData, y miembro de la junta del Center for Humane Technology.

Para 2025, se crearán 463 exabytes de datos cada día, según algunas estimaciones. (En perspectiva, un exabyte de almacenamiento podría contener 50.000 años de video con calidad de DVD). Ahora es más fácil que nunca traducir acciones físicas y digitales en datos, y las empresas de todo tipo se han apresurado a acumular la mayor cantidad de datos posible con el fin de obtener una ventaja competitiva.
Sin embargo, en nuestro encaprichamiento colectivo por los datos (y por obtener más de ellos), lo que a menudo se pasa por alto es el papel que juega la narración en la extracción de valor real de los datos.
La realidad es que los datos por sí mismos no son suficientes para influir realmente en el comportamiento humano. Ya sea que el objetivo sea mejorar los resultados de una empresa o convencer a las personas de que se queden en casa en medio de una pandemia, es la narrativa lo que impulsa a la acción, en lugar de los números únicamente. A medida que se recopilen y analicen más datos, la comunicación y la narración se volverán aún más integrales en la disciplina de la ciencia de datos debido a su papel en la separación de la señal del ruido.

Los datos por sí solos no estimulan la innovación; más bien, son la narración basada en datos que ayuda a descubrir tendencias ocultas, potencia la personalización y agiliza los procesos.

Sin embargo, esta puede ser un área donde los científicos de datos luchan. En la encuesta sobre el estado de la ciencia de datos de 2020 de Anaconda a más de 2,300 científicos de datos, casi una cuarta parte de los encuestados dijo que sus equipos de ciencia de datos o aprendizaje automático (ML) carecían de habilidades de comunicación. Esta puede ser una de las razones por las que aproximadamente el 40% de los encuestados dijeron que pudieron demostrar de manera efectiva el impacto comercial "solo a veces" o "casi nunca".
Los mejores profesionales de los datos deben ser tan hábiles en la narración como en la codificación y la implementación de modelos, y sí, esto se extiende más allá de la creación de visualizaciones para acompañar los informes. Aquí hay algunas recomendaciones sobre cómo los científicos de datos pueden situar sus resultados dentro de narrativas contextuales más amplias.

Haz que lo abstracto sea más tangible

Los conjuntos de datos en constante crecimiento ayudan a los modelos de aprendizaje automático a comprender mejor el alcance de un espacio de problemas, pero más datos no necesariamente ayudan a la comprensión humana. Incluso para los pensadores más izquierdistas del cerebro, no está en nuestra naturaleza comprender grandes números abstractos o cosas como mejoras marginales en la precisión. Por eso es importante incluir puntos de referencia en su narración que hagan que los datos sean tangibles.
Por ejemplo, a lo largo de la pandemia, nos han bombardeado con innumerables estadísticas sobre recuentos de casos, tasas de mortalidad, tasas de positividad y más. Si bien todos estos datos son importantes, las herramientas como los mapas interactivos y las conversaciones sobre números de reproducción son más efectivas que los volcados de datos masivos en términos de proporcionar contexto, transmitir riesgos y, en consecuencia, ayudar a cambiar comportamientos según sea necesario. Al trabajar con números, los profesionales de los datos tienen la responsabilidad de proporcionar la estructura necesaria para que la audiencia destinataria pueda entender los datos.

By Maria Montero

Me apasiona la fotografía y la tecnología que nos permite hacer todo lo que siempre soñamos. Soñadora y luchadora. Actualmente residiendo en Madrid.