Las tres uves
Cuando hablamos de lo que caracteriza a Big Data, hablamos de lo que le es propio, no de lo que es común a otras tecnologías. Así, Big Data responde a tres uves:
– Volumen: gran cantidad de datos.
– Variedad: diversas fuentes de datos, muchos de ellos no estructurados.
– Velocidad: necesidad de extraer información de los datos en tiempo casi real.
Un proyecto no es totalmente Big Data o nada Big Data; puede serlo más o menos, en función de la importancia que tengan las tres uves citadas. El Business Intelligence tradicional no tiene capacidad para responder a esas tres necesidades.
Las seis, siete o n uves
En cuanto a las otras tres o cuatro uves, la literatura no se pone de acuerdo. He oído hablar de:
– Validez: los datos deben ser fiables y adecuados al uso que de ellos se va a hacer.
– Veracidad: los resultados de las predicciones deben corresponder con la realidad
– Volatilidad: ha que decidir durante cuánto tiempo queremos conservar los datos
– Variabilidad: el sentido que damos a los datos puede cambiar con el tiempo
– Visualización: los datos deben ser presentados de una manera que facilite su comprensión: gráficos, tablas etc.
– Vulnerabilidad: hay que evitarla
– Valor: es lo que la organización quiere obtener
Todas esas uves, que son importantes en Big Data, lo eran también en Business Intelligence; no son diferenciales de Big Data.
De hecho, son importantes en casi todas las actividades del ser humano.
A una cafetería le interesa la validez de la mercancía de entrada, que el café que sirva sea el café esperado, debe ocuparse del tiempo durante el cual conservará la mercancía (en este caso de entrada), quizás no le importe tanto la visualización, pero sí la vulnerabilidad y el valor.
Pero es que además, algunas de estas uves no me parecen adecuadas. La validez y la veracidad son deseables, pero cuando no se consiguen, no se abandona el proyecto. Pongamos un ejemplo muy sencillo. Este fin de semana queremos ir a hacer senderismo. ¿Hará buen tiempo? Nuestra experiencia nos dice que en esta época del año suele hacer bueno, así que decidimos ir. ¿Son válidos nuestros datos? Si nuestra memoria es impecable, sí. Pero probablemente sea parcial. Aun así, con la poca fiabilidad de los datos, tiene sentido ir. Supongamos que consultamos la previsión meteorológica, que nos confirma que hará bueno, así que vamos. Puede que la previsión no sea correcta. No tenemos garantías sobre la veracidad de la previsión. Sin embrago, parece razonable ir.
Traslademos este ejemplo a una organización con o sin ánimo de lucro. En algún momento tiene que tomar una decisión. Lo normal es que la tome a partir de los datos que tiene. Si aplica modelos de predicción a sus datos, tiene un riesgo de error. ¿Va a dejar de tomar una decisión porque no tiene seguridad de que todos los datos son buenos?
¿Cuántas decisiones tomamos en nuestra vida personal sin tener todos los datos, incluso a partir de datos erróneos? ¿O es que nos vamos a quedar parados hasta que tengamos toda la información certificada?
Conclusión
El ejercicio de buscar en el diccionario todas las palabras que empiecen con uve, para asociarlas a Big Data, me parece algo muy forzado. He oído hablar hasta de ¡las 42 uves! Puestos a uverizar, después de haber uberizado, ¿por qué no decir del Big Data que en cuanto a datos es un vulgar vertedero, que proporciona información velazqueña y volteriana, que en su consumo de tiempo es vicioso, voraz, vulpino y vampiro, y cuyo datos finales son vuduistas y vagabundos? Corremos el riesgo de que alguien diga de Big Data: vamosanda. Por cierto, en este artículo ya hablábamos del “abuso” del término Big Data en 2013.
Por último, los no anglófonos tienen que cargar con las distorsiones de las traducciones. La llamada volatilidad no se entiende hasta que se lee su definición. En realidad, se refiere a la vida de los datos, sobre la que podemos decidir. Por definición, sobre la volatilidad no tenemos influencia. Pero como en inglés “life” no empieza con uve, ha habido que acudir al diccionario. Y en español, en lugar de dejarlo como vida, nos hemos quedado con la palabra a la que han tenido que acudir los anglófonos.
No me cabe duda de que si no fuese porque en inglés la be y la uve no se pronuncian igual, estaríamos hablando de Vig Data.