SAP HANA Data Management: ¿qué es esto?

Siguiendo con lo que comentaba ayer sobre cosas interesantes que presentaron en el SAPPHIRE NOW, hoy voy a intentar explicar lo que yo he entendido sobre esto del SAP HANA Data Management.

Probablemente, habréis oído más de una vez lo de que “se han generado más datos en los 2 últimos años que desde el inicio de la humanidad“… y lo mejor es que esta frase la llevamos oyendo ya unos años, con lo que parece que esto no tiene límites.

Dentro de un par de años, habrá que cambiar la frase por esta: “se han generados más datos en los últimos 5 minutos que desde el inicio de la humanidad”. O lo mismo se duplican los datos antes de que le dé tiempo a terminar la frase al ponente de turno… 😉

Perfecto, a todos nos queda claro que generamos muchos datos, pero… lo que no está tan claro es qué hacer con ellos. Es decir, ¿cómo darle inteligencia a esos datos? Y aquí es donde aparecen términos como Big Data, Machine Learning, etc… que por sí solos no hacen nada, ya que muchas veces el problema viene de base: en el Small Data.

¿Cómo vamos a hablar de algoritmos predictivos y mejora en la toma de decisiones, con herramientas que pueden manejar esos ingentes volúmenes de información, analizarla y aprender de ella, si la información de partida no es buena?

Vamos, que antes de pensar en Big Data, muchos tienen que reflexionar un poco en cómo tienen el Small Data y qué beneficios pueden obtener con la explotación de esa información, que lo mismo no tiene sentido almacenarlo todo… ¿o realmente crees que esas “tarrinas” de CDs que tienes en la estantería las vas a volver a utilizar alguna vez? 😉

Depurar la información y saber qué utilidad puede tener para mi modelo de negocio,  serán fases de la metodología CRISP-DM, que podríamos decir que es la estándar en un proceso de análisis de datos.

¿Que esto de CRISP-DM te suena a chino? Pues mírate este curso de openSAPGetting Started with Data Science

Vale, ya te has aclarado con lo anterior, sigamos.

¿Qué es realmente SAP HANA Data Management? Pues un conjunto de servicios/herramientas que me permiten gestionar mis datos de manera centralizada.

Como veis, hay un poco de todo: Cloud Platform, Data Hub, Big Data, HANA… con el objetivo de aseguraros que trabajamos con el concepto de “dato único” (¿pero esto no se supone que lo llevamos haciendo ya años?), con almacenamiento infinito (la elasticidad del cloud es lo que tiene), aprovechando todas las bondades de HANA (tiempo real, análisis predictivo, características geoespaciales…) y pudiendo utilizar herramientas open source del tipo TensorFlow, Spark, Python

Todo muy claro, ¿no? 😉

Si necesitas aclarar algo, te aconsejo que te apuntes a este curso de openSAP que empieza el 31 de julio: SAP HANA Data Management Suite – Strategy Talk

¿O me vas a decir que es mejor plan estar todo el día tirado al sol sin hacer nada mirando el mar? 😉

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.