Contenido Principal
Santander Río

Big Data: introducción a la inteligencia de negocios

Online Banking

Antes de las redes sociales, la gente se valía de encuestas y estudios de opinión para conocer el impacto de sus productos o servicios. Hoy en día, alcanza con saber qué es “Big Data” y cuáles son las herramientas para analizar la creciente cantidad de información.

Si uno piensa en dos o tres generaciones atrás, mucho ha cambiado en los negocios. En esa época, casi no conocíamos nuestro entorno y había que analizar “a nuestro criterio” qué tipo de publicidad debíamos hacer para tener más impacto. Si podíamos pagarla, teníamos una agencia con personal experimentado que nos sugería la mejor estrategia para masificar nuestros productos o servicios.

En el siglo XXI, las redes sociales son un medio de comunicación masivo de alcance prácticamente ilimitado y, en primera instancia, hasta gratuito. En los perfiles de la gente que vemos tenemos información geográfica, su edad, gustos, relaciones y hasta lugares donde han estado, todo compartido de manera voluntaria y sin ningún tipo de filtro. Pero como la cantidad de información es cada vez mayor y su análisis cada vez más complejo, se desarrollaron herramientas cuyo nombre genérico es “Big Data” para facilitar su procesamiento.

¿Qué es “Big Data”?

Es un conjunto de herramientas que pone al alcance del público en general el análisis de grandes volúmenes de datos. Y cuando decimos “grandes” hablamos de millones de datos, con interacciones entre sí, que permiten ver tendencias como: ¿qué tipo de cliente nos compra más, de acuerdo a edad, acceso a crédito, ubicación geográfica, gustos en general? ¿Qué producto sale más en cierta época del año? ¿Cuál es la estrategia de acercamiento más efectiva a nuestro público objetivo?

¿Cuándo usar “Big Data”?

Esta pregunta es vital. Durante años los analistas solo se enfocaban en lo que parecía más importante y dejaban fuera muchos datos que, compilados y analizados correctamente, daban como resultado perfiles de consumidores mucho más precisos y nos ayudaban al crecimiento del negocio.

Pero la información es cada vez mayor, más compleja y llega más rápido. Y para mejorar la eficiencia de nuestro negocio deberíamos dejar de analizar solamente una parte de los datos y empezar a analizarlos TODOS. Si esa es la intención, entonces es el momento de empezar a considerar herramientas como el entorno Hadoop, que no tiene altos requerimientos de hardware y puede instalarse en equipos que la mayoría de las empresas ya posee.

¿Puedo hacerlo solo?

Podríamos considerar a las herramientas de Big Data como una evolución natural de las planillas de cálculo y bases de datos con las que contábamos antes. Si bien Excel puede ayudarnos a ver tendencias en una planilla de cálculo que a priori parece infinita, de acuerdo a la cantidad de datos que incluya, su funcionamiento y configuración se complicarán exponencialmente.

Entornos como Hadoop son de código abierto (open source). En general, todos los programas y herramientas de esta naturaleza cuentan con versiones gratuitas y hasta existen entrenamientos y capacitaciones gratuitas en internet en formato de video o hasta con participaciones interactivas para aprender a utilizarlos.

Sin embargo, las primeras etapas de organización de información pueden ser extenuantes, ya que estaremos trabajando con herramientas nuevas y con información que ni siquiera sabíamos que teníamos, así que sugiero que contraten los servicios de expertos para que los asistan con el startup.

Nuestros primeros pasos

Antes de la llegada de “Big Data”, el análisis de grandes volúmenes de datos estaba reservado a empresas que pudieran invertir en hardware de primer nivel funcionando en conjunto. Pero, como nos decían nuestros abuelos, “no es bueno tener todos los huevos en una sola canasta”. Se pensó entonces en una solución que permitiera almacenar la información duplicada y repartida en distintos espacios, para que en caso de falla sólo perdiéramos tiempo en el reemplazo del contenedor y no del contenido.

Lo que en esa época se hacía con equipos ahora se hace con programas, y hoy, el sistema más popular para concentrar, agrupar y analizar los datos recopilados es Hadoop. Consta de dos partes: una que reemplaza al hardware y funciona como una biblioteca que organiza los paquetes de datos por contenido y busca la manera de hacerlos interactuar entre ellos de manera más dinámica y la segunda, que sería el bibliotecario, cuyo fin es el de presentar los datos de manera accesible y fácil de comprender.

Parte 1: Nuestra biblioteca (HDFS)

HDFS es el sistema de archivos en el que se basa Hadoop. Reemplaza a los grandes conjuntos de discos rígidos y almacena la información en más de una copia, distribuida y fácilmente ubicable. Si uno de los discos falla, este programa se encarga de enviar un alerta al usuario para que lo reemplace. Pero, para nuestra tranquilidad, toda la información seguirá estando disponible.

Parte 2: Nuestro bibliotecario (MapReduce – YARN)

Guardar, guardar y seguir guardando información para luego no saber dónde la pusimos cuando la necesitamos puede que nos suene familiar. Todos en casa tenemos un cuartito donde dejamos las cosas que pensamos que en algún momento utilizaremos pero luego no recordamos que existen cuando realmente precisamos de ellas. Para esto, Hadoop cuenta con un sistema de archivos muy ágil, con un menú muy amigable y pensado 100% para los usuarios. Se llama MapReduce. Gestiona los datos almacenados por HDFS, pero no solo los lista sino que, si es necesario, también coordina a otros programas para que lo hagan por él.

Presentar los datos

Existen programas adicionales que permiten darle otra presentación a los datos que compilamos con Hadoop mediante tablas (algo así como Excel, pero mucho más complejas). Estas herramientas son HBase, Hive y Spark. Las dos primeras trabajan sobre los archivos alojados en el sistema de discos, mientras Spark utiliza el sistema de memoria RAM, lo que lo hace mucho más ágil y eficiente, pero también requiere una inversión más sólida en infraestructura.

Otras alternativas interesantes

Es muy difícil reemplazar a Hadoop, ya sea por su tolerancia a fallos, su popularidad o por ser el primero en haber llegado. Pero su curva de aprendizaje y su implementación pueden resultar desafiantes para algunas personas, por lo que a veces suele darse una oportunidad a otras plataformas. Encontramos entonces a programas como Cassandra, GPFS, Ceph, Cleversafe, Lustre o Islio, que buscan destronar al pionero en administración de grandes datos ofreciendo mejorar su rendimiento, disponibilidad o buscando reorganizar sus capacidades de almacenamiento.

¿Cuáles son los resultados a esperar?

En este tipo de tecnología no hay magia, no se dejará nada librado al azar y lo único que puede esperarse es la eficiencia de las estrategias de acercamiento a nuestros potenciales clientes. Si el resultado de los análisis indica que el perfil de nuestro consumidor promedio es un hombre de 40 años, soltero, ubicado en ciudades grandes, con perfil económico ABC1, nos permitirá direccionar la publicidad a ese público. Por el contrario, si nuestros productos y anuncios tienen mayor impacto en mujeres de 30 años, casadas, con hijos en edad escolar, sin auto y con tarjeta de crédito sabremos perfectamente que tipo de contenido debemos incluir en nuestros productos y contenidos.

¿La campaña de telemarketing falla? ¿Es inteligente invertir en una red social? ¿Nos conviene pagar publicidad en Google Adwords? Analizando los datos con los que contamos más los nuevos que generemos con estas preguntas a Hadoop o al entorno que elijamos, tendremos una idea mucho más clara.

Pero, de manera directa, al mejorar nuestra segmentación de clientes y hasta de herramientas para publicitar nuestros productos seguramente podremos una mejora en la eficiencia de nuestro departamento de ventas y una menor inversión en publicidad ya que lo haremos de manera más inteligente maximizando la rentabilidad de nuestro negocio.

Recomendaciones al comenzar

  • Comience por compilar toda la información posible de sus redes sociales. Consulte con un Community Manager si es que necesita ayuda para hacerlo.
  • Analice la llegada de su información a su público objetivo y segmente los datos lo más que pueda.
  • Verifique con un técnico si su hardware se encuentra preparado para soportar operaciones de alta demanda y actualícelo de ser necesario.

Algunos consejos

  • Como se dijo en esta nota, piense si el volumen de datos con el que cuenta justifica la introducción de una nueva tecnología. No porque algo esté de moda quiere decir que será efectivo para su negocio.
  • Si se inclina por el análisis de información a través de herramientas de Big Data, descargue las versiones gratuitas y realice varios cursos que le permitan ser eficiente a la hora de manejarlas.
  • Una vez que haya hecho todos los cursos gratuitos que pueda, y si considera que Big Data será útil para su negocio, invierta en una capacitación presencial para evacuar todas sus dudas y contar con soporte al dar sus primeros pasos.

TAGS: Redes sociales, Marketing online, Google Ads, Venta por internet, Big Data, inteligencia de negocios.

POR: Mariano R. Chiesa

Soy Mariano Chiesa, especialista en tecnología. Pasé toda mi vida rodeado de computadoras y trabajé en las mejores empresas de informática del mundo. En 2012 co-fundé “Teleparking S.A.”, consultora dedicada al desarrollo de soluciones innovadoras para problemáticas comunes. Nuestros productos insignias son un software de estacionamiento medido y una plataforma de Telemedicina. Sigamos en contacto en ar.linkedin.com/in/marianochiesa.

Santander Rio

Santander Río® 2018
Todos los derechos reservados.