Tipos

Tipos de Big Data

1. Estructurados:

Cualquier dato que se pueda almacenar, acceder y procesar en formato fijo recibe el nombre de dato estructurado. Durante este período de tiempo, el talento en la informática ha logrado mejores resultados en el desarrollo de técnicas de trabajo con ese tipo de datos (donde ya se conoce el formato) y se ha derivado valor.

No obstante, hoy en día, estamos previendo preguntas cuando el tamaño de dichos datos crece en gran medida, las dimensiones típicas están en el rango de Múltiples zettabytes.

 

2. No estructurados:

Son cualquier dato de forma desconocida o cuya estructura se clasifica como un dato no estructurado. Además, de ser enorme en tamaño, los datos no estructurados plantean múltiples desafíos con respecto a su procesamiento para derivar valor de ellos.

Un ejemplo típico de datos no estructurados son las fuentes de datos heterogéneos que contienen una combinación de archivos de texto simples, imágenes, videos, entre otros.

En la actualidad, las organizaciones cuentan con una gran cantidad de datos disponibles. Pero, desafortunadamente, no saben cómo derivar valor de ellos porque estos datos se encuentran en su forma cruda o formato no estructurado.

 

3. Semiestructurados:

Los datos semiestructurados pueden contener ambos tipos de datos. Suelen tener un formato que se puede definir, pero el usuario no lo puede comprender fácilmente y requiere el uso de reglas complejas que ayuden a determinar cómo leer cada pieza de la información. Un ejemplo de un dato semiestructurado es un dato representado en un archivo XML.

 

Las 7 V de Big Data

 

    1. Volumen:

La cantidad de datos importa. Con el Big Data, tendrás que procesar grandes volúmenes de datos no estructurados de baja densidad. Pueden ser datos de valor desconocidos, como los canales de datos de Twitter, rastros de clics en una página web o en una aplicación de celular o equipos con sensores habilitados.

Para algunas organizaciones, esto puede significar decenas de terabytes de datos. Para otros, puede implicar cientos de petabytes.

 

    2. Velocidad:

La velocidad es el ritmo acelerado en el que se reciben y procesan los datos. Por lo general, la más alta velocidad de datos fluye directamente a la memoria en vez de escribirse en el disco. Algunos productos inteligentes con acceso a internet operan en tiempo real y probarán evaluación y acción en tiempo real.

 

    3. Variedad:

La variedad se refiere a los distintos tipos de datos que se encuentran disponibles. Los tipos de datos tradicionales se estructuraron y adaptaron perfectamente en una base de datos relacional.

Con el incremento de datos masivos, estos vienen en nuevos tipos de datos no estructurados. Los tipos de datos semi y no estructurados, como textos, audios y videos, requieren un preprocesamiento adicional para deducir su significado y ser compatibles con los metadatos.


    4. Veracidad:

Los datos deben ser reales, deben corresponder con lo que señala que son y no con los datos falsos. La depuración de los datos y la limpieza que las base de datos de las organizaciones o instituciones es un paso previo a la toma de decisiones sobre la base de datos de los que dispone.


    5. Valor:

Toda la producción y procesamiento de datos, los análisis y decisiones deben conducir a acciones que repercutan positivamente en la sociedad, en las organizaciones o instituciones que las procesan.


    6. Variabilidad:

La variabilidad de los datos se refiere a la variación que pueden tener los datos, los cambios que experimentan y que impacta en la homogeneización de los mismos, así como las posibilidades de predicción


    7.Visualización:

Característica definitoria de los grandes datos. En este caso, toma mucho significado la expresión <<una imagen vale más que mil palabras>>. Poder traducir la ingente cantidad de datos y los resultados de los análisis es esquemas, diagramas o gráficos o Big Data es otra de las necesidades que han surgido en este campo. Es mucha información que se puede transmitir con las herramientas de visualización de datos, las cuales permiten percibir tendencias y facilitar la toma de decisiones.

Comentarios

Entradas populares