Por qué los metadatos son importantes: Historias del mundo real


Hoy en día, los datos hacen girar al mundo, tal vez incluso más que el dinero. Con los datos presentados de forma precisa y atractiva, las empresas pueden atraer inversionistas, satisfacer a los reguladores, aumentar las ventas, ahorrar dinero y operar como máquinas simples y eficientes. Obviamente, esto supone que saben dónde están los datos y cada propósito; los datos necesarios para un informe anual serán, por supuesto, diferentes de los necesarios para una campaña de marketing dirigida a clientes medianos. Pero obtener los datos requeridos no siempre es fácil; en la mayoría de las organizaciones es mucho más difícil localizar y acceder a los datos correctos que presionar unos pocos botones. Los datos pueden estar mal etiquetados, mal almacenados o no organizados. Debido a estos problemas de metadatos, los datos que deberían ser de gran valor para la organización son mucho menos útiles. Como resultado, es posible que los informes no contengan los datos porque son difíciles de encontrar, lo que puede crear confusión, plazos no cumplidos e incluso sanciones reglamentarias. Para evitar este tipo de problema, es esencial fortalecer los metadatos, asegurando la transparencia y el linaje de los datos. Los sistemas que permiten a las organizaciones controlar sus datos pueden evitar estas pérdidas y problemas, y asegurar su prosperidad. Los metadatos (datos de datos) pueden consistir en decenas, cientos o miles de etiquetas, todas utilizadas en áreas almacenamiento de datos, incluidas bases de datos para diferentes servicios, información del cliente, bases de datos para toda la organización, documentos comerciales, herramientas ETL, Herramientas de análisis, unidades de almacenamiento de datos para redes sociales, herramientas de informes, etc. Todas estas fuentes son fuentes de datos para la búsqueda automática. todos deben contener etiquetas de metadatos coherentes, lo que significa que todos los miembros de una organización que participan en la recopilación y el almacenamiento de datos deben cumplir convenciones coherentes sobre qué etiquetas de metadatos usar. Control de datosL & # 39; la incapacidad para controlar los datos, a menudo debido a una mala gestión de los metadatos, es bastante común. Según un estudio, el 85% de las empresas han tomado medidas importantes para confiar en los datos, pero solo el 37% dice que lo ha logrado. Y controlar los datos es crucial para algunas de las tareas más importantes que deben realizar las empresas. ¿Cómo fallan estos 63% de ellos? Con sus equipos de inteligencia de negocios, por supuesto. Por ejemplo, en el caso de un informe anual sobre los ingresos de toda la organización cuyos resultados no coinciden con los de cada servicio en conjunto, el equipo de BI de la organización examina las bases de datos e intenta hacer coincidir la información correspondiente. Es en esta revisión en gran parte manual que el equipo de BI descubrirá y, con suerte, resolverá las inexactitudes de los metadatos. Pero podría llevar mucho tiempo y costarle al comerciante una buena cantidad de dinero. Para resolver este problema, entre otros metadatos, la organización necesita un sistema automatizado que pueda proporcionar las herramientas necesarias para resolver estos problemas. El sistema ideal sería capaz de reconocer a partir de los propios datos a qué categoría de metadatos pertenece. Por lo tanto, vería una etiqueta de metadatos llamada "Gastos" con la entrada de datos correspondiente en una base de datos, una etiqueta llamada "Gastos" en un segundo y una etiqueta llamada "Costos" en un tercero. El sistema automatizado sería lo suficientemente inteligente como para darse cuenta de que los números de los tres corresponden a la misma cosa, a pesar de las diferencias en los metadatos. El caso de negocio es obvio; ahorra tiempo, tanto para los equipos de BI que ahora cuentan con herramientas automatizadas para ayudarles a realizar su trabajo de manera más precisa y eficiente, como para ahorrar tiempo y dinero. Operaciones más eficientes para cualquier parte de la organización que dependa de los datos (es decir, todos). Pero además de hacer ruido, resolver problemas de metadatos también puede ayudar a resolver problemas regulatorios, que, con la llegada del GDPR, el CCPR de California, las nuevas regulaciones de HIPAA y otros que probablemente El objeto de un gran avance, ahora están muy presentes. El GDPR, por ejemplo, requiere que las organizaciones demuestren que son capaces de localizar datos sobre individuos para cumplir con las reglas del "derecho a ser olvidado". El solo hecho de no poder demostrar que es una razón válida bien bajo las reglas. Y sin un control preciso de los metadatos, donde la información se etiqueta de forma diferente en diferentes fuentes de datos, redondea todos los datos en una sola persona (uno de los millones que pueden aparecer en la base de datos). La organización) va a ser casi imposible. Los datos están en auge. Ya se generan más de 2.5 mil millones de bytes de datos cada día en todo el mundo. para 2020, habrá 5,200 GB de datos por cada habitante del planeta. Y la revolución de IoT, que apenas está comenzando, promete aumentar estos números de manera exponencial. Es de esperar que todas las organizaciones, dispositivos, sistemas, bases de datos, etc., incluso dentro de una organización, se ajusten a una única norma de metadatos. La resolución de metadatos automatizada debe ser parte de la revolución de los datos para cualquier organización que planee usar datos (es decir, todos). Amnon Drori, CEO y cofundador de Octopai

Deja una respuesta