10.2 C
Madrid
martes, marzo 4, 2025

Desmitificando los tejidos de datos: cerrando la brecha entre las fuentes de datos y las cargas de trabajo


El término «estructura de datos» se utiliza en toda la industria tecnológica, pero su definición e implementación pueden variar. He visto esto entre proveedores: en otoño del año pasado, British Telecom (BT) habló sobre su tejido de datos en un evento de analistas; Mientras tanto, en almacenamiento, NetApp ha estado reorientando su marca hacia la infraestructura inteligente, pero anteriormente utilizaba el término. El proveedor de plataformas de aplicaciones Appian tiene un producto de estructura de datos, y el proveedor de bases de datos MongoDB también ha estado hablando sobre estructuras de datos e concepts similares.

En esencia, una estructura de datos es una arquitectura unificada que abstrae e integra fuentes de datos dispares para crear una capa de datos perfecta. El principio es crear una capa unificada y sincronizada entre fuentes de datos dispares y las cargas de trabajo que necesitan acceso a los datos: sus aplicaciones, cargas de trabajo y, cada vez más, sus algoritmos de inteligencia synthetic o motores de aprendizaje.

Hay muchas razones para querer una superposición de este tipo. La estructura de datos actúa como una capa de integración generalizada, conectándose a diferentes fuentes de datos o agregando capacidades avanzadas para facilitar el acceso a aplicaciones, cargas de trabajo y modelos, como permitir el acceso a esas fuentes mientras las mantiene sincronizadas.

Hasta ahora, todo bien. El desafío, sin embargo, es que tenemos una brecha entre el principio de un tejido de datos y su implementación actual. La gente usa el término para representar cosas diferentes. Volviendo a nuestros cuatro ejemplos:

  • BT outline la estructura de datos como una superposición a nivel de pink diseñada para optimizar la transmisión de datos a través de largas distancias.
  • La interpretación de NetApp (incluso con el término infraestructura de datos inteligente) enfatiza la eficiencia del almacenamiento y la gestión centralizada.
  • Appian posiciona su producto Information Cloth como una herramienta para unificar datos en la capa de aplicación, lo que permite un desarrollo y una personalización más rápidos de las herramientas orientadas al usuario.
  • MongoDB (y otros proveedores de soluciones de datos estructurados) consideran los principios del tejido de datos en el contexto de la infraestructura de gestión de datos.

¿Cómo superamos todo esto? Una respuesta es aceptar que podemos abordarlo desde múltiples ángulos. Se puede hablar conceptualmente sobre la estructura de datos, reconociendo la necesidad de reunir fuentes de datos, pero sin exagerar. No necesitas un “súper tejido” common que cubra absolutamente todo. En su lugar, concéntrese en los datos específicos que necesita gestionar.

Si retrocedemos un par de décadas, podemos ver similitudes con los principios de la arquitectura orientada a servicios, que buscaba desacoplar la prestación de servicios de los sistemas de bases de datos. En aquel entonces, discutimos la diferencia entre servicios, procesos y datos. Lo mismo aplica ahora: puedes solicitar un servicio o solicitar datos como un servicio, enfocándote en lo que necesitas para tu carga de trabajo. ¡Crear, leer, actualizar y eliminar siguen siendo los servicios de datos más sencillos!

También recuerdo los orígenes de la aceleración de pink, que utilizaría el almacenamiento en caché para acelerar las transferencias de datos manteniendo versiones de los datos localmente en lugar de acceder repetidamente a la fuente. Akamai construyó su negocio basándose en cómo transferir contenido no estructurado, como música y películas, de manera eficiente y a largas distancias.

Esto no quiere decir que las estructuras de datos estén reinventando la rueda. Estamos en un mundo tecnológicamente diferente (basado en la nube); Además, aportan nuevos aspectos, entre ellos la gestión de metadatos, el seguimiento del linaje, el cumplimiento y las funciones de seguridad. Estos son especialmente críticos para las cargas de trabajo de IA, donde la gobernanza, la calidad y la procedencia de los datos impactan directamente el rendimiento y la confiabilidad del modelo.

Si está considerando implementar una estructura de datos, el mejor punto de partida es pensar para qué desea los datos. Esto no sólo le ayudará a orientarse sobre qué tipo de tejido de datos podría ser el más apropiado, sino que este enfoque también le ayudará a evitar la trampa de intentar gestionar todos los datos del mundo. En su lugar, puede priorizar el subconjunto de datos más valioso y considerar qué nivel de tejido de datos funciona mejor para sus necesidades:

  1. Nivel de pink: Para integrar datos en entornos de múltiples nubes, locales y de borde.
  2. Nivel de infraestructura: Si sus datos están centralizados con un proveedor de almacenamiento, concéntrese en la capa de almacenamiento para brindar servicios a grupos de datos coherentes.
  3. Nivel de aplicación: Reunir conjuntos de datos dispares para aplicaciones o plataformas específicas.

Por ejemplo, en el caso de BT, han encontrado valor interno al utilizar su tejido de datos para consolidar datos de múltiples fuentes. Esto cut back la duplicación y ayuda a optimizar las operaciones, haciendo que la gestión de datos sea más eficiente. Es claramente una herramienta útil para consolidar silos y mejorar la racionalización de las aplicaciones.

Al remaining, Information Cloth no es una solución monolítica y única para todos. Es una capa conceptual estratégica, respaldada por productos y características, que puede aplicar donde tenga más sentido para agregar flexibilidad y mejorar la entrega de datos. La estructura de implementación no es un ejercicio de “configúrelo y olvídese”: requiere un esfuerzo continuo para alcanzar, implementar y mantener, no solo el software program en sí, sino también la configuración e integración de las fuentes de datos.

Si bien una estructura de datos puede existir conceptualmente en varios lugares, es importante no replicar innecesariamente los esfuerzos de entrega. Por lo tanto, ya sea que esté reuniendo datos a través de la pink, dentro de la infraestructura o a nivel de aplicación, los principios siguen siendo los mismos: utilícelos donde sea más apropiado para sus necesidades y permítales evolucionar con los datos que brindan.



Related Articles

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Stay Connected

0SeguidoresSeguir
0SuscriptoresSuscribirte
- Advertisement -spot_img

Latest Articles