Sumérjase en el catálogo de Unity: su nivel de gobierno confiable

/
July 24, 2025
Sumérjase en el catálogo de Unity: su nivel de gobierno confiable

0:00 / 0:00

Todas las organizaciones que gestionan datos a gran escala acaban enfrentándose a los mismos problemas: permisos dispersos, propiedad poco clara y falta de una forma sencilla de rastrear cómo fluyen los datos a través de las canalizaciones. Unity Catalog es la capa de gobernanza unificada de Databricks para los datos y los activos de IA. Ofrece a las organizaciones un único lugar para definir las políticas de acceso, capturar los registros de auditoría, hacer un seguimiento integral del patrimonio y descubrir los activos de todos sus espacios de trabajo.

Figura 1: Gobierno centralizado con Unity Catalog

Características principales de Unity Catalog

Defina una vez, proteja en todas partes

Control de acceso centralizado

Modelo de seguridad compatible con los estándares

Auditoría y linaje

Descubrimiento de datos

Estructura jerárquica en Unity Catalog

La administración de datos a escala a menudo genera confusión sobre dónde se encuentran los datos, quién es el propietario y cómo se debe estructurar el acceso. Sin un marco claro, resulta difícil aplicar una gobernanza coherente en todos los espacios de trabajo y equipos. Unity Catalog resuelve este problema con una jerarquía lógica en capas que organiza todos los activos de datos, permisos y funciones, desde el nivel de la cuenta hasta las tablas y vistas individuales, lo que hace que la gobernanza sea escalable y transparente.

1. Nivel de cuenta
Este es el nivel más alto de la jerarquía y representa toda su cuenta de Databricks.

2. Nivel de espacio de trabajo
Los espacios de trabajo son entornos en los que los usuarios colaboran, ejecutan libretas y acceden a los datos.

3. Nivel de Metastore
El metastore es el contenedor de nivel superior para la gobernanza de datos en Unity Catalog. Almacena los metadatos y administra los controles de acceso para todos los objetos que contiene. Debajo del metaalmacén, Unity Catalog usa una jerarquía de tres niveles para organizar y controlar los objetos de datos que se pueden proteger:

Figura 2: Modelo de objetos del catálogo de Unity con capas de cuenta y espacio de trabajo

Privilegios de administrador en Unity Catalog

Los diferentes administradores administran diferentes partes de esta jerarquía, con responsabilidades claramente definidas:

Figura 3: Funciones y responsabilidades de administrador de Unity Catalog (Basado en Guía de administración de Databricks Workspace | Blog de Databricks)

Auditoría del acceso a los datos

Unity Catalog mantiene un registro detallado de cada acción en tu metastore. Esto significa que puedes ver exactamente quién vio o cambió cualquier conjunto de datos y qué hizo. La información de auditoría está disponible en las tablas del sistema de Unity Catalog, por lo que puedes ejecutar consultas de SQL para revisar los registros de acceso, detectar comportamientos inusuales y cumplir con los requisitos de cumplimiento.

Linaje de datos de seguimiento

Comprender cómo se mueven y transforman los datos dentro de una organización es crucial para solucionar problemas, auditar y garantizar la confianza en los datos. Unity Catalog captura automáticamente el linaje de datos de un extremo a otro, lo que proporciona visibilidad de las fuentes de datos, las transformaciones y el uso posterior.

Esto facilita el seguimiento de los cambios, el diagnóstico de errores y la verificación de la integridad de los datos. En el caso de las industrias que exigen un alto grado de cumplimiento normativo, el seguimiento automatizado del linaje simplifica las auditorías normativas al ofrecer un registro claro de cómo se utilizan los datos en los distintos flujos de trabajo.

Figura 4: Ejemplo de gráfico de linaje de datos (Imagen de Ver el linaje de datos con Unity Catalog | Documentación de Databricks)

Uso compartido seguro con Delta Sharing & Clean Rooms

Delta Sharing le permite compartir tablas, vistas o archivos de su almacenamiento en la nube con socios, proveedores u otros equipos sin copiar datos. Los permisos que haya establecido en Unity Catalog se transfieren a estos recursos compartidos. Para los escenarios que requieren controles más estrictos, las salas limpias proporcionan un entorno informático aislado en el que varias partes pueden colaborar en los datos sin exponer las tablas sin procesar entre sí. Usted define las transformaciones exactas permitidas y todas las salidas siguen gobernadas por el control de acceso predefinido del proveedor.

Figura 5: Colaboración segura con Databricks Clean Rooms. (Imagen basada en ¿Qué es Azure Databricks Clean Rooms? - Azure Databricks | Microsoft Learn)

Métricas gobernadas con Unity Catalog Metrics

(Anunciado en la cumbre Data + AI de 2025: ahora disponible en versión preliminar pública en AWS, Azure y GCP)

A medida que la casa del lago evoluciona, también lo hace la necesidad de tratar las métricas como ciudadanos de primera clase. Tradicionalmente, los KPI y las métricas empresariales se encuentran dispersas en paneles, SQL integrado u hojas de cálculo, lo que genera incoherencias, errores y duplicaciones. Unity Catalog Metrics resuelve este problema al permitirte definir vistas de métricas gobernadas y reutilizables directamente en Unity Catalog.

Estas métricas son:

Esto significa que todos los equipos de finanzas, BI y ciencia de datos pueden confiar en la misma versión de «ingresos mensuales», «usuarios activos» o «tasa de conversión» en toda la organización sin tener que volver a implementar la lógica en cada herramienta.

Mejores prácticas

Reflexiones finales: Cómo generar confianza y escalabilidad con Unity Catalog

En el panorama en evolución de las plataformas modernas de datos e IA, la gobernanza es una necesidad básica. Unity Catalog no es solo una herramienta para el control de acceso; es una base estratégica para la colaboración segura, la detección de datos y el cumplimiento normativo en toda la organización.

Hemos brindado soluciones con Unity Catalog como la capa de gobierno central para clientes de varios sectores y hemos visto de primera mano cómo permite una entrega de proyectos más rápida, reduce el riesgo y genera confianza en los datos y los resultados de la IA. Desde la optimización del acceso en entornos de tenencia múltiple altamente regulados hasta la simplificación del uso de tuberías complejas, Unity Catalog ha demostrado ser un factor fundamental para la agilidad y el control.

A medida que crece su patrimonio de datos, también lo hace la importancia de contar con un marco de gobierno claro y escalable. Con el catálogo Unity de Databricks, no solo estás protegiendo tus activos, sino que también estás creando la base para proyectos de datos e IA confiables, colaborativos y preparados para el futuro.

Todas las organizaciones que gestionan datos a gran escala acaban enfrentándose a los mismos problemas: permisos dispersos, propiedad poco clara y falta de una forma sencilla de rastrear cómo fluyen los datos a través de las canalizaciones. Unity Catalog es la capa de gobernanza unificada de Databricks para los datos y los activos de IA. Ofrece a las organizaciones un único lugar para definir las políticas de acceso, capturar los registros de auditoría, hacer un seguimiento integral del patrimonio y descubrir los activos de todos sus espacios de trabajo.

Figura 1: Gobierno centralizado con Unity Catalog

Características principales de Unity Catalog

Defina una vez, proteja en todas partes

Control de acceso centralizado

Modelo de seguridad compatible con los estándares

Auditoría y linaje

Descubrimiento de datos

Estructura jerárquica en Unity Catalog

La administración de datos a escala a menudo genera confusión sobre dónde se encuentran los datos, quién es el propietario y cómo se debe estructurar el acceso. Sin un marco claro, resulta difícil aplicar una gobernanza coherente en todos los espacios de trabajo y equipos. Unity Catalog resuelve este problema con una jerarquía lógica en capas que organiza todos los activos de datos, permisos y funciones, desde el nivel de la cuenta hasta las tablas y vistas individuales, lo que hace que la gobernanza sea escalable y transparente.

1. Nivel de cuenta
Este es el nivel más alto de la jerarquía y representa toda su cuenta de Databricks.

2. Nivel de espacio de trabajo
Los espacios de trabajo son entornos en los que los usuarios colaboran, ejecutan libretas y acceden a los datos.

3. Nivel de Metastore
El metastore es el contenedor de nivel superior para la gobernanza de datos en Unity Catalog. Almacena los metadatos y administra los controles de acceso para todos los objetos que contiene. Debajo del metaalmacén, Unity Catalog usa una jerarquía de tres niveles para organizar y controlar los objetos de datos que se pueden proteger:

Figura 2: Modelo de objetos del catálogo de Unity con capas de cuenta y espacio de trabajo

Privilegios de administrador en Unity Catalog

Los diferentes administradores administran diferentes partes de esta jerarquía, con responsabilidades claramente definidas:

Figura 3: Funciones y responsabilidades de administrador de Unity Catalog (Basado en Guía de administración de Databricks Workspace | Blog de Databricks)

Auditoría del acceso a los datos

Unity Catalog mantiene un registro detallado de cada acción en tu metastore. Esto significa que puedes ver exactamente quién vio o cambió cualquier conjunto de datos y qué hizo. La información de auditoría está disponible en las tablas del sistema de Unity Catalog, por lo que puedes ejecutar consultas de SQL para revisar los registros de acceso, detectar comportamientos inusuales y cumplir con los requisitos de cumplimiento.

Linaje de datos de seguimiento

Comprender cómo se mueven y transforman los datos dentro de una organización es crucial para solucionar problemas, auditar y garantizar la confianza en los datos. Unity Catalog captura automáticamente el linaje de datos de un extremo a otro, lo que proporciona visibilidad de las fuentes de datos, las transformaciones y el uso posterior.

Esto facilita el seguimiento de los cambios, el diagnóstico de errores y la verificación de la integridad de los datos. En el caso de las industrias que exigen un alto grado de cumplimiento normativo, el seguimiento automatizado del linaje simplifica las auditorías normativas al ofrecer un registro claro de cómo se utilizan los datos en los distintos flujos de trabajo.

Figura 4: Ejemplo de gráfico de linaje de datos (Imagen de Ver el linaje de datos con Unity Catalog | Documentación de Databricks)

Uso compartido seguro con Delta Sharing & Clean Rooms

Delta Sharing le permite compartir tablas, vistas o archivos de su almacenamiento en la nube con socios, proveedores u otros equipos sin copiar datos. Los permisos que haya establecido en Unity Catalog se transfieren a estos recursos compartidos. Para los escenarios que requieren controles más estrictos, las salas limpias proporcionan un entorno informático aislado en el que varias partes pueden colaborar en los datos sin exponer las tablas sin procesar entre sí. Usted define las transformaciones exactas permitidas y todas las salidas siguen gobernadas por el control de acceso predefinido del proveedor.

Figura 5: Colaboración segura con Databricks Clean Rooms. (Imagen basada en ¿Qué es Azure Databricks Clean Rooms? - Azure Databricks | Microsoft Learn)

Métricas gobernadas con Unity Catalog Metrics

(Anunciado en la cumbre Data + AI de 2025: ahora disponible en versión preliminar pública en AWS, Azure y GCP)

A medida que la casa del lago evoluciona, también lo hace la necesidad de tratar las métricas como ciudadanos de primera clase. Tradicionalmente, los KPI y las métricas empresariales se encuentran dispersas en paneles, SQL integrado u hojas de cálculo, lo que genera incoherencias, errores y duplicaciones. Unity Catalog Metrics resuelve este problema al permitirte definir vistas de métricas gobernadas y reutilizables directamente en Unity Catalog.

Estas métricas son:

Esto significa que todos los equipos de finanzas, BI y ciencia de datos pueden confiar en la misma versión de «ingresos mensuales», «usuarios activos» o «tasa de conversión» en toda la organización sin tener que volver a implementar la lógica en cada herramienta.

Mejores prácticas

Reflexiones finales: Cómo generar confianza y escalabilidad con Unity Catalog

En el panorama en evolución de las plataformas modernas de datos e IA, la gobernanza es una necesidad básica. Unity Catalog no es solo una herramienta para el control de acceso; es una base estratégica para la colaboración segura, la detección de datos y el cumplimiento normativo en toda la organización.

Hemos brindado soluciones con Unity Catalog como la capa de gobierno central para clientes de varios sectores y hemos visto de primera mano cómo permite una entrega de proyectos más rápida, reduce el riesgo y genera confianza en los datos y los resultados de la IA. Desde la optimización del acceso en entornos de tenencia múltiple altamente regulados hasta la simplificación del uso de tuberías complejas, Unity Catalog ha demostrado ser un factor fundamental para la agilidad y el control.

A medida que crece su patrimonio de datos, también lo hace la importancia de contar con un marco de gobierno claro y escalable. Con el catálogo Unity de Databricks, no solo estás protegiendo tus activos, sino que también estás creando la base para proyectos de datos e IA confiables, colaborativos y preparados para el futuro.