¿Qué es la gobernanza de datos?
La gobernanza de datos incluye los procesos y las políticas que garantizan que estos estén en las condiciones adecuadas para respaldar las iniciativas y operaciones empresariales. Las organizaciones modernas recopilan datos de diversos orígenes a escala para mejorar las operaciones y la entrega de servicios. Sin embargo, la toma de decisiones basada en datos solo es efectiva cuando los datos cumplen con los estándares de calidad e integridad requeridos.
La gobernanza de datos determina los roles, las responsabilidades y los estándares para el uso de los datos. Describe quién puede tomar qué medidas, con qué datos, utilizando qué métodos y en qué situaciones. Dado que se utilizan más datos para respaldar los casos de uso de inteligencia artificial (IA) y machine learning (ML), se ha vuelto fundamental que todo el uso de datos cumpla con los requisitos regulatorios y éticos. La gobernanza de datos equilibra la seguridad de los datos con los objetivos tácticos y estratégicos para garantizar la máxima eficacia.
¿Por qué es importante la gobernanza de datos?
Los programas de gobernanza de datos se han empleado históricamente para bloquear los datos en silos a fin de evitar la filtración o el uso indebido de los datos. Sin embargo, la consecuencia de los silos de datos es que los usuarios legítimos tienen que sortear las barreras para acceder a los datos cuando los necesitan. Sin darse cuenta, la innovación basada en datos se ve entorpecida.
En una encuesta de 2024 a 350 directores de datos y roles equivalentes, MIT CDOIQ descubrió que el 45 % de los directores de datos identifican la gobernanza de datos como una de sus prioridades más importantes. Estos líderes de datos buscan establecer un modelo de gobernanza de datos que les permita ponerlos a disposición de las personas y las aplicaciones adecuadas cuando los necesiten, a la vez que se mantengan seguros y protegidos, con los controles adecuados.
Equilibra el acceso y el control
Tiene dos palancas para hacer de la gobernanza un facilitador de la innovación: acceso y control. La clave del éxito es encontrar el equilibrio adecuado entre ambos: el punto de equilibrio de cada organización es diferente. Cuando se ejerce un control excesivo, los datos quedan bloqueados en silos y los usuarios no pueden acceder a los datos cuando los necesitan. Esto frena la creatividad y conduce a la creación de sistemas de TI en la sombra, que dejan los datos desactualizados y desprotegidos. Por el contrario, cuando se proporciona un acceso excesivo, los datos corren el riesgo de no estar regulados entre las aplicaciones y los almacenes de datos, lo que aumenta el riesgo de acceso no autorizado y afecta a la calidad de los datos.
Los procesos de gobernanza de datos equilibran el acceso con el control, lo que brinda a los usuarios confianza y seguridad en los datos. Promueven el descubrimiento, la conservación, la protección y el intercambio de datos adecuados, fomentando la innovación y salvaguardando los datos.
¿Qué es la gobernanza de análisis?
La gobernanza de análisis se refiere tanto a la gobernanza de los datos para su uso en aplicaciones de análisis como a la gobernanza del uso de los sistemas de análisis. Su equipo de gobernanza de análisis puede establecer mecanismos de gobernanza, como la documentación y el control de versiones de los informes de análisis. Como siempre, haga un seguimiento de los requisitos normativos, establezca la política de la empresa y defina barreras de protección para la organización en general.
¿Qué es la gobernanza del machine learning (ML)?
La gobernanza del ML aplica muchas de las mismas prácticas de gobernanza de datos al ML. La calidad y la integración de los datos deben proporcionar los datos necesarios para el entrenamiento de modelos y la implementación en producción (los almacenes de características son un aspecto importante de esto). La inteligencia artificial (IA) responsable presta especial atención al uso de datos confidenciales para crear modelos. Las capacidades adicionales de gobernanza del ML incluyen permitir que las personas participen en la creación, la implementación y la supervisión de los modelos; documentar el entrenamiento, el control de versiones, los casos de uso admitidos y guiar el uso ético del modelo; y supervisar el modelo en producción para verificar su precisión, desviación, sobreajuste y ajuste insuficiente.
La IA generativa requiere capacidades de gobernanza de datos adicionales, como la calidad y la integridad de los datos, para respaldar la adaptación de los modelos básicos para el entrenamiento y la inferencia, la gobernanza de la toxicidad y el sesgo de la IA generativa y las operaciones del modelo de base (FM): las FMOps.
Puede respaldar la IA y el ML con el mismo programa de gobernanza de datos. La preparación de datos es necesaria para transformarlos en un formato que los modelos de IA y ML puedan usar para la inferencia de entrenamiento y producción, pero la preparación de datos más eficaz es la que no tiene que hacer usted. Los científicos de datos dedican demasiado tiempo a preparar los datos para cada caso de uso; su equipo de gobernanza de datos puede ayudarlo a aliviar este trabajo pesado e indiferenciado. Además, la gobernanza de datos puede supervisar la creación de almacenes de características configurados que se utilizarán en los casos de uso de IA y ML.
Por último, los datos confidenciales deben protegerse adecuadamente, de modo que su equipo pueda mitigar los riesgos de que se utilicen datos confidenciales para entrenar los modelos de base.
Al igual que ocurre con los análisis en general, hay que regular el uso de los modelos de IA y ML que se crean o personalizan. Idealmente, esto debería estar estrechamente asociado con la gobernanza de análisis, porque esa función sabrá cómo apoyar a varias áreas de negocio.
¿Cuáles son los beneficios de la gobernanza de datos?
La gobernanza de datos ofrece un marco estructurado para administrar los datos en toda la organización. Estos son algunos de los beneficios clave.
Mejora la calidad de los datos
La gobernanza de datos establece estándares para la precisión, integridad y consistencia de los datos. Obtiene datos relevantes, actuales y fáciles de interpretar en los que confían todas las partes interesadas. Estos datos de alta calidad reducen los errores y generan información precisa y oportuna para la toma de decisiones estratégicas y operativas.
Apoya una cultura basada en datos
Una estrategia eficaz de gobernanza de datos fomenta una cultura que valora los datos y alienta a todos los empleados a utilizarlos y comprenderlos en su trabajo. Motiva la participación de la comunidad empresarial e impulsa la integración de datos en las áreas empresariales participantes. La alineación entre los ingenieros de datos y los usuarios empresariales aumenta la alfabetización general de datos y las capacidades de análisis de la organización.
Mejora la eficiencia operativa
La gobernanza de datos ayuda a determinar el modelo operativo correcto, especialmente el nivel de centralización y descentralización requerido. Puede establecer prácticas de administración de datos consistentes que optimicen las operaciones. La propiedad de los datos y los derechos de acceso claramente definidos facilitan la colaboración entre los departamentos, lo que garantiza que todos trabajen con los mismos orígenes de datos fiables. Alinea los esfuerzos de los equipos para reducir la duplicación, reducir los costos operativos y mejorar la productividad.
Apoyar el cumplimiento de la normativa
Los marcos de gobernanza de datos adoptan un enfoque proactivo para la administración de riesgos, garantizando que las prácticas de datos se alineen con las regulaciones legales y de la industria. Puede evitar el acceso no autorizado mediante políticas definidas de forma centralizada sobre quién puede acceder a los datos o modificarlos. Las herramientas de gobernanza de datos apoyan el cumplimiento de las regulaciones de privacidad para proteger los datos confidenciales.
¿Quién crea la gobernanza de datos?
La creación de una estrategia sólida de gobernanza de datos requiere muchas funciones laborales.
Patrocinadores ejecutivos
Identifican y establecen los principios, estándares y políticas de la gobernanza de datos en toda la organización. También comprenden muchas iniciativas empresariales de la hoja de ruta corporativa y pueden ayudar a determinar las prioridades para impulsar las actividades de la gobernanza de datos.
Administradores de datos
Son de la empresa y participan en los detalles de los proyectos día a día. Ayudan a entender los problemas de datos que pueden causar desafíos con las iniciativas empresariales específicas. También implementan el proceso de gobernanza de datos en sus proyectos y se aseguran de que los datos se administren de manera adecuada. Supervisan el cumplimiento de los empleados y los clientes y escalan cualquier problema si surge.
Propietarios de datos
Establecen políticas sobre los datos, lo que incluye quién debe tener acceso a estos y en qué circunstancias, cómo interpretar y aplicar las regulaciones y las definiciones de los términos clave. También son responsables de la administración técnica y los controles de acceso de sus conjuntos de datos.
Ingenieros de datos
Son de TI y seleccionan e implementan las mejores herramientas de gobernanza de datos para protegerlos, integrarlos desde varias fuentes, administrar la calidad de los datos y encontrar los datos correctos.
¿Cuáles son los estilos de gobernanza de datos?
Un programa de gobernanza de datos debe equilibrar la centralización y descentralización (incluido el autoservicio). En toda la organización, dispondrá de una combinación de gobernanza centralizada, federada y descentralizada, en función de los requisitos empresariales. Debe dar libertad a los equipos de dominios en la medida de lo posible y, al mismo tiempo, mantener la coherencia entre los dominios (por ejemplo, la capacidad de vincular los datos).
Gobernanza de datos centralizada
Las organizaciones centrales son en última instancia responsables de las declaraciones de misión, las políticas, la elección de herramientas y más. Sin embargo, las acciones del día a día muchas veces se transfieren a las líneas de negocio (LOB, por sus siglas en inglés).
Gobernanza de datos federada
La gobernanza de datos federada permite que las unidades empresariales individuales o las iniciativas empresariales operen de la manera que mejor se adapte a sus necesidades. Sin embargo, un equipo centralizado más pequeño se centra en resolver problemas que se repiten con frecuencia, incluidas por ejemplo las herramientas de calidad de datos para toda la empresa.
Gobernanza de datos descentralizada o de autoservicio
Cada departamento hace lo que necesita para el proyecto específico y, al mismo tiempo, se alinea con las políticas centralizadas. Cada proyecto utiliza cualquier herramienta o proceso de otros proyectos que se ajuste a sus necesidades. A medida que aumentan en popularidad temas como la malla de datos (en sí misma descentralizada), también lo hace la gobernanza de datos de autoservicio.
¿Cómo funciona la gobernanza de datos?
La gobernanza de datos requiere soluciones de personas, procesos y tecnología a través de una variedad de capacidades.
Seleccione los datos a escala para limitar la dispersión de datos
Conservar sus datos a escala significa identificar y administrar sus orígenes de datos más valiosos, incluidas las bases de datos, los lagos de datos, y los almacenes de datos. Puede limitar la proliferación y la transformación de los activos de datos críticos. Conservar los datos también significa garantizar que los datos correctos sean precisos, estén actualizados y no contengan información confidencial para que los usuarios puedan confiar en las decisiones basadas en los datos y en las aplicaciones de alimentación de datos.
Capacidades: administración de la calidad de los datos, integración de datos y administración de datos maestros
Descubra y comprenda sus datos en su contexto.
Comprender los datos en su contexto significa que todos los usuarios pueden descubrir y comprender el significado de sus datos para poder usarlos con confianza a fin de generar valor empresarial. Con un catálogo de datos centralizado, los datos se pueden encontrar fácilmente, se puede solicitar el acceso y los datos se pueden utilizar para tomar decisiones empresariales.
Capacidades: creación de perfiles de datos, linaje de datos y catálogos de datos
Proteja y comparta sus datos de forma segura con control y confianza.
Proteger sus datos significa poder lograr el equilibrio adecuado entre la privacidad, la seguridad y el acceso a los datos. Es fundamental poder gobernar el acceso a los datos a través de los límites de la organización, con herramientas que sean intuitivas tanto para los usuarios empresariales como para los de ingeniería.
Capacidades: ciclo de vida de los datos, conformidad de los datos y seguridad de los datos
Reduzca el riesgo empresarial y mejore el cumplimiento normativo.
Reducir el riesgo implica entender cómo se utilizan esos datos y quién los utiliza. Los servicios de AWS le permiten supervisar y auditar el acceso a los datos, lo que incluye el acceso a través de modelos de ML, para garantizar la seguridad de los datos y el cumplimiento regulatorio. El machine learning también requiere la transparencia de las auditorías para garantizar un uso responsable y una elaboración de informes simplificada.
Capacidades: auditoría del uso de los datos y el ML
¿Cómo puede mejorar sus equipos de gobernanza de datos?
La clave para un programa de gobernanza de datos eficaz es vincularlo a las iniciativas empresariales ya financiadas. Asegúrese de que su equipo comprenda qué dominios, orígenes y elementos de datos son necesarios para respaldar esas iniciativas.
- Cree una hoja de ruta de gobernanza de datos que muestre el respaldo a iniciativas empresariales específicas. A continuación, comience a identificar la superposición de datos entre las iniciativas empresariales elegidas.
- Identifique los casos de uso de las aplicaciones y la inteligencia empresarial que los datos necesitan respaldar y alimentar, como los requisitos de antigüedad y privacidad.
- Comprenda cómo son los datos adecuados para cada iniciativa empresarial elegida.
- Mantenga y amplíe el programa de gobernanza de datos integrándolo en el modelo operativo empresarial, de modo que la planificación e implementación de datos se convierta en una parte natural del funcionamiento de la organización.
- Organice la comunidad de análisis para lograr el autoservicio y la coherencia.
- Use la inteligencia artificial (IA) y el machine learning (ML) con la gobernanza de datos y la gobernanza de ML. Utilice el mismo programa de gobernanza de datos, pero incorpore también almacenes de características y modelos de ML.
¿Cuáles son las mejores prácticas de la gobernanza de datos?
La clave para una gobernanza de datos eficaz es vincularlo a las iniciativas empresariales ya financiadas. Asegúrese de que su equipo comprenda qué dominios, orígenes y elementos de datos son necesarios para respaldar esas iniciativas.
- Cree una hoja de ruta de gobernanza de datos que muestre el respaldo a iniciativas empresariales específicas. A continuación, comience a identificar la superposición de datos entre las iniciativas empresariales elegidas.
- Identifique los casos de uso de las aplicaciones y la inteligencia empresarial que los datos necesitan respaldar y alimentar, como los requisitos de antigüedad y privacidad.
- Comprenda cómo son los datos adecuados para cada iniciativa empresarial elegida.
- Mantenga y amplíe mediante la incrustación de la gobernanza en el modelo operativo empresarial, de modo que la planificación e implementación de datos se convierta en una parte natural de la operación de la organización.
- Organice la comunidad de análisis para lograr el autoservicio y la coherencia.
- Apoye a la inteligencia artificial (IA) y al machine learning (ML) con la gobernanza de datos y la gobernanza de ML. Utilice el mismo programa de gobernanza de datos, pero incorpore también almacenes de características y modelos de ML.
¿Cómo afecta la gobernanza de datos al análisis, al machine learning y a la inteligencia artificial?
La gobernanza de datos desempeña un rol clave en los casos de uso intensivo de datos.
Gobernanza de análisis
La gobernanza de análisis se refiere tanto a la gobernanza de los datos para su uso en aplicaciones de análisis como a la gobernanza del uso de los sistemas de análisis. Su equipo de gobernanza de análisis puede establecer mecanismos de gobernanza, como la documentación y el control de versiones de los informes de análisis. Como siempre, haga un seguimiento de los requisitos normativos, establezca la política de la empresa y defina barreras de protección para la organización en general.
Gobernanza de IA
La gobernanza de IA aplica muchas de las mismas prácticas de gobernanza de datos a los casos de uso de IA/ML. La calidad y la integración de los datos deben proporcionar los datos necesarios para el entrenamiento del modelo y el despliegue en producción (los almacenes de características son un aspecto importante de esto). La inteligencia artificial responsable (IA) presta especial atención al uso de datos confidenciales para crear modelos. Las capacidades adicionales de gobernanza de IA incluyen permitir que las personas participen en la creación, el despliegue y la supervisión de los modelos; documentar el entrenamiento del modelo, el control de versiones, los casos de uso admitidos y guiar el uso ético del modelo; y supervisar el modelo en producción para verificar su precisión, desviación, sobreajuste y ajuste insuficiente.
La IA generativa requiere capacidades de gobernanza de datos adicionales, como la calidad y la integridad de los datos, para respaldar la adaptación de los modelos básicos para el entrenamiento y la inferencia, la gobernanza de la toxicidad y el sesgo de la IA generativa y las operaciones del modelo fundacional (FM): las FMOps.
Puede respaldar la IA y el ML con el mismo programa de gobernanza de datos. La preparación de datos es necesaria para transformarlos en un formato que los modelos de IA y ML puedan usar para el entrenamiento y la inferencia de producción, pero la preparación de datos más eficaz es la que usted no tiene que hacer. Los científicos de datos dedican demasiado tiempo a preparar los datos para cada caso de uso; su equipo de gobernanza de datos puede ayudarlo a aliviar este trabajo pesado e indiferenciado. Además, la gobernanza de datos puede supervisar la creación de almacenes de características configurados para los casos de uso de IA y ML.
Por último, los datos confidenciales deben protegerse adecuadamente, de modo que su equipo pueda mitigar los riesgos de que se utilicen datos confidenciales para entrenar los modelos fundacionales.
Al igual que ocurre con los análisis, debe regular el uso de los modelos de IA/ML que crea o personaliza. Idealmente, esto debería estar estrechamente asociado con la gobernanza de análisis, porque esa función sabrá cómo apoyar a varias áreas de negocio.
¿Cuáles son los principales desafíos de la gobernanza de datos?
El desafío estratégico más común para la gobernanza de datos es alinear su programa con las iniciativas empresariales en lugar de proponer directamente el valor de la gobernanza de datos. Por ejemplo, puede proponer el valor de facilitar a los usuarios finales la búsqueda de los datos que buscan, o puede proponer el valor de resolver los problemas de calidad de los datos. Pero estas son soluciones en busca de un problema. Si lo hace de esta manera, acabará compitiendo por la financiación y el patrocinio con iniciativas empresariales que debería apoyar. En su lugar, posicione la gobernanza de datos para dar soporte a las iniciativas empresariales. Todas las iniciativas empresariales importantes requieren datos. La gobernanza de datos debe garantizar que los datos estén en las condiciones adecuadas para apoyar el éxito de la iniciativa empresarial. No pase por alto las prácticas de elaboración de informes y auditoría para saber cómo la gobernanza de datos da soporte a estas iniciativas.
Otro desafío estratégico común es evitar aplicar la gobernanza de datos de manera demasiado restringida. Una definición demasiado restringida podría consistir en alinear el programa con áreas empresariales o casos de uso sin tener una visión más amplia de todas las áreas empresariales. Una definición restringida también podría significar definir la gobernanza de datos mediante solo una o dos capacidades. Por ejemplo, tener un catálogo de datos no constituye un programa de gobernanza de datos.
¿Cuáles son las ofertas de AWS para la gobernanza de datos?
Con la gobernanza de datos integral en AWS, las organizaciones tienen el control sobre dónde se encuentran sus datos, quién tiene acceso a ellos y qué se puede hacer con ellos en cada paso del flujo de trabajo de datos. La gobernanza de datos con AWS ayuda a las organizaciones a acelerar las decisiones basadas en los datos, ya que facilita que las personas y las aplicaciones adecuadas encuentren los datos correctos, accedan a ellos y los compartan de forma segura y cuando necesiten hacerlo. Puede seleccionar los datos automatizando su integración y calidad para limitar su proliferación. Puede descubrir y comprender sus datos con catálogos centralizados que impulsan la alfabetización de datos. Puede proteger sus datos con permisos precisos que le permiten compartir datos con confianza.
Puede reducir el riesgo y mejorar el cumplimiento normativo mediante la supervisión y la auditoría del acceso a los datos.
- Amazon DataZone: libere los datos más allá de los límites de su empresa con la gobernanza integrada.
- AWS Glue: descubra, prepare e integre todos los datos a cualquier escala.
- AWS Lake Formation: cree, administre y proteja lagos de datos en cuestión de días
- Amazon QuickSight inteligencia empresarial unificada a hiperescala
- Amazon SageMaker: cree, entrene e implemente modelos de machine learning para los casos de uso con infraestructura, herramientas y flujos de trabajo completamente administrados.
- Página web de gobernanza de ML
- Amazon Bedrock: cree y escale las aplicaciones de IA generativa con modelos fundacionales (FM).
- Amazon Macie: descubra y proteja datos confidenciales a escala
- Puntos de acceso de Amazon Simple Storage Service (Amazon S3): almacenamiento de objetos creado para recuperar cualquier volumen de datos desde cualquier ubicación
- AWS Data Exchange: busque, suscríbase y utilice fácilmente datos de terceros en la nube
- AWS Clean Rooms: cree salas limpias en cuestión de minutos para colaborar con sus socios sin compartir datos sin procesar
Comience con la gobernanza de datos en AWS en y cree una cuenta gratuita hoy mismo.
Siguientes pasos en AWS
Obtenga acceso instantáneo al nivel Gratuito de AWS.
Comience a crear en la consola de administración de AWS.