¿Qué es el uso compartido de datos?

El uso compartido de datos consiste en poner los mismos recursos de datos a disposición de múltiples aplicaciones, usuarios u organizaciones. Incluye tecnologías, prácticas, marcos legales y elementos culturales que facilitan el acceso seguro a los datos por parte de múltiples entidades sin poner en peligro la integridad de los datos. El uso compartido de datos mejora la eficacia dentro de una organización y fomenta la colaboración con proveedores y socios. Ser consciente de los riesgos y oportunidades que supone el uso compartido de datos forma parte integral del proceso.

¿Por qué el uso compartido de datos es importante para las empresas?

Las organizaciones han estado compartiendo datos desde antes de la aparición de Internet. Sin embargo, el progreso en la alfabetización digital, la tecnología y la adopción de la nube han dado lugar a un uso compartido de datos a una escala sin precedentes. A continuación, indicamos tres factores clave que han contribuido al crecimiento del uso compartido de datos:

  • Las tecnologías de transferencia, procesamiento y almacenamiento de datos tienen una disponibilidad cada vez más amplia y, además, cada vez son más económicas
  • Una nueva mentalidad del sector trata los datos como si fueran un recurso y un activo
  • Las políticas y normativas han cambiado y están destinadas a reducir los riesgos del uso compartido de datos

Las empresas modernas entienden que el uso compartido de datos es vital para unas relaciones comunitarias mejoradas y para nuevas oportunidades empresariales. A continuación, resumimos algunos de los beneficios.

Un mejor valor para los clientes

Combinar la información de distintos orígenes de datos tiene el potencial de aumentar tanto el valor como el rendimiento de los servicios. Esta estrategia promueve un mejor desarrollo del producto y de la investigación. Por ejemplo, WB Games, la división de videojuegos de Warner Bros., utiliza el uso compartido de datos para ayudar a informar el proceso creativo del desarrollo de sus juegos. Captura, ingiere, analiza y lleva a la práctica información para ayudar a sus desarrolladores a que sean más ágiles y aprovechen mejor las oportunidades de su narración.

Más información sobre cómo WB Games usa AWS »

Toma de decisiones basada en datos

Al compartir información de forma transparente, los equipos analizan los silos de datos, lo cual contribuye a un análisis mejorado. La inteligencia empresarial mejora y las partes interesadas toman decisiones de impacto a largo plazo. Por ejemplo, GE Renewable Energy tiene más de 49 000 turbinas eólicas instaladas que generan electricidad eólica en todo el mundo. Las turbinas de GE están equipadas con sensores y están conectadas a avanzadas redes que recopilan datos sobre la temperatura, la velocidad del viento, la electricidad y otros factores relacionados con el rendimiento de la turbina. El sistema de análisis de datos de GE facilita la toma de decisiones para la productividad y el mantenimiento de las turbinas.

Más información sobre cómo GE usa AWS »

Impacto social positivo

Las autoridades y organizaciones públicas pueden compartir más datos de forma respetuosa, legal y segura. Esto crea nuevas oportunidades para colaborar que benefician a un público más amplio. Por ejemplo, el uso compartido de datos en el sector de la salud contribuye positivamente a la investigación médica, lo que se traduce en cosas como un progreso enorme en el campo de la investigación genómica.

Más información sobre cómo el sector de la genómica usa AWS »

¿Cuáles son los riesgos del uso compartido de datos?

La divulgación de datos tiene un potencial regulador, competitivo, financiero y riesgos de seguridad. A continuación, resumimos algunas amenazas críticas:

Divulgación privada

Todas las organizaciones tienen obligaciones legales y éticas de proteger la privacidad de los datos de sus clientes. Tienen que tomar medidas apropiadas para compartir datos sin comprometer la privacidad. Las tecnologías de preservación de la privacidad, como el cifrado y el enmascaramiento, permiten un uso de datos seguro.

Malinterpretación de los datos

Una falta de comunicación entre los productores de datos y los consumidores puede dar como resultado una malinterpretación analítica. Los analistas pueden hacer suposiciones incorrectas al explicar los informes y los resultados. Por ejemplo, una reducción en los pedidos de clientes en un mes particular puede atribuirse a un presupuesto en marketing más bajo, aunque la razón real podría ser la demora en la disponibilidad del producto.

Baja calidad de los datos

Los consumidores de datos pueden tener un control limitado sobre la calidad y disponibilidad de los datos. Puede que tengan que lidiar con datos faltantes o duplicados, preguntas sobre la validez, falta de documentación sobre los datos y problemas similares. Los conjuntos de datos también pueden contener sesgos ocultos contra un género, una raza, una religión o un grupo étnico en particular.

¿Cuáles serían algunas tecnologías de uso compartido de datos?

Hay muchas tecnologías que reducen la fricción entre productores y consumidores, mitigan riesgos y mejoran el valor del uso compartido de datos. A continuación, presentamos algunos ejemplos.

Almacenamiento de datos

Un almacenamiento de datos es un repositorio central para almacenar datos de varias unidades empresariales. La arquitectura de un almacenamiento de datos está compuesta por capas. El nivel superior es el cliente frontend que presenta los resultados mediante informes, análisis y herramientas de minería de datos. El nivel intermedio contiene el motor de análisis que se utiliza para obtener acceso a los datos y para analizarlos. El nivel inferior de la arquitectura es el servidor de la base de datos, donde los datos se cargan y almacenan. Las aplicaciones de nivel superior e intermedio pueden compartir conjuntos de datos comunes almacenados en el nivel inferior.

Los almacenamientos de datos son útiles para el uso compartido de datos interno. Las cargas de trabajo que acceden a los datos compartidos pueden estar aisladas unas de otras.

API

Una API es un mecanismo que permite a dos componentes de software comunicarse entre sí mediante un conjunto de definiciones y protocolos. La interfaz puede considerarse como un contrato de servicio entre dos aplicaciones. Este contrato define cómo se comunican las dos mediante solicitudes y respuestas. Las API de uso compartido de datos admiten controles de acceso detallados y especifican con exactitud qué datos pueden solicitar los consumidores.

Más información sobre las API »

Aprendizaje federado

El aprendizaje federado es una tecnología de machine learning (ML) que permite que los sistemas de inteligencia artificial se entrenen en conjuntos de datos distribuidos. Los productores de datos retienen el control al mismo tiempo que contribuyen a los avances tecnológicos colaborativos. Por ejemplo, los algoritmos de ML que pueden detectar cáncer se entrenan con imágenes de tejidos cancerígenos de varias instituciones médicas.

Más información sobre el machine learning »

Tecnología de cadena de bloques

La tecnología de cadena de bloques es un mecanismo avanzado de bases de datos que permite compartir información transparente dentro de la red de una empresa. Una base de datos de cadena de bloques almacena los datos en bloques que se vinculan entre sí en una cadena. Los datos son coherentes cronológicamente debido a que no es posible eliminar ni modificar la cadena sin el consenso de la red. Como resultado, se puede utilizar la tecnología de cadena de bloques para crear un libro mayor inalterable o inmutable para hacer un seguimiento de los pedidos, los pagos, las cuentas y otras transacciones. Asimismo, el sistema incluye mecanismos integrados que evitan las entradas de transacciones no autorizadas y crean coherencia en la vista compartida de estas transacciones.

Más información sobre la tecnología de cadena de bloques »

Plataformas de intercambio de datos

Las plataformas de datos abiertos permiten que distintas entidades registren sus conjuntos de datos para el consumo público; solo tiene que preparar y enviar los datos. La plataforma ofrece la infraestructura para el almacenamiento y el acceso. Cualquiera puede acceder a sus datos.

¿Cómo puede respaldar AWS el uso compartido de datos?

Cuando se comparten datos en AWS, cualquiera puede analizarlos y crear servicios sobre ellos, mediante un amplio rango de productos de computación y de análisis de datos. Algunos ejemplos son Amazon Cloud Compute (Amazon EC2), Amazon Athena, AWS Lambda y Amazon EMR. Compartir datos en la nube permite que los usuarios dediquen más tiempo al análisis de los datos que a su obtención. A continuación, se indican algunos ejemplos de tecnologías:

  • Amazon Redshift es una tecnología de almacenamiento de datos que permite el acceso instantáneo, pormenorizado y rápido a los datos sin necesidad de copiarlos o trasladarlos. Los usuarios siempre ven la información más actualizada y coherente a medida que esta se actualiza en el almacenamiento de datos.
  • Amazon Managed Blockchain es un servicio completamente administrado que facilita la creación y administración de redes de cadenas de bloques y tecnología de libro mayor distribuida.
  • AWS Data Exchange le permite buscar conjuntos de datos disponibles públicamente a través de los servicios de AWS.

Para comenzar a compartir datos en la nube en AWS, cree una cuenta gratuita hoy mismo.

Siguientes pasos para el uso compartido de datos

Descubra otros recursos relacionados con el producto
Eche un vistazo a los servicios de análisis 
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo al nivel Gratuito de AWS.

Regístrese 
Comenzar a crear en la consola

Comience a crear en la consola de administración de AWS.

Iniciar sesión