Preguntas frecuentes sobre Amazon Neptune

Aspectos generales

Amazon Neptune es un servicio que incluye un motor de base de datos de grafos, un motor de base de datos de análisis de grafos, machine learning (ML) de grafos y herramientas de visualización, que se pueden utilizar de forma individual o conjunta. El servicio de Neptune facilita el trabajo con datos de grafos en AWS. Con Amazon Neptune Database, puede escalar sus grafos con más de 100 000 consultas por segundo para las aplicaciones más exigentes mediante una base de datos de grafos sin servidor diseñada para ofrecer una escalabilidad y disponibilidad superiores. Con Amazon Neptune Analytics, puede obtener información y encontrar tendencias mediante el procesamiento rápido de grandes cantidades de datos de grafos. Puede obtener resultados en segundos al invocar los populares algoritmos de análisis de grafos

Amazon Neptune Database proporciona una base de datos de grafos especialmente diseñada con un conjunto completo de características e integraciones empresariales. Neptune Database admite aplicaciones de grafos de misión crítica que requieren alta disponibilidad, recuperación de desastres, escalado dinámico y otras capacidades que requieren las aplicaciones empresariales.

Neptune Analytics es un motor de base de datos de análisis que analiza rápidamente grandes cantidades de datos de grafos para obtener información y encontrar tendencias.

Neptune ML es una capacidad de la base de datos de Neptune que utiliza las redes neuronales de grafos (GNN), una técnica de ML para los grafos, con el fin de hacer predicciones rápidas y más precisas mediante datos de grafos.

Neptune Database, con las herramientas para desarrolladores de Neptune, son la elección correcta para crear sistemas de misión crítica a gran escala. Los sistemas como los motores de recomendación de productos, los sistemas de administración de identidades y accesos y los sistemas de cumplimiento con frecuencia requieren capacidades distribuidas geográficamente que están disponibles en Neptune Global Database. Neptune Database almacena decenas de miles de millones de relaciones y puede procesar cientos de miles de consultas de grafos interactivas por segundo.

Neptune Analytics, junto con los cuadernos Neptune, son la elección correcta para interactuar con los datos y obtener información. Estas capacidades permiten a los usuarios interactuar con los datos mediante herramientas conocidas, como Pandas, Jupyter y Python, para descubrir e identificar interacciones y patrones de comportamiento en los datos que son indicativos de fraude, actividades ilegales, oportunidades de optimización y más.

Algunos casos de uso habituales de Neptune Analytics incluyen el análisis efímero, la ejecución de consultas analíticas de baja latencia, la ejecución de algoritmos de grafos integrados y la realización de búsquedas por similitud vectorial. Con la búsqueda por similitud vectorial, Neptune Analytics se puede utilizar para crear aplicaciones de generación aumentada de recuperación (RAG) que busquen a través de representaciones de datos densas proporcionadas por las incrustaciones. Los resultados de la búsqueda vectorial se pueden combinar con representaciones de datos contextualmente conscientes en grafos para proporcionar información contextual rica relacionada con las relaciones.

Neptune ML se puede utilizar para diseñar, crear, optimizar y predecir relaciones y categorizaciones mediante GNN de última generación. Para aumentar las tablas de características, Neptune Analytics se puede utilizar para derivar características críticas a partir de datos conectados mediante algoritmos comunes como la agrupación en clústeres, la centralidad y la búsqueda de rutas.

Sí. Consulte el SLA de Amazon Neptune.

Neptune Database

Sí. Consulte el SLA de Amazon Neptune. Neptune Database es compatible con dos lenguajes de consulta para el modelo de datos de grafos de propiedades, el lenguaje de recorrido de gráfico Gremlin de Apache TinkerPop de código abierto y el lenguaje de consultas openCypher. Para el modelo de datos Resource Description Framework (RDF), Neptune es compatible con el lenguaje de consulta SPARQL estándar abierto de W3C.

Sí, cada clúster de Neptune Database puede almacenar datos de grafos de propiedades y datos de RDF. Neptune proporciona un punto de conexión Gremlin (HTTPS y WebSocket), un punto de conexión openCypher (HTTPS y Bolt) y un punto de conexión REST del protocolo SPARQL 1.1.

Para los grafos de propiedades, puede ejecutar una consulta de Gremlin u openCypher sobre los mismos datos, sin importar el idioma utilizado para ingresar esos datos. Puede que resulte más cómodo utilizar Gremlin para algunas cargas de trabajo y openCypher para otras. No puede ejecutar una consulta de datos de grafos de propiedades (Gremlin u openCypher) sobre datos RDF o viceversa.

Neptune Database proporciona un servidor Gremlin de Apache TinkerPop, compatible con conexiones tanto HTTPS como WebSocket. Una vez que aprovisione una instancia de Neptune, podrá configurar la aplicación de TinkerPop existente para que utilice el punto de conexión proporcionado por el servicio. Consulte también Acceso a un gráfico con Gremlin.

No, el servidor Gremlin de Neptune admite clientes compatibles con Apache TinkerPop a través de las conexiones WebSockets y REST HTTPS. La última versión de Neptune Database es compatible con TinkerPop 3.6.x. Consulte la documentación para obtener más información.

Gracias a la compatibilidad de Neptune con el lenguaje de consulta openCypher, puede transferir a Neptune la mayoría de las cargas de trabajo de Cypher o Neo4j que utilizan el protocolo Bolt o HTTPS. Para obtener información más detallada sobre cómo migrar una aplicación de openCypher, lea la guía de migración en la documentación.

Neptune ofrece un punto de enlace REST HTTPS que implementa el protocolo SPARQL 1.1. Una vez que aprovisione una instancia de servicio, podrá configurar la aplicación para que apunte al punto de conexión SPARQL. Consulte también Acceso al gráfico con SPARQL.

No, el punto de conexión SPARQL de Neptune funcionará con cualquier cliente que soporte el protocolo SPARQL 1.1.

Sí, Neptune cumple con ACID, con una coherencia inmediata en la instancia de escritura principal y, finalmente, en las instancias de réplica de lectura.

Neptune Database es un motor de base de datos de grafos de alto rendimiento. Para determinadas características de administración, como la administración del ciclo de vida de instancias, el cifrado en reposo con claves de AWS Key Management Service (AWS KMS) y la administración de grupos de seguridad, Neptune utiliza tecnología operativa que se comparte con Amazon Relational Database Service (Amazon RDS).

Neptune Database está diseñado para soportar aplicaciones de grafos que necesitan consultas de grafos de baja latencia y alto nivel de rendimiento. Con capacidad para hasta 15 réplicas de lectura, Neptune Database admite cientos de miles de consultas por segundo.

Sí, Neptune utiliza la optimización de consultas para las consultas de Gremlin, openCypher y SPARQL. Para obtener más información, consulte el motor de consultas alternativo (DFE) de Amazon Neptune.

No, Neptune es un motor de base de datos de grafos de alto rendimiento. Neptune almacena y examina datos de gráficos de manera eficiente y utiliza una arquitectura optimizada en memoria y de escala ajustable que permite realizar evaluaciones de consulta rápidas en gráficos de gran tamaño.

Consulte nuestra página de precios para obtener la información sobre precios más actualizada.

Para obtener más información sobre las regiones de AWS en las que Neptune Database está disponible, consulte el cuadro de regiones de AWS.

No. La reproducción de Neptune Database está incluida en el precio. Los cargos se aplicarán en función del almacenamiento que la base de datos consuma en la capa de la base de datos, no por el almacenamiento consumido en la capa de almacenamiento virtual de Neptune.

Neptune Database se diseñó para eliminar operaciones de E/S innecesarias. Esto permite reducir costos y garantizar que los recursos estén disponibles cuando se necesiten para el tráfico de lectura y escritura. Las operaciones de E/S de escritura solo se consumen cuando se envían registros de transacciones a la capa de almacenamiento con el fin de hacer que las escrituras sean duraderas. Las operaciones de E/S de escritura se cuentan en unidades de 4 KB. Por ejemplo, un registro de transacción que tiene 1024 bytes se cuenta como una operación de E/S.

Sin embargo, las operaciones de escritura simultáneas cuyo registro de transacción tenga menos de 4 kb se pueden agrupar por lotes en el motor de base de datos de Neptune para optimizar el consumo de operaciones de E/S. A diferencia de los motores de bases de datos tradicionales, Neptune nunca envía páginas de bases de datos modificadas a la capa de almacenamiento, lo que genera más ahorros en el consumo de E/S.

El límite mínimo de almacenamiento es de 10 GiB. El almacenamiento de Neptune aumentará de forma automática en función del uso de la base de datos, hasta 128 TiB, en incrementos de 10 GiB, sin que ello incida en el rendimiento de la base de datos. No es necesario aprovisionar el almacenamiento de antemano.

Para ajustar la escala de los recursos informáticos asignados a la instancia de base de datos en la Consola de administración de AWS, seleccione la instancia de base de datos deseada y elija el botón Modificar. La memoria y los recursos de CPU se modifican al cambiar la clase de instancia de base de datos.

Si modifica la clase de instancia de base de datos, los cambios solicitados se aplicarán durante el período de mantenimiento especificado. Si lo desea, puede utilizar el marcador Aplicar inmediatamente para aplicar sus solicitudes de escalado de forma inmediata. Ambas opciones afectarán la disponibilidad durante algunos minutos mientras se ejecuta la operación de escalado. Tenga en cuenta que también se aplicarán los demás cambios pendientes en el sistema.

Puede escalar automáticamente la capacidad de su base de datos con Amazon Neptune sin servidor. Neptune sin servidor permite ejecutar cargas de trabajo de grafos y escalarlas al instante, sin necesidad de administrar ni optimizar la capacidad. Neptune sin servidor determina y aprovisiona automáticamente los recursos informáticos y de memoria para ejecutar la base de datos de grafos y escala la capacidad en función de los requisitos cambiantes de la carga de trabajo para mantener un rendimiento uniforme.

Sí, Neptune admite el escalado automático de réplicas de lectura de instancias. Puede configurar el escalado automático para añadir o eliminar automáticamente réplicas de lectura en respuesta a los cambios en los requisitos de conectividad o de carga de trabajo. Para obtener más información, consulte la documentación.

Las copias de seguridad automatizadas siempre están habilitadas en las instancias de Neptune Database. Los backups no afectan el desempeño de la base de datos.

Sí. Además, la realización de instantáneas no afecta el rendimiento. Tenga en cuenta que, para restablecer datos a partir de snapshots de base de datos, es necesario crear una nueva instancia de base de datos.

Neptune Database conserva de forma automática copias de los datos en tres zonas de disponibilidad y tratará recuperar la base de datos automáticamente en una zona de disponibilidad que funcione de manera correcta sin que se pierdan datos. En el extraño caso de que los datos no se encuentren disponibles en el almacenamiento de Neptune, puede restaurarlos a partir de una instantánea de base de datos o realizar una operación de restauración a un momento dado en una instancia nueva. Tenga en cuenta que el tiempo restablecible para una operación de restablecimiento a un momento dado puede ser dentro de los 5 minutos anteriores.

Puede optar por crear una instantánea de base de datos final al eliminar la instancia de base de datos. De ser así, puede usar esta instantánea de base de datos para restablecer la instancia de base de datos eliminada en un momento posterior. Neptune retiene la instantánea de base de datos definitiva creada por el usuario junto con todas las demás instantáneas de bases de datos creadas manualmente después de haber eliminado la instancia de base de datos. Después de eliminar una instancia de base de datos, solo se retienen las instantáneas de base de datos (por ejemplo, no se retienen las copias de seguridad automáticas creadas para un restablecimiento a un momento dado).

Sí. Neptune permite crear instantáneas de las bases de datos que se pueden usar posteriormente para restaurar una base de datos. Puede compartir una instantánea con una cuenta distinta de AWS. El propietario de la cuenta de destino podrá usar esta instantánea para restaurar una base de datos que contenga sus datos. Incluso puede elegir que sus instantáneas sean públicas. Es decir, cualquiera podría restaurar una base de datos que contenga sus datos (públicos). Puede utilizar esta característica para compartir datos entre sus distintos entornos (producción, desarrollo/pruebas, staging, etc.) que tengan diferentes cuentas de AWS, así como para mantener las copias de seguridad de todos sus datos seguros en una cuenta separada en caso de que su cuenta principal de AWS se vea alguna vez comprometida.

Compartir instantáneas entre cuentas no conlleva ningún cargo. Sin embargo, es posible que se le cobre por las instantáneas, así como por cualquier base de datos que restaure a partir de instantáneas compartidas. Obtenga más información sobre los precios de Amazon Neptune.

No es posible compartir instantáneas de base de datos automáticas. Para compartir un snapshot automático, debe crear una copia del snapshot de forma manual y compartirla.

Puede compartir instantáneas manuales con hasta 20 ID de cuenta de AWS. Si desea compartir una instantánea con más de 20 cuentas, puede compartirla haciéndola pública o contactar al equipo de soporte para incrementar el número.

Puede compartir sus instantáneas de Neptune Database en todas las regiones de AWS en las que se encuentre disponible Neptune.

No. Solo las cuentas ubicadas en la misma región que la cuenta que las comparte podrán acceder a las instantáneas de Neptune Database compartidas.

Sí, puede compartir instantáneas de Neptune Database cifradas.

No, las instantáneas de Neptune solo se pueden utilizar dentro del servicio.

Solo se puede crear un clúster de Neptune Database en una VPC de Amazon que tenga al menos dos subredes en al menos dos zonas de disponibilidad. Al distribuir las instancias del clúster en al menos dos zonas de disponibilidad, Neptune ayuda a garantizar que haya instancias disponibles en el clúster de base de datos en el improbable caso de que se produzca un error en la zona de disponibilidad. El volumen del clúster de base de datos de Neptune siempre abarca tres zonas de disponibilidad para proporcionar un almacenamiento duradero con menos posibilidades de pérdida de datos. Neptune es un servicio diseñado para administrar de manera transparente la pérdida de hasta dos copias de datos sin que ello afecte a la disponibilidad de escritura de la base de datos y hasta tres copias sin que afecte a la disponibilidad de lectura. El almacenamiento de Neptune también ofrece recuperación automática. Los bloques de datos y los discos están sujetos a un análisis constante en busca de errores y se reparan automáticamente.

A diferencia de lo que ocurre con otras bases de datos, después de un bloqueo Neptune no necesita reproducir el registro de rehacer a partir del último punto de comprobación de la base de datos (que suele ser de 5 minutos) y confirmar que todos los cambios se hayan aplicado antes de que la base de datos esté disponible para las operaciones. Esto reduce el tiempo de reinicio de la base de datos a menos de 60 segundos en la mayoría de los casos. Neptune extrae la caché del búfer del proceso de la base de datos y la habilita inmediatamente en el momento de realizar el reinicio. Esto evita la necesidad de limitar el acceso hasta que la caché se vuelve a llenar a fin de evitar interrupciones.

Neptune admite réplicas de lectura que comparten el mismo volumen subyacente que la instancia principal. Las actualizaciones realizadas por la instancia principal son visibles para todas las réplicas de Amazon Neptune. Un clúster de Neptune puede tener una instancia de escritura y hasta 15 réplicas de lectura. En caso de que se produzca un error en la instancia de escritura, una réplica de lectura se promoverá automáticamente a instancia de escritura.

Sí, Neptune Database es compatible con la replicación entre regiones a través de la configuración del clúster de Neptune para el uso de Neptune Global Database.

Sí. Puede asignar un nivel de prioridad de conversión a cada instancia del clúster. Si la instancia principal falla, Neptune Database convertirá en principal la réplica con mayor prioridad. Si hay conflicto entre dos o más réplicas con el mismo nivel de prioridad, entonces Neptune convertirá la réplica que tenga el mismo tamaño en la instancia principal.

Puede modificar el nivel de prioridad de una instancia en cualquier momento. Modificar los niveles de prioridad no disparará una conmutación por error.

Puede asignar niveles de prioridad inferiores a las réplicas que no quiera que se conviertan en instancia principal. No obstante, si las réplicas con prioridad superior del clúster están en mal estado o no están disponibles por el motivo que sea, Neptune ascenderá la réplica de menor prioridad.

Puede añadir réplicas de Neptune que comparten el mismo almacenamiento subyacente que la instancia principal. Puede convertir cualquier réplica de Neptune en la principal sin que se produzcan pérdidas de datos, por lo que es posible utilizarla para mejorar la tolerancia a errores en caso de que se produzca algún error en la instancia de base de datos principal. Para aumentar la disponibilidad de la base de datos, solo tiene que crear de 1 a 15 réplicas, y Neptune las incluirá automáticamente en la selección principal para la conmutación por error en el caso de que se produzca una interrupción de la base de datos.

Neptune Database administra automáticamente la conmutación por error para que las aplicaciones puedan reanudar las operaciones de base de datos con la mayor brevedad posible sin intervención administrativa manual. Si dispone de una réplica Neptune en la misma zona de disponibilidad o en otra distinta, al realizar la conmutación por error Neptune cambia el registro de nombre canónico (CNAME) del punto de conexión de la instancia de base de datos principal a una réplica en buen estado, que a su vez se asciende para que sea la nueva principal. La conmutación por error completa normalmente finaliza en 30 segundos o menos.

Además, el punto de conexión de las réplicas de lectura no necesita ninguna actualización de CNAME durante la conmutación por error. Si no dispone de una réplica de Neptune (es decir, existe una única instancia), Neptune tratará de crear una nueva instancia de base de datos en la misma zona de disponibilidad en la que se encuentre la instancia original. Si no es posible, Neptune tratará de crear una nueva instancia de base de datos en una zona de disponibilidad distinta. La conmutación por error completa normalmente finaliza en menos de 15 minutos. La aplicación debe reintentar las solicitudes de la base de datos en caso de que se pierda la conexión.

Neptune Database puede detectar automáticamente cualquier problema con la instancia principal y comenzar a direccionar el tráfico de lectura/escritura a una réplica de Neptune Database. En promedio, la conmutación por error finaliza en 30 segundos o menos. Además, el tráfico de lectura que abastecen las réplicas de Neptune Database se interrumpirá momentáneamente.

Dado que las réplicas de Neptune Database comparten el mismo volumen de datos que la instancia principal, no se produce prácticamente ningún retraso de replicación. Por lo general, observamos retrasos en decenas de milisegundos.

Sí, todas las instancias de Amazon Neptune Database deben crearse en una VPC. Con Amazon VPC, puede definir una topología de red virtual que refleje detalladamente una red tradicional que tenga instaurada en su propio centro de datos. Esto permite ejercer un control total sobre quién puede obtener acceso a las bases de datos de Neptune.

Actualmente, no se puede cifrar una instancia de Neptune que no esté cifrada. Para utilizar el cifrado de Neptune en una base de datos existente no cifrada, cree una nueva instancia de base de datos con el cifrado habilitado y migre sus datos a ella.

El acceso a las bases de datos de Neptune debe realizarse a través del puerto HTTPS especificado cuando se creó la base de datos dentro de la VPC. De ese modo, se proporciona una capa de seguridad adicional a los datos. En la guía del usuario de Amazon Neptune se brindan instrucciones paso a paso sobre cómo conectarse a la base de datos de Neptune.

Neptune Analytics

Puede usar openCypher, un proyecto de código abierto que facilita el uso del lenguaje Cypher para el procesamiento de grafos, la invocación de los algoritmos de Neptune Analytics y la búsqueda de similitudes vectoriales.

Neptune Analytics es ideal para consultas de grafos que acceden a grandes partes de un grafo o a grafos completos. Neptune Analytics es un motor en memoria y puede cargar estos grafos grandes en la memoria para ofrecer una respuesta en segundos. Además, Neptune Analytics puede atender miles de consultas analíticas por segundo mediante una biblioteca de algoritmos de análisis de grafos populares para operaciones como clasificar a las personas influyentes en las redes sociales, detectar grupos para fraudes o encontrar patrones en la actividad de la red. Para las aplicaciones de IA generativas, Neptune Analytics puede almacenar incrustaciones vectoriales y proporcionar búsquedas de similitud vectorial.

Puede seleccionar un clúster de Neptune existente como origen de datos, que se cargará automáticamente en Neptune Analytics.

Neptune Analytics admite 12 algoritmos para la búsqueda de rutas, la detección de comunidades (agrupamiento), la identificación de datos importantes (centralidad) y la cuantificación de la similitud. Los algoritmos de búsqueda de rutas se utilizan para casos prácticos como la planificación de rutas para la optimización de la cadena de suministro, mientras que los algoritmos de centralidad, como el ranking de páginas, identifican a los vendedores más influyentes en un grafo. Del mismo modo, se pueden usar algoritmos como los componentes conectados, los algoritmos de agrupamiento y centralidad en casos de uso de detección de fraudes para determinar si la red conectada es un grupo de amigos o una red de fraude formada por un conjunto de estafadores coordinados.

Sí, Neptune Analytics cumple con ACID con una sólida coherencia.

Neptune Analytics admite un índice de búsqueda vectorial en las incrustaciones (hasta 65 000 dimensiones) almacenadas en los datos de los grafos.

Neptune Analytics admite un índice de búsqueda vectorial en las incrustaciones almacenadas en los datos de los grafos.

No, no necesita una base de datos vectorial independiente con Neptune Analytics. Neptune Analytics admite un índice de búsqueda vectorial en las incrustaciones (hasta 65 000 dimensiones) almacenadas en los datos de los grafos. Neptune Analytics proporciona una búsqueda vectorial eficiente que se puede invocar directamente desde el lenguaje de consultas openCypher que se utiliza para escribir las consultas de grafos.

Neptune Analytics almacena los vectores y admite Hierarchical Navigable Small Worlds (HNSW) para realizar la indexación vectorial y la búsqueda de similitudes. Debe utilizar una base de datos vectorial independiente si desea utilizar diferentes algoritmos de búsqueda de similitud e indexación o si desea utilizar varios índices basados en propiedades diferentes.

Sí, puede usar Neptune Analytics en Amazon VPC. Para el acceso privado, puede crear un grafo con el acceso público desactivado (predeterminado) y especificar las subredes de una VPC. Neptune Analytics creará un punto de conexión de interfaz de VPC administrado por el solicitante por grafo de su VPC. Podrá adjuntar grupos de seguridad y políticas de puntos de conexión a los puntos de conexión, pero no podrá eliminarlos. Se aplicarán los cargos de punto de conexión de la interfaz de VPC estándar.

Sí. Si lo desea, puede habilitar un punto de conexión público específico de un grafo para que se conecte al grafo a través de Internet. Con Neptune Analytics, todos los clientes deben autenticarse, todas las solicitudes deben estar firmadas por SigV4 y todas las conexiones deben usar el ID del grafo para interactuar con el grafo.

Sí, Neptune Analytics ofrece despliegues Multi-AZ con disponibilidad y durabilidad mejoradas. De forma predeterminada, aprovisiona un modo de espera activa en una zona de disponibilidad independiente. Con un modo de espera activa, el tiempo de conmutación por error se expresa en segundos. Sin un modo de espera, el servicio proporciona nueva capacidad informática subyacente en cuestión de minutos.

Para obtener información actualizada de los precios, visite la página de precios de Neptune.

Para obtener más información sobre las regiones en las que Neptune Analytics está disponible, consulte el cuadro de regiones de AWS.

Neptune ML

Gremlin y SPARQL son compatibles con Neptune ML.

Neptune ML proporciona clasificación de nodos, clasificación de clases múltiples, regresión de nodos, clasificación de periferias, clasificación de clase única, regresión de periferias y predicción de enlaces (periferia). Para obtener más información, consulte la Guía del usuario de Neptune.

Puede encontrar detalles sobre precios en la página de precios de Neptune.