Возможности Amazon Aurora

Преимущества использования Amazon Aurora

Amazon Aurora – это сервис реляционных баз данных, совмещающий в себе скорость и доступность лучших коммерческих баз данных с простотой и экономичностью баз данных с открытым исходным кодом. Ядро Amazon Aurora полностью совместимо с MySQL и PostgreSQL, поэтому для работы с существующими приложениями и инструментами не потребуется вносить изменения.

Высокая производительность и масштабируемость

Тестирование с использованием стандартных тестов, таких как SysBench, показало результаты производительности, превышающие результаты MySQL в пять раз, а PostgreSQL – в три раза на аналогичном оборудовании. В Aurora используются различные программные и аппаратные методики, чтобы гарантировать, что ядро базы данных будет в полной мере использовать все доступные вычислительные ресурсы, память и сеть. Операции ввода‑вывода используют методы распределенных систем, например кворумы, для стабилизации производительности.

Бессерверная конфигурация Amazon Aurora – это доступная по требованию конфигурация сервиса Amazon Aurora с автомасштабированием, при использовании которой база данных автоматически запускается, отключается и масштабирует свои ресурсы в зависимости от текущих потребностей приложения. Бессерверная конфигурация Amazon Aurora позволяет запускать базы данных в облаке, не беспокоясь об управлении инстансами для баз данных. Также вы можете использовать бессерверные инстансы Aurora v2 вместе с предоставленными инстансами в существующих или новых кластерах баз данных.

С помощью API Службы реляционных баз данных Amazon (Amazon RDS) или Консоли управления AWS можно масштабировать выделенные инстансы, сокращая или расширяя развертывание. Масштабирование вычислительных ресурсов, как правило, занимает лишь несколько минут.

Aurora автоматически масштабирует операции ввода-вывода в соответствии с потребностями самых требовательных приложений, а также увеличивает размер тома базы данных по мере роста потребностей в объеме хранилища. Объем тома увеличивается до 128 ТиБ с шагом 10 ГБ. Нет необходимости выделять избыточный объем хранилища на случай увеличения базы данных в будущем. Если вы используете оптимизированную для ввода-вывода конфигурацию Amazon Aurora для кластеров баз данных, Aurora также обеспечивает экономию затрат до 40 %, если затраты на ввод-вывод превышают 25 % расходов на базу данных Aurora. Чтобы узнать больше о хранилище для Aurora и надежности работы, посетите эту страницу.

Для обработки большого количества запросов со стороны приложений вы можете увеличить пропускную способность чтения путем создания до 15 реплик Amazon Aurora. Реплики Aurora используют то же самое базовое хранилище, что и исходный инстанс, что позволяет уменьшить затраты и избавляет от необходимости производить операции записи на узлах реплики. В результате высвобождается дополнительная вычислительная мощность для обслуживания запросов чтения, а интервал задержки реплики в миллисекундах снижается, часто до однозначных чисел.

Aurora предоставляет адрес для чтения, к которому приложения могут подключаться без отслеживания добавления и удаления конкретных реплик. Также поддерживается автомасштабирование, при котором реплики автоматически добавляются и удаляются в ответ на изменения в заданных метриках производительности. Дополнительные сведения см. в разделе Использование автомасштабирования Amazon Aurora с репликами Aurora.

Aurora поддерживает межрегиональные реплики чтения. Межрегиональные реплики обеспечивают пользователям быструю скорость локального чтения. Для каждого региона можно создать 15 дополнительных реплик Aurora для дальнейшего масштабирования локального чтения. Подробности см. в разделе Глобальная база данных Amazon Aurora.

Пользовательские адреса позволяют распределять и осуществлять балансировку рабочих нагрузок в разных наборах инстансов базы данных. Например, набору реплик Aurora можно назначить использование типа инстанса с высоким объемом памяти, что позволит запустить аналитическую рабочую нагрузку. Пользовательский адрес поможет направить рабочую нагрузку к настроенным соответствующим образом инстансам и при этом изолировать от нее остальные инстансы.

Оптимизированное чтение Amazon Aurora – это новая возможность с привлекательным соотношением цены и производительности, которая позволяет сократить время ответа на запросы до 8 раз и снизить затраты до 30 % по сравнению с инстансами без этой возможности. Она идеально подходит для приложений с большими наборами данных, объем которых превышает объем памяти инстанса базы данных.

В инстансах оптимизированного чтения используется локальное блочное хранилище SSD на базе NVMe, доступное в инстансах r6gd на базе Graviton и r6id на базе Intel. Это позволяет сократить время ожидания запросов приложений с наборами данных, объем которых превышает объем памяти инстанса базы данных. Оптимизированное чтение включает такие улучшения производительности, как многоуровневое кэширование и временные объекты, позволяющие максимально эффективно использовать инстансы базы данных.

Благодаря уменьшению задержки запросов до 8 раз вы можете эффективно выполнять рабочие нагрузки, требующие большого количества операций чтения и ввода-вывода, такие как операционные панели управления, обнаружение аномалий и поиск сходств, с помощью pgvector. Оптимизированное чтение Amazon Aurora PostgreSQL с помощью pgvector до 9 раз увеличивает количество обрабатываемых запросов в секунду для векторного поиска при рабочих нагрузках, превышающих доступную память инстанса. Оптимизированное чтение доступно в версии Aurora, совместимой с PostgreSQL.

Amazon Aurora Parallel Query обеспечивает ускоренное выполнение аналитических запросов по уже существующим данным. Данная возможность может ускорить выполнение запросов до двух порядков, одновременно поддерживая высокую производительность при выполнении основных транзакционных рабочих нагрузок. Перенаправляя обработку запроса на уровень хранилища Aurora, Parallel Query значительно повышает вычислительную мощность, сокращая при этом объем сетевого трафика. Используйте возможность Parallel Query для одновременного выполнения транзакционных и аналитических рабочих нагрузок на одной базе данных Aurora. Возможность параллельного запроса доступна для версии Aurora, совместимой с MySQL.

Amazon DevOps Guru – это сервис облачных операций на основе машинного обучения, который помогает повысить доступность приложения. Amazon DevOps Guru для RDS позволяет использовать аналитические данные, полученные с помощью машинного обучения, для быстрого обнаружения и диагностики проблем, связанных с производительностью реляционной базы данных. Благодаря этому сервису время устранения таких проблем сокращается с нескольких дней до нескольких минут. Разработчики и специалисты DevOps могут с помощью DevOps Guru для RDS автоматически диагностировать основную причину проблем с производительностью и получать обоснованные рекомендации для устранения этих проблем, не обращаясь за помощью к экспертам по базам данных.

Чтобы начать работу, просто перейдите в консоль управления Amazon RDS и включите Аналитику производительности Amazon RDS. После включения аналитики производительности перейдите в консоль Amazon DevOps Guru и включите применение сервиса для ресурсов Amazon Aurora, других поддерживаемых ресурсов или для всего аккаунта сразу.

Высокая доступность и надежность

Amazon RDS постоянно следит за состоянием базы данных Amazon Aurora и базового инстанса Amazon Elastic Compute Cloud (Amazon EC2). В случае сбоя базы данных Amazon RDS автоматически перезапустит базу данных и связанные с ней процессы. Aurora при восстановлении после сбоев не требует воспроизведения журналов повтора базы данных, значительно сокращая время перезапуска. Кроме того, в Amazon Aurora буферный кэш изолирован от собственных процессов базы данных, благодаря чему он сохраняется при перезагрузке.

В Aurora применяется технология развертывания Amazon RDS в нескольких зонах доступности для автоматического обеспечения отказоустойчивости при сбое инстанса. Она позволяет создать до 15 реплик Aurora в любых трех зонах доступности. При отсутствии реплик Aurora в случае сбоя RDS автоматически попытается создать новый инстанс базы данных. Сократите время простоя до минимума, заменив драйверы сообщества для MySQL и PostgreSQL драйверами AWS JDBC Driver для MySQL и AWS JDBC Driver для PostgreSQL с открытым исходным кодом, совместимыми с заменой. Также можно использовать Прокси-сервер RDS для сокращения времени обработки отказа и повышения доступности. При обработке отказа Прокси-сервер Amazon RDS направляет запросы непосредственно новому инстансу базы данных, сокращая время обработки отказа на 66 % и при этом сохраняя подключения приложений.

Для глобально распределенных приложений можно использовать глобальную базу данных Aurora, где одна база данных Aurora может охватывать несколько регионов AWS. Это позволяет обеспечить высокую скорость локального чтения и быстрое аварийное восстановление. Глобальная база данных Aurora использует репликацию на основе хранилища, реплицируя базу данных в нескольких регионах при задержке менее одной секунды. Вторичный регион можно использовать в качестве резервного варианта, если понадобится быстро провести восстановление после регионального снижения производительности или сбоя. Базу данных вторичного региона можно назначить для полных рабочих нагрузок чтения и записи быстрее, чем за минуту. Дополнительные сведения см. в разделе Использование Глобальной базы данных Amazon Aurora.

Том хранилища базы данных Aurora сегментирован на блоки по 10 ГБ и реплицирован в трех зонах доступности, причем во всех зонах хранится по 2 копии каждой записи. Хранилище Aurora обладает отказоустойчивостью и автоматически обрабатывает потерю до двух копий данных без снижения доступности базы данных для операций записи и до трех копий – без снижения доступности для операций чтения. Хранилище Aurora самостоятельно поддерживает свою работоспособность; блоки данных и диски постоянно проверяются на наличие ошибок и автоматически заменяются.

Функциональные возможности резервного копирования в Aurora обеспечивают восстановление инстанса на момент времени. Это позволяет восстановить базу данных на любой момент периода хранения (до секунды) до последних пяти минут использования. Настраиваемый период хранения автоматически созданных резервных копий может составлять до 35 дней. Автоматические резервные копии сохраняются в Amazon Simple Storage Service (Amazon S3), который обеспечивает надежность на уровне 99,999999999 %. Резервное копирование в Aurora выполняется автоматически, инкрементно и непрерывно, а потому не отражается на производительности базы данных.

Снимки состояния БД – это инициированные пользователем резервные копии инстанса, хранимые в Amazon S3 до момента их намеренного удаления пользователем. Они используют автоматизированные инкрементные снимки состояния для ускорения создания и уменьшения требований к хранилищу. Из снимка состояния БД можно в любой момент создать новый инстанс.

Backtrack позволяет быстро вернуть базу данных в состояние на прошедший момент времени без необходимости восстановления данных из резервной копии. Это позволяет быстро исправлять ошибки пользователей, такие как ошибочное удаление таблицы или отдельной строки. Когда возможность Backtrack включена, Aurora сохраняет записи данных в течение настроенного для Backtrack периода. Настройка Backtrack позволяет, к примеру, возвращать базу данных в состояние на любой момент времени из последних 72 часов. Процесс такого возврата занимает несколько секунд даже для больших баз данных, потому что копировать записи данных не требуется. Backtrack позволяет перемещаться назад и вперед по времени, чтобы найти момент непосредственно перед возникшей ошибкой.

Возможность Backtrack также полезна для разработки и тестирования, особенно в ситуациях, когда тест удаляет данные или искажает их иным образом. Достаточно вернуться к исходному состоянию базы данных, чтобы выполнить повторный тестовый запуск. Можно создать сценарий, который вызывает Backtrack через API и затем запускает тест. Это обеспечит простоту интеграции процесса в платформу тестирования. Возможность Backtrack доступна для версии Aurora, совместимой с MySQL.

Высокий уровень безопасности

Aurora работает в виртуальном частном облаке Amazon (Amazon VPC), что помогает изолировать базу данных в своей собственной виртуальной сети и подключиться к локальной ИТ-инфраструктуре с использованием IPsec VPN со стандартным шифрованием. Подробнее о сервисе реляционных баз данных Amazon в VPC см. в руководстве пользователя Amazon RDS. Кроме того, при использовании Amazon RDS можно настроить параметры брандмауэра и управлять сетевым доступом к инстансам БД.

Сервис Aurora интегрирован с Управлением идентификацией и пользователями AWS (IAM) и предоставляет возможность управлять действиями пользователей AWS IAM и групп на конкретных ресурсах для Aurora (например, инстансах БД, снимках состояния БД, группах параметров БД, подписках на события БД, группах настроек БД). Кроме того, движок позволяет присваивать теги ресурсам Aurora и управлять действиями пользователей и групп IAM на ресурсах, имеющих общий тег и значение тега. Подробнее об интеграции IAM см. на странице сведений об аутентификации баз данных IAM.

Aurora поддерживает шифрование баз данных с использованием ключей, создаваемых и управляемых с помощью AWS Key Management Service (KMS). В инстансе базы данных Aurora с шифрованием шифруются все данные, хранимые в базовой системе хранения, а также автоматические резервные копии, снимки состояния и реплики чтения в том же кластере. Для защиты передаваемых данных в Aurora используется протокол SSL с шифрованием AES‑256.

Aurora помогает вести журнал событий базы данных с минимальным воздействием на ее производительность. Такие журналы в дальнейшем можно использовать для анализа в целях обеспечения безопасности или соответствия нормативным требованиям, администрирования базы данных, управления ими и т. д. Кроме того, для мониторинга активности можно отправлять журналы аудита в Amazon CloudWatch.

Amazon GuardDuty обеспечивает обнаружение угроз для Aurora и помогает выявлять потенциальные угрозы для данных, которые хранятся в базах данных Aurora. Защита GuardDuty для RDS создает профили и следит за действиями при входе в имеющиеся и новые базы данных в вашем аккаунте, а также с помощью специальных моделей машинного обучения точно обнаруживает подозрительные входы в базы данных Aurora. При обнаружении потенциальной угрозы GuardDuty генерирует нарушение безопасности со сведениями о базе данных и подробной информацией о контексте подозрительной деятельности. Интеграция Aurora с GuardDuty предоставляет непосредственный доступ к журналам событий баз данных без необходимости в их изменении и не снижает производительность баз данных.

Экономичность

Предварительные обязательства касательно Aurora отсутствуют. Вы платите почасово за каждый запущенный инстанс, а когда закончите работу с инстансом БД Aurora, то можете удалить его. Необходимости выделять избыточный объем хранилища нет, поэтому оплате подлежит только тот, который фактически используется. Более подробные сведения см. на странице цен на Aurora.

Aurora позволяет оптимизировать расходы на базу данных, выбрав один из двух вариантов конфигурации в зависимости от ваших потребностей в соотношении цены и производительности и предсказуемости цены, независимо от потребления операций ввода-вывода вашим приложением. Два варианта конфигурации: оптимизированная для ввода-вывода Aurora и стандартная конфигурация Aurora. Ни один из вариантов не требует предварительного выделения ресурсов ввода-вывода или хранения, и оба могут масштабировать ввод-вывод для обеспечения работы самых требовательных приложений.

Оптимизированная для ввода-вывода конфигурация Aurora – это конфигурация кластера баз данных. Она обеспечивает более высокую ценовую эффективность для клиентов, использующих интенсивные операции ввода-вывода, например, в системах обработки платежей, электронной коммерции и финансовых приложениях. Если затраты на операции ввода-вывода превышают 25 % от общих расходов на базу данных Aurora, вы можете сэкономить до 40 % на рабочих нагрузках с большим количеством операций ввода-вывода с помощью оптимизированной для ввода-вывода конфигурации Aurora. Используя оптимизированную для ввода-вывода конфигурацию Aurora, вы платите за инстансы и хранилище баз данных. Плата за операции ввода-вывода при чтении и записи не взимается, что обеспечивает предсказуемость цен для всех приложений независимо от непостоянства данных ввода-вывода.

Стандартная конфигурация Aurora – это конфигурация кластера баз данных, которая предлагает экономически эффективную цену для абсолютного большинства приложений с низким или умеренным количеством операций ввода-вывода. Используя стандартную конфигурацию Aurora, вы платите за инстансы баз данных, хранилище и операции ввода-вывода с оплатой по запросу.

Затраты на ввод-вывод составляют значительную часть стоимости базы данных аналитического приложения с интенсивной нагрузкой. Операции ввода‑вывода в Amazon Aurora – это операции, которые выполняются ядром БД Aurora при обращении к уровню виртуализированного хранилища, построенного на базе твердотельных накопителей. Каждая операция чтения страницы базы данных считается за одну операцию ввода‑вывода. Ядро базы данных Aurora отправляет операции чтения на уровень хранилища для извлечения страниц базы данных, отсутствующих в буферном кэше. Каждая страница базы данных занимает 8 КБ в версии Aurora, совместимой с PostgreSQL, или 16 КБ в версии Aurora, совместимой с MySQL.

Aurora была разработана для устранения излишних операций ввода‑вывода, что позволяет снизить издержки и обеспечить доступность ресурсов для обслуживания трафика чтения/записи. Операции ввода-вывода потребляются только при отправке записей журнала транзакций на уровень хранилища для постоянного хранения. Операции ввода-вывода при записи исчисляются в единицах по 4 КБ. Например, запись журнала транзакций размером 1,024 байта считается одной операцией ввода‑вывода. При этом ядро базы данных Aurora может создавать пакеты из параллельных операций записи с журналами транзакций менее 4 КБ в целях оптимизации потребления ресурсов ввода‑вывода. В отличие от традиционных ядер базы данных, Aurora никогда не отправляет измененные страницы базы данных на уровень хранилища для еще большей экономии ресурсов ввода‑вывода.

Объем операций ввода‑вывода, потребляемых инстансом Aurora, можно узнать в Консоли управления AWS. Чтобы найти объем потребляемых ресурсов ввода‑вывода, перейдите в раздел консоли RDS, найдите свой список инстансов, выберите в нем инстансы Aurora, а затем посмотрите на показатели «Billed read operations» (Оплачиваемые операции чтения) и «Billed write operations» (Оплачиваемые операции записи) в разделе мониторинга.

При настройке кластеров баз данных на стандартную конфигурацию Aurora взимается плата за операции ввода-вывода для чтения и записи. При настройке кластеров баз данных на оптимизированную для ввода-вывода конфигурацию Aurora плата за операции ввода-вывода для чтения и записи не взимается. Дополнительные сведения о ценах на операции ввода-вывода см. на странице цен Amazon Aurora.

Оптимизированное чтение Aurora для Aurora PostgreSQL предлагает клиентам, которые используют чувствительные к задержкам приложения и большие рабочие наборы, привлекательную альтернативу по соотношению цены и качества, чтобы они могли выполнить требования по соглашениям об уровне обслуживания. Кроме того, заказчики могут более гибко расширять свои наборы данных без необходимости часто увеличивать размер инстансов баз данных для расширения объема памяти. Оптимизированное чтение включает такие улучшения производительности, как многоуровневое кэширование и временные объекты.

Многоуровневое кэширование позволяет сократить время ожидания запросов до 8 раз и до 30 % снизить затраты на приложения, требующие большого количества операций чтения и ввода-вывода, таких как операционные панели управления, обнаружение аномалий и поиск векторных сходств. Данные преимущества реализуются благодаря автоматическому переносу данных кэширования из буферного кэша базы данных в памяти в локальное хранилище для ускорения последующего доступа к этим данным. Многоуровневое кэширование доступно только для Aurora PostgreSQL с конфигурацией, оптимизированной для операций ввода-вывода Aurora.

Временные объекты ускоряют обработку запросов, размещая временные таблицы, созданные Aurora PostgreSQL, в локальное хранилище, что повышает производительность запросов, которые включают сортировку, агрегирование хэшей, высоконагруженные соединения и другие операции с интенсивным использованием данных.

Полное управление

Начать работу с Aurora очень просто. Просто запустите новый инстанс БД Aurora, используя Консоль управления Amazon RDS, один вызов API или CLI. Для инстансов БД Aurora предварительно настроен набор параметров и установок, соответствующих выбранному классу инстанса БД. Можно запустить инстанс БД и подключить приложение. Процесс занимает несколько минут и не требует дополнительной настройки. Группы параметров БД предоставляют возможность точного управления и подробной настройки базы данных.

Сервис Aurora предоставляет доступ к метрикам Amazon CloudWatch для инстансов БД без дополнительной платы. С Консоли управления AWS можно просматривать более 20 ключевых эксплуатационных метрик инстанса БД, включая использование вычислительных ресурсов, памяти и хранилища, пропускную способность запросов, коэффициент попадания в кэш и активные соединения. Можно также использовать расширенный мониторинг для сбора метрик инстанса операционной системы, на котором работает база данных. Вам также доступно средство для мониторинга баз данных Аналитика производительности Amazon RDS, которое упрощает обнаружение и исправление проблем с производительностью. На простой панели управления в визуальном формате отображаются сведения о текущей загрузке базы данных. И, наконец, можно использовать Amazon DevOps Guru для RDS для упрощения обнаружения проблем с производительностью, автоматической идентификации исходной причины проблем с производительностью и получения интеллектуальных рекомендаций, которые помогут решить проблему без помощи специалистов по базам данных.

Развертывание Amazon RDS без перерыва в обслуживании позволяет вам проводить обновление баз данных версии Aurora, совместимой с MySQL, и Aurora, совместимой с PostgreSQL, безопаснее, проще, быстрее и без потери данных. За несколько шагов развертывание Amazon RDS без перерыва в обслуживании создает промежуточную среду, которая является зеркалом рабочей среды, и синхронизирует обе среды с использованием логической репликации. Вы можете вносить изменения, например обновлять основные и дополнительные версии, модифицировать схемы и изменять значения параметров без снижения производительности вашей рабочей нагрузки.

Во время продвижения промежуточной среды развертывание Amazon RDS без перерыва в обслуживании блокирует запись как в среду с новой версией приложения, так и в среду с текущей его версией до завершения переключения. Развертывание Amazon RDS без перерыва в обслуживании использует встроенные ограничения переключения, которые вызывают тайм-аут переключения, если оно занимает больше времени, чем указано в параметре максимально допустимого простоя, выявляет ошибки репликации, проверяет работоспособность инстансов и выполняет другие функции.

Aurora будет обновлять базу данных до последней версии ПО со всеми установленными исправлениями. Система управления версиями ядра БД позволяет указать в настройках, должны ли в инстансе применяться исправления, и если да, то когда именно. Aurora использует установку исправлений с нулевым временем простоя, если такое возможно. Как только появляется соответствующее временное окно, инстанс обновляется в текущем состоянии, сеансы приложений сохраняются, а механизм базы данных перезапускается в процессе выполнения установки исправления, что приводит лишь к временному снижению пропускной способности (приблизительно на пять секунд).

Aurora может отправлять оповещения о важных событиях баз данных, например о выполнении автоматической обработки отказа, по электронной почте или с помощью SMS. Через Консоль управления AWS или Amazon RDS API можно подписаться более чем на 40 различных событий БД, связанных с базами данных Aurora.

Aurora поддерживает быстрое и эффективное клонирование. К примеру, клонирование кластеров баз данных объемом в несколько терабайтов занимает лишь пару минут. Клонирование актуально в самых разных ситуациях, включая разработку и тестирование приложений, обновление баз данных и выполнение аналитических запросов. Немедленная доступность данных позволяет значительно ускорить реализацию проектов по разработке и обновлению программного обеспечения, а также повысить точность аналитики.

Клонировать базу данных Aurora можно всего за несколько шагов. При этом плата за хранение данных взимается только в том случае, если вы используете дополнительное место для хранения изменений данных.

Ручная остановка и запуск базы данных Aurora осуществляется всего за несколько шагов. Это упрощает работу и позволяет использовать Aurora для разработки и тестирования, когда не требуется постоянная работа базы данных. При остановке базы данных данные не удаляются. Дополнительную информацию см. в документации о запуске и остановке.

Интеграции с нулевым использованием ETL

Интеграция Amazon Aurora с нулевым использованием ETL с Amazon Redshift дает возможность задействовать машинное обучение и функции аналитики в реальном времени вместе с Amazon Redshift для обработки петабайтов транзакционных данных из Aurora, устраняя необходимость создавать и контролировать сложные конвейеры данных, выполняющие операции извлечения, преобразования и загрузки (ETL). Транзакционные данные автоматически и непрерывно реплицируются в течение нескольких секунд после записи в Aurora и становятся доступны в Amazon Redshift без дополнительных операций.

Как только данные станут доступны в Amazon Redshift, вы можете сразу приступить к их анализу и получить целостные прогнозные результаты с помощью расширенных функций обмена данными, материализованных представлений и машинного обучения Amazon Redshift. Вы можете объединять несколько таблиц из разных кластеров баз данных Aurora и выполнять репликацию данных в одно хранилище данных Amazon Redshift, чтобы получать унифицированную аналитику по нескольким приложениям и источникам данных. Если вы используете бессерверную конфигурацию Aurora и бессерверный Amazon Redshift, то сможете генерировать аналитику по транзакционным данным в режиме, близком к реальному времени, без необходимости управлять инфраструктурой для конвейеров данных. Подробнее см. в документации по интеграции Aurora с нулевым использованием ETL с Amazon Redshift.

Генеративный искусственный интеллект

Aurora предлагает возможности, позволяющие моделям машинного обучения и генеративного искусственного интеллекта работать с данными, хранящимися в Aurora, в режиме реального времени без перемещения данных. В версии Amazon Aurora, совместимой с PostgreSQL, вы можете использовать возможности векторных баз данных для хранения, поиска, индексирования и запроса внедрений машинного обучения с помощью расширения pgvector.

Векторное встраивание – это числовое представление, отражающее семантическое значение контента, такого как текст, изображения и видео. Генеративный искусственный интеллект и другие системы искусственного интеллекта и машинного обучения используют вложения для отражения семантического значения контента, введенного в большую языковую модель (LLM). В базах данных Aurora можно хранить встраивания из моделей машинного обучения и искусственного интеллекта, например из Amazon Bedrock и Amazon SageMaker. Ознакомьтесь с нашей документацией о версиях расширений для Aurora PostgreSQL.

Сервис Amazon Aurora PostgreSQL доступен в формате базы знаний для Amazon Bedrock. Это позволяет подключать частные источники данных вашей организации к базовым моделям (FM) и реализовывать на них автоматизированные рабочие процессы генерации ответов, дополненных результатами поиска (RAG). Это сделает модели FM более осведомленными о вашей конкретной области и организации. Ознакомьтесь с нашей документацией о том, как использовать Aurora PostgreSQL в качестве базы знаний для Amazon Bedrock.

Машинное обучение Aurora (Aurora ML) также упрощает добавление прогнозирования на основе модели, созданной с помощью генеративного искусственного интеллекта, в базу данных Aurora. Aurora ML предоставляет модели машинного обучения в виде функций SQL, что позволяет использовать стандартный SQL для вызова моделей машинного обучения, передачи им данных и возврата прогнозов, текстовых сводок или мнений в качестве результатов запроса. С помощью Aurora ML вы можете добавлять новые встраивания в базу данных Aurora PostgreSQL с расширением pgvector в режиме реального времени, используя периодические вызовы модели SageMaker или Amazon Bedrock, которая возвращает актуальные версии встраиваний.

Поддержка миграции

Aurora работает со стандартными инструментами импорта и экспорта MySQL. Кроме того, можно просто создать новую базу данных Aurora из снимка состояния БД Amazon RDS для MySQL. Операции по миграции, использующие снимки состояния базы данных, как правило, занимают менее одного часа, однако точное время миграции зависит от объема и формата перемещаемых данных.

Вместо этого Сервис миграции баз данных AWS (AWS DMS) предлагает собственные встроенные инструменты для беспроблемной миграции, с которыми можно работать в консоли DMS. Если нет необходимости выделять или масштабировать инстансы репликации, вы можете начать миграцию базы данных несколькими щелчками мыши и платить только за использованное время на почасовой основе.

Кроме того, можно самостоятельно настроить репликацию на основе бинарных логов между версией базы данных Aurora, совместимой с MySQL, и внешней базой данных MySQL, работающей в облаке AWS или за его пределами.

Стандартные инструменты импорта и экспорта PostgreSQL работают с Aurora, включая pg_dump и pg_restore. Также Aurora поддерживает импорт снимков состояния из Amazon RDS для PostgreSQL и репликацию с использованием Сервиса миграции баз данных AWS (AWS DMS).

Aurora предоставляет идеальную среду для перемещения рабочих нагрузок баз данных из коммерческих баз данных. Aurora обладает функциональными возможностями, которые близко соответствуют возможностям движков коммерческих баз данных, и обеспечивают производительность, долговечность и высокую доступность на корпоративном уровне, что требуется для большинства рабочих нагрузок корпоративных баз данных. Сервис миграции баз данных AWS (AWS DMS) может помочь ускорить миграцию баз данных в Aurora с помощью таких управляемых функций, как преобразование схемы DMS и бессерверная конфигурация DMS. Преобразование схемы DMS автоматически оценивает и преобразует схемы и исходные объекты для совместимости с целевым кластером Aurora. В то же время бессерверная конфигурация DMS автоматизирует выделение, мониторинг и масштабирование ресурсов для миграции.

Babelfish для Aurora PostgreSQL – это новая функция версии Aurora, совместимой с PostgreSQL, которая дает Aurora возможность распознавать команды от приложений, написанных для Microsoft SQL Server. С помощью Babelfish Aurora PostgreSQL может понимать проприетарный диалект Microsoft SQL Server T-SQL и поддерживать тот же протокол связи, поэтому ваши приложения, которые были изначально написаны для SQL Server, теперь могут работать с Aurora с меньшим количеством изменений. В результате уходит меньше усилий на изменение и перенос приложений, которые ранее работали на SQL Server 2005 или новее, на Aurora, что означает более быструю и экономичную миграцию с меньшими рисками. Babelfish – это встроенная возможность Aurora, которая не требует дополнительной платы. Включить Babelfish в кластере Aurora можно всего за несколько шагов в консоли RDS.

Эффективность разработчиков

Trusted Language Extensions (TLE) для PostgreSQL – это комплект разработчика и проект с открытым исходным кодом, который позволяет быстро создавать высокопроизводительные расширения и безопасно выполнять их в Amazon Aurora без необходимости получения сертификата AWS на код. Разработчики могут использовать популярные доверенные языки, например JavaScript, PL/pgSQL, Perl и SQL, для безопасного написания кода расширений. Назначение TLE – предотвращать доступ к небезопасным ресурсам и ограничивать дефекты расширений одним подключением к базе данных. Администраторы баз данных получают возможность для точного онлайн-контроля, что позволяет решать, кому разрешено устанавливать расширения, и могут создать модель разрешений для их запуска. TLE доступны для клиентов Aurora без дополнительной платы.

Aurora предлагает возможности машинного обучения напрямую из базы данных, позволяя добавлять прогнозы на основе машинного обучения к вашим приложениям с помощью знакомого языка программирования SQL. Благодаря простой, оптимизированной и безопасной интеграции сервисов Aurora с машинным обучением AWS вы получаете доступ к множеству алгоритмов машинного обучения без необходимости создавать специальные возможности интеграции или перемещать данные. Подробнее о машинном обучении Aurora.

Aurora может работать в связке с Прокси-сервером Amazon RDS. Этот полностью управляемый прокси-сервер базы данных с высоким уровнем доступности повышает возможности масштабирования приложений, обеспечения безопасности и отказоустойчивости при сбоях в базе данных. RDS Proxy позволяет приложениям объединять подключения в базе данных в пул и предоставлять к ним доступ, улучшая эффективность базы данных и масштабируемость приложений. Он снижает время отказа, автоматически подключаясь к новому инстансу базы данных, при этом сохраняя подключения со стороны приложений. Он повышает безопасность благодаря интеграции с AWS IAM и Менеджером секретов AWS.

API данных – это простой в использовании и безопасный API HTTPS для выполнения SQL-запросов к базам данных Aurora, который ускоряет разработку современных приложений. API данных решает задачи по настройке сети и приложений, необходимые для безопасного подключения к базе данных Aurora, поэтому доступ к Aurora так же прост, как и вызов API. API данных исключает использование драйверов баз данных и программного обеспечения для объединения подключений на стороне клиента. Он также улучшает масштабируемость приложений за счет автоматического объединения и совместного использования подключений к базе данных. API данных повышает безопасность благодаря интеграции с AWS IAM и Менеджером секретов AWS.

Разработчики могут вызывать API данных через приложения, созданные с помощью AWS SDK. API данных также предоставляет доступ к базам данных Aurora для AWS AppSync GraphQL API.