- Machine Learning›
- Amazon SageMaker›
- Вопросы и ответы по Amazon SageMaker
Вопросы и ответы по Amazon SageMaker
Page Topics
Общие вопросыОбщие вопросы
Что такое Amazon SageMaker?
В каких регионах AWS доступен SageMaker?
Список регионов с поддержкой сервиса SageMaker см. в списке региональных сервисов AWS. См. также регионы и адреса серверов в общих справочных материалах по AWS.
Какова доступность сервиса SageMaker?
Как обеспечивается безопасность кода в SageMaker?
SageMaker хранит код в томах хранилища для машинного обучения, которые защищены группами безопасности и могут быть дополнительно зашифрованы при хранении.
Какие меры обеспечения безопасности использует сервис SageMaker?
SageMaker обеспечивает шифрование моделей машинного обучения и других системных артефактов как при хранении, так и при пересылке. Запросы к API и консоли сервиса SageMaker выполняются через безопасное SSL-соединение. Права доступа к ресурсам для обучения и развертывания от имени клиента предоставляются сервису SageMaker путем передачи ему соответствующего Управления идентификацией и доступом AWS (AWS IAM). Зашифрованные корзины Простого сервиса хранения данных Amazon (Amazon S3) можно использовать для хранения данных и артефактов моделей, также вы можете применять ключ Сервиса управления ключами AWS (AWS KMS) в блокнотах SageMaker, заданиях по обучению и адресах сервиса, чтобы шифровать подключенный том хранилища для машинного обучения. SageMaker также поддерживает Виртуальное частное облако Amazon (Amazon VPC) и AWS PrivateLink.
Использует ли SageMaker модели, обучающие данные, алгоритмы или предоставляет общий доступ к ним?
SageMaker не использует модели, обучающие данные и алгоритмы клиентов и не предоставляет общий доступ к ним. Мы знаем, что наши клиенты глубоко заинтересованы в обеспечении безопасности и конфиденциальности данных. Поэтому AWS предоставляет клиентам право собственности и контроль над их контентом с помощью простых и эффективных инструментов. Эти инструменты позволяют определить, где будет храниться контент, обеспечить его безопасность при передаче и хранении, а также управлять доступом пользователей к сервисам и ресурсам AWS. Мы также реализуем средства технического и физического контроля, которые предотвращают несанкционированный доступ к пользовательскому контенту или раскрытие информации. Клиенты сохраняют право собственности на свой контент и выбирают, какие сервисы AWS могут обрабатывать, хранить и размещать контент. Мы не получаем доступ к контенту клиентов для каких-либо целей без соответствующего согласия.
Поддерживается ли R в SageMaker?
Да. Вы можете использовать R в инстансах блокнотов SageMaker, в которые входят предварительно установленное ядро R и библиотека reticulate. Библиотека reticulate реализует интерфейс R для Amazon SageMaker Python SDK, благодаря чему специалисты по машинному обучению могут создавать, обучать, настраивать и развертывать модели на базе языка R. Также можно запустить RStudio, интегрированную среду разработки (IDE) для R в Студии Amazon SageMaker.
Что такое студия Amazon SageMaker?
Студия Amazon SageMaker предоставляет единый визуальный веб‑интерфейс, в котором можно проводить все этапы разработки ML. Студия SageMaker обеспечивает полный доступ, контроль и прозрачность каждого шага, необходимого для подготовки, создания, обучения и развертывания моделей. Теперь можно быстро загружать данные, создавать новые блокноты, обучать и настраивать модели, перемещаться между любыми этапами, настраивать эксперименты, сравнивать результаты и развертывать модели в одном месте, что благотворно сказывается на эффективности процесса. Все действия по ML‑разработке, включая создание блокнотов, управление экспериментами, автоматизированное создание моделей, отладку и профилирование, а также обнаружение отклонений в моделях, можно выполнять в едином визуальном интерфейсе студии Amazon SageMaker.
Как рассчитываются цены за использование Студии SageMaker?
Дополнительная плата за использование студии SageMaker не начисляется. Вы оплачиваете только базовые тарифы за вычисления и хранилище для сервисов, которые используете в студии SageMaker.
В каких регионах поддерживается Студия SageMaker?
Регионы с поддержкой Студии Amazon SageMaker можно найти в Руководстве для разработчиков Amazon SageMaker.
Какие типы смещений выявляет SageMaker Clarify?
Каким образом SageMaker Clarify улучшает понимание моделей?
Интеграция SageMaker Clarify с Экспериментами SageMaker позволяет после обучения модели получить граф важности признаков с подробной информацией о вкладе каждого элемента входных данных в общий процесс принятия решений. Эти сведения помогут вам заметить, если некоторый отдельный элемент слишком сильно влияет на поведение модели. SageMaker Clarify также создает объяснения для отдельных прогнозов, доступных через API.
Управление машинным обучением
Какие инструменты управления машинным обучением предоставляет SageMaker?
SageMaker предоставляет специально разработанные инструменты управления машинным обучением на протяжении всего жизненного цикла. С помощью Менеджера ролей Amazon SageMaker администраторы могут определить минимальные разрешения за считаные минуты. Сервис Карты моделей Amazon SageMaker облегчает сбор, извлечение и обмен важной информацией о модели от ее создания до развертывания, а Панель управления моделью Amazon SageMaker позволяет получать информацию о поведении производственной модели в одном месте. Подробнее
см. в разделе Управление машинным обучением с Amazon SageMaker.
Базовые модели
Какие базовые модели доступны в SageMaker JumpStart?
SageMaker JumpStart предоставляет собственные и общедоступные модели. Список доступных базовых моделей см. в разделе Начало работы с Amazon SageMaker JumpStart.
Будут ли мои данные использованы или переданы для обновления базовой модели, предлагаемой клиентам, использующим SageMaker JumpStart?
Нет. Ваши выводы и данные обучения не будут использоваться или передаваться клиентам для обновления или обучения базовой модели, которую SageMaker JumpStart представляет клиентам.
Можно ли увидеть вес моделей и сценарии собственных моделей с помощью SageMaker JumpStart?
Нет. Собственные модели не позволяют клиентам просматривать вес моделей и сценарии.
В каких регионах доступны базовые модели SageMaker JumpStart?
Модели можно найти во всех регионах, где доступна Студия SageMaker, но возможность развертывания модели зависит от модели и доступности инстанса требуемого типа инстанса. Информацию о доступности региона AWS и требуемом инстансе можно найти на странице сведений о модели на Торговой площадке AWS.
Как SageMaker JumpStart помогает защитить мои данные?
Безопасность – главный приоритет AWS, и сервис SageMaker JumpStart разработан для обеспечения защиты. Поэтому SageMaker предоставляет клиентам право собственности и контроль над их контентом с помощью простых и эффективных инструментов. Эти инструменты позволяют определить, где будет храниться контент, обеспечить его безопасность при передаче и хранении, а также управлять доступом пользователей к сервисам и ресурсам AWS.
- Мы не передаем информацию об обучении клиентов и выводах продавцам моделей на Торговой площадке AWS. Аналогичным образом, артефакты модели продавца (например, вес моделей) не передаются покупателю.
- SageMaker JumpStart не использует модели клиентов, данные обучения или алгоритмы для улучшения своего сервиса и не передает третьим сторонам данные обучения клиентов и выводы.
- В SageMaker JumpStart артефакты моделей машинного обучения шифруются при передаче и хранении.
- Согласно Модели общей ответственности AWS, AWS несет ответственность за защиту глобальной инфраструктуры, на которой работают все сервисы AWS. Вы несете ответственность за контроль над контентом, размещенным в этой инфраструктуре.
Используя модель из Торговой площадки AWS или SageMaker JumpStart, пользователи берут на себя ответственность за качество вывода модели и признают возможности и ограничения, указанные в описании отдельной модели.
Какие общедоступные модели поддерживаются SageMaker JumpStart?
SageMaker JumpStart включает более 150 предварительно обученных общедоступных моделей от PyTorch Hub и TensorFlow Hub. Для задач, связанных с компьютерным зрением, например для классификации изображений и обнаружения объектов, вы можете применить такие модели, как RESNET, MobileNet и single-shot detector (SSD). Для текстовых задач, например для классификации предложений и текста, поиска ответов на вопросы, можно использовать модели BERT, RoBERTa и DistilBERT.
Почему я должен использовать SageMaker JumpStart для обмена артефактами машинного обучения с другими сотрудниками моей организации?
С помощью SageMaker JumpStart вы можете ускорить выход на рынок при создании приложений машинного обучения. Модели и блокноты, созданные одной командой в вашей организации, могут быть легко переданы другим командам в вашей организации всего несколькими щелчками мыши. Внутренний обмен знаниями и повторное использование активов могут значительно повысить производительность вашей организации.
Как оценить и выбрать базовые модели?
Машинное обучение с низким уровнем кода
Что такое Amazon SageMaker Canvas?
SageMaker Canvas – это сервис без кода с интуитивно понятным интерактивным интерфейсом, позволяющим создавать высокоточные прогнозы на основе машинного обучения с использованием ваших данных. SageMaker Canvas позволяет получать доступ и объединять данные из различных источников методом перетаскивания в пользовательском интерфейсе, автоматически очищая и подготавливая данные для минимизации ручной очистки. SageMaker Canvas применяет различные современные алгоритмы машинного обучения для поиска высокоточных прогнозных моделей и предоставляет интуитивно понятный интерфейс для составления прогнозов. Вы можете использовать SageMaker Canvas для создания намного более точных прогнозов в различных бизнес-приложениях и с легкостью взаимодействовать со специалистами по работе с данными и аналитиками на вашем предприятии, предоставляя совместный доступ к моделям, данным и отчетам. Дополнительные сведения о SageMaker Canvas см. в разделе вопросов и ответов об Amazon SageMaker Canvas.
Как рассчитываются цены за использование SageMaker Canvas?
При использовании SageMaker Canvas вы платите по факту использования. SageMaker Canvas позволяет интерактивно получать, исследовать и подготавливать данные из различных источников, обучать высокоточные модели машинного обучения на основе ваших данных и генерировать прогнозы. Счет выставляется за два компонента: плата за сессию, основанная на количестве часов, в течение которых используется SageMaker Canvas или выполняется вход в систему, и плата за обучение модели, основанная на размере набора данных, используемого для построения модели. Подробнее см. на странице цен на Amazon SageMaker Canvas.
Рабочие процессы машинного обучения
Как просмотреть все свои обученные модели, чтобы выбрать лучшую из них для запуска в производственной среде?
Какие компоненты SageMaker можно добавить в Конвейеры SageMaker?
Как можно отслеживать компоненты своих моделей в течение всего рабочего процесса машинного обучения?
Как рассчитываются цены за использование Конвейеров SageMaker?
Дополнительная плата за использование Конвейеров SageMaker не начисляется. Вы оплачиваете только базовые тарифы за вычисления и отдельные сервисы AWS, которые используете в Конвейерах SageMaker.
Можно ли использовать Kubeflow с SageMaker?
Каковы принципы оплаты использования компонентов SageMaker для конвейеров Kubeflow?
Дополнительная плата за использование компонентов SageMaker для конвейеров Kubeflow не начисляется.
С оператором в контуре управления
Что такое «оператор в контуре управления», и почему это важно для создания приложений на основе искусственного интеллекта?
«Оператор в контуре управления» — это процесс участия человека во всех этапах жизненного цикла машинного обучения для повышения точности и релевантности моделей. Люди могут выполнять множество задач: от генерации и аннотации данных до анализа и настройки моделей. Вмешательство человека особенно важно для приложений на основе генеративного искусственного интеллекта, когда человек как запрашивает, так и потребляет контент. Поэтому крайне важно, чтобы люди обучали базовые модели выдавать точные, безопасные и релевантные ответы на запросы пользователей. Участие людей может помочь при решении нескольких задач. Во-первых, это создание высококачественных маркированных учебных наборов данных для приложений на основе генеративного искусственного интеллекта посредством обучения под наблюдением (когда человек имитирует стиль, продолжительность и точность реакции модели на запросы пользователя) и обучения с подкреплением на основе обратной связи с человеком (когда человек составляет рейтинг ответов модели и распределяет их по категориям). Во-вторых, это использование данных, генерируемых человеком, при адаптации базовых моделей для решения конкретных задач, либо данных, специфичных для вашей компании и предметной области, для обеспечения релевантности выходных данных модели.
Как можно использовать возможности «оператор в контуре управления» для приложений на основе генеративного искусственного интеллекта, управляемых базовыми моделями?
Возможности «оператор в контуре управления» играют важную роль в создании и улучшении приложений на основе генеративного искусственного интеллекта, управляемых базовыми моделями. Высококвалифицированный персонал, обученный в соответствии с инструкциями по выполнению заданий, может предоставлять обратную связь, рекомендации и материалы, а также оценивать такие виды деятельности, как сбор демонстрационных данных для обучения базовых моделей, корректировка и улучшение образцов ответов, доработка моделей на основе данных компаний и отрасли, защита от токсичности и предвзятости и многое другое. Таким образом, возможности «оператор в контуре управления» способны повысить точность и производительность модели.
В чем разница между использованием сервиса Amazon SageMaker Ground Truth по принципу самообслуживания и под управлением AWS?
Amazon SageMaker Ground Truth предлагает самый полный набор возможностей «оператор в контуре управления». Amazon SageMaker Ground Truth можно использовать двумя способами: по принципу самообслуживания и под управлением AWS. В режиме самообслуживания аннотаторы данных, авторы контента и инженеры подсказок (штатные, управляемые поставщиком или из числа представителей общественности) могут использовать наш пользовательский интерфейс с небольшим объемом кода для ускорения выполнения задач типа «оператор в контуре данных», а также гибко создавать собственные рабочие процессы и управлять ими. В случае использования сервиса под управлением AWS (SageMaker Ground Truth Plus) мы берем на себя самую трудную работу, включая подбор персонала, подходящего для вашего варианта использования, и управление им. SageMaker Ground Truth Plus разрабатывает и персонализирует комплексный рабочий процесс (включая всестороннее обучение персонала и обеспечение качества) и предоставляет в ваше распоряжение квалифицированную рабочую группы под управлением AWS, которая обучена выполнению конкретных задач и отвечает вашим требованиям к качеству, безопасности и соблюдению нормативных требований.
Подготовка данных
Какие типы данных поддерживает SageMaker Data Wrangler?
Как рассчитываются цены за использование SageMaker Data Wrangler?
Вы платите за все ресурсы для вычислений, хранения и обработки данных, применяемые для машинного обучения при работе с SageMaker Data Wrangler. Все подробности ценообразования на SageMaker Data Wrangler можно найти здесь. В рамках Уровня бесплатного пользования AWS работу с SageMaker Data Wrangler можно также начать бесплатно.
Как SageMaker Data Wrangler обрабатывает новые данные, если функции были подготовлены на основе исторических данных?
Как SageMaker Data Wrangler работает с моими процессами CI/CD?
Какую модель использует SageMaker Data Wrangler Quick Model?
Какой размер данных поддерживает SageMaker Data Wrangler?
Работает ли SageMaker Data Wrangler с Хранилищем функций SageMaker?
Что такое Хранилище функций Amazon SageMaker?
Хранилище функций Amazon SageMaker – это полностью управляемая специализированная платформа для хранения, совместного использования признаков для моделей машинного обучения и управления ими. Функции можно обнаруживать и совместно применять для последующего использования моделями и командами при помощи безопасного доступа и контроля, в том числе в аккаунтах AWS. Хранилище функций Amazon SageMaker поддерживает как интерактивные, так и офлайн-функции для вывода выводов в реальном времени, а также пакетного вывода и обучения. Оно также управляет пакетными и потоковыми конвейерами проектирования объектов, чтобы уменьшить дублирование при создании объектов и повысить точность модели.
Как поддерживать согласованность локальных и сетевых функций?
Как рассчитываются цены за использование Хранилища функций SageMaker?
В рамках Уровня бесплатного пользования AWS работу с Хранилищем функций SageMaker можно начать бесплатно. При работе с Хранилищем функций SageMaker вы оплачиваете операции записи в хранилище признаков, а также операции чтения и записи в сетевое хранилище признаков. Сведения о ценах см. на странице цен Amazon SageMaker.
Что такое геопространственные данные?
Зачем мне использовать возможности машинного обучения в SageMaker?
Создание моделей
Как работают блокноты Студии SageMaker?
Блокноты Студии SageMaker – это готовые блокноты Jupyter, которые можно быстро развернуть. Лежащие в основе сервиса вычислительные ресурсы полностью эластичны, что позволяет просто увеличивать или уменьшать их объем, причем любые изменения происходят автоматически в фоновом режиме и не прерывают работу. SageMaker также позволяет делиться блокнотами одним щелчком мыши. Вы можете легко делиться блокнотами с другими – они получат точно такой же блокнот, сохраненный в том же месте.
В блокнотах Студии SageMaker вы можете выполнить вход с помощью корпоративных данных для доступа, используя Центр идентификации IAM. Совместное использование блокнотов в пределах одной команды и между несколькими командами очень легко организовать благодаря автоматическому отслеживанию всех зависимостей для выполнения блокнота по всем рабочим образам, которые инкапсулируются в блокноты при предоставлении совместного доступа.
Как блокноты Студии SageMaker взаимодействуют с другими сервисами AWS?
Как происходит расчет платы за использование блокнотов Студии SageMaker?
Нужно ли платить отдельно за каждый блокнот, созданный и запущенный в Студии SageMaker?
Нет. Вы можете создать и запустить несколько блокнотов на одном вычислительном инстансе. Вы платите только за используемые вычислительные ресурсы, а не за отдельные элементы. Более подробные сведения см. в нашем руководстве по учету.
Помимо блокнотов, вы также можете запускать терминалы и интерактивные оболочки студии SageMaker – и все это на одном вычислительном инстансе. Каждое приложение работает внутри контейнера или образа. Студия SageMaker предоставляет несколько встроенных образов, специально созданных и настроенных для задач аналитики данных и машинного обучения.
Как отслеживать и отключать ресурсы, которые используются моими блокнотами?
Вы можете отслеживать и отключать ресурсы, используемые вашими блокнотами Студии SageMaker, через визуальный интерфейс Студии SageMaker Studio и Консоль управления AWS. Дополнительную информацию см. в документации.
Я использую блокнот Студии SageMaker. Будет ли с меня взиматься плата, если я закрою браузер, вкладку блокнота или просто оставлю браузер открытым?
Взимается ли плата за создание и настройку домена Студии SageMaker?
Нет, плата за создание или настройку домена Студии SageMaker, а также добавление, обновление и удаление профилей пользователей не взимается.
Как просмотреть подробные сведения о расходах на блокноты Студии SageMaker или другие сервисы SageMaker?
Будучи администратором, вы можете просмотреть список детализированных платежей за SageMaker, включая Студию SageMaker, в консоли выставления счетов AWS. В консоли управления AWS для SageMaker выберите «Сервисы» в верхнем меню, введите «Оплата» в поле поиска и выберите «Оплата» в раскрывающемся списке, затем выберите «Счета» на левой панели. В разделе «Сведения» вы можете щелкнуть SageMaker, чтобы развернуть список регионов и перейти к детализированным расходам.
Что такое Лаборатория студии Amazon SageMaker?
В каких случаях рекомендуется использовать Лабораторию Студии SageMaker?
Как Лаборатория Студии SageMaker взаимодействует с другими сервисами AWS?
Обучение моделей
Что такое Amazon SageMaker HyperPod?
Когда следует использовать SageMaker HyperPod?
Поддерживает ли SageMaker распределенное обучение?
Да. SageMaker может автоматически распределять модели глубокого обучения и крупные обучающие наборы по инстансам AWS с графическим процессором за время, во много раз меньшее, чем требуется на создание и оптимизацию стратегий распределения вручную. SageMaker применяет два метода распределенного обучения: параллелизм данных и параллелизм моделей. Параллелизм данных применяется для ускорения обучения: данные разбиваются на равные сегменты с последующей одновременной обработкой на разных инстансах с графическим процессором. Параллелизм моделей удобен в тех случаях, когда модель слишком велика для хранения на одном графическом процессоре: такая модель разделяется на несколько меньших частей и обрабатывается на нескольких графических процессорах. Вам нужно лишь добавить пару строк кода в скрипты обучения на PyTorch и TensorFlow, чтобы SageMaker автоматически применил параллелизм данных или параллелизм моделей, что позволит быстрее создавать и развертывать модели. SageMaker определит оптимальный метод разделения модели, используя алгоритмы секционирования графов, чтобы добиться примерно равного времени обработки на каждом графическом процессоре с минимальным взаимодействием между инстансами. Также SageMaker оптимизирует задания по распределенному обучению с помощью алгоритмов максимально эффективного использования вычислительных и сетевых ресурсов AWS, чтобы добиться почти линейного роста эффективности при масштабировании и выполнять обучение быстрее, чем с помощью реализаций вручную с открытым исходным кодом.
Что такое Эксперименты Amazon SageMaker?
Что такое Отладчик Amazon SageMaker?
Что такое управляемое спотовое обучение?
Как использовать управляемое спотовое обучение?
В каких случаях стоит использовать управляемое спотовое обучение?
Как работает управляемое спотовое обучение?
Нужно ли периодически создавать контрольные точки в процессе управляемого спотового обучения?
Как подсчитать снижение издержек в случае использования заданий по управляемому спотовому обучению?
Какие инстансы можно использовать для управляемого спотового обучения?
В каких регионах поддерживается управляемое спотовое обучение?
Управляемое спотовое обучение поддерживается во всех регионах, в которых на данный момент доступен SageMaker.
Есть ли ограничения на размер пакета данных, который используется для обучения?
С SageMaker для обучения моделей можно использовать пакеты данных любого размера.
Что такое автоматическая настройка модели?
Какие модели поддаются автоматической настройке?
Можно ли использовать автоматическую настройку модели за пределами SageMaker?
В настоящий момент нет. Наибольшего эффекта от автоматической настройки модели можно добиться только в рамках SageMaker.
Какой алгоритм настройки лежит в основе автоматической настройки модели?
В данный момент в качестве алгоритма для настройки гиперпараметров используется специальным образом настроенный алгоритм байесовской оптимизации. Его задача – оптимизировать в процессе настройки заданные пользователем объективные метрики. А точнее, он проверяет объективные метрики завершенных заданий по обучению и использует полученные результаты для изменения комбинации гиперпараметров для следующего задания по обучению.
Рекомендует ли автоматическая настройка модели конкретные гиперпараметры для настройки?
Нет. Влияние различных гиперпараметров на поведение модели зависит от множества факторов. Из-за этого нельзя достоверно заявлять, что один из них важнее других и настраивать следует именно его. Для встроенных в SageMaker алгоритмов мы указываем, является ли тот или иной гиперпараметр настраиваемым.
Сколько времени занимает настройка гиперпараметров?
Продолжительность настройки гиперпараметров зависит от множества факторов, включая объем используемых данных, базовый алгоритм и значения гиперпараметров. Помимо этого пользователи имеют возможность выбрать количество одновременно выполняемых обучающих задач и их общее количество. Все эти факторы влияют на продолжительность настройки гиперпараметра.
Можно ли оптимизировать несколько целевых метрик по аналогии с моделями, чтобы они были одновременно и быстрыми, и точными?
В настоящий момент нет. На данный момент пользователю необходимо указывать единственную целевую метрику для оптимизации или изменить код алгоритма таким образом, чтобы он порождал новую метрику, которая представляет собой среднее взвешенное между двумя и более полезными метриками. Процесс настройки необходимо будет оптимизировать в сторону этой целевой метрики.
Сколько стоит автоматическая настройка модели?
За саму настройку гиперпараметров плата не взимается. Плата начисляется за выполнение заданий по обучению, которые будут запущены процессом настройки гиперпараметров, согласно ценам на обучение моделей.
Что такое стимулированное обучение?
Стимулированное обучение – это техника машинного обучения, позволяющая агенту учиться в интерактивной среде методом проб и ошибок, используя обратную связь по своим действиям и взаимодействиям.
Можно ли обучать модели стимулированного обучения в SageMaker?
Да. В SageMaker можно обучать не только контролируемые и неконтролируемые модели, но и модели стимулированного обучения.
Чем стимулированное обучение отличается от контролируемого обучения?
Несмотря на то что и в контролируемом, и в стимулированном обучении используется сопоставление входных и выходных данных, в отличие от контролируемого обучения, где агенту в качестве обратной связи предоставляется набор шагов для выполнения задачи, в стимулированном обучении используется обратная связь с задержкой, когда поощрительные сигналы оптимизируются для достижения долгосрочной цели посредством выполнения последовательности действий.
В каких случаях следует использовать стимулированное обучение?
В то время как целью техник, используемых в контролируемом обучении, является поиск правильного ответа на основе существующих в учебных данных шаблонов, техники неконтролируемого обучения преследуют цель найти сходства и различия между точками данных. Техники стимулированного обучения (RL), в отличие от этого, призваны научить, как достичь нужного результата даже, когда не совсем понятно, что следует для этого делать. Следовательно, стимулированное обучение больше подходит для обеспечения работы интеллектуальных приложений, когда агент может принимать автономные решения: робототехника, автоматизированные транспортные средства, системы отопления, вентиляции и кондиционирования воздуха, промышленные системы контроля и управления и многое другое.
Какой тип сред можно использовать для обучения моделей стимулированного обучения?
Система стимулированного обучения Amazon SageMaker поддерживает несколько разных сред для обучения соответствующих моделей. Можно использовать такие сервисы AWS, как AWS RoboMaker, среды с открытым исходным кодом или пользовательские среды, разработанные с помощью интерфейсов Open AI Gym, а также коммерческие среды моделирования, такие как MATLAB и SimuLink.
Нужно ли создавать собственные алгоритмы для агентов стимулированного обучения, чтобы обучать соответствующие модели?
Нет, система стимулированного обучения SageMaker включает наборы инструментов для стимулированного обучения, такие как Coach и Ray RLLib, предлагающие реализации алгоритмов для агентов стимулированного обучения (DQN, PPO, A3C и многие другие).
Можно ли использовать собственные библиотеки и реализации алгоритмов стимулированного обучения в системе стимулированного обучения SageMaker?
Да, вы можете использовать собственные библиотеки и реализации алгоритмов стимулированного обучения, помещенные в контейнеры Docker, в системе стимулированного обучения SageMaker.
Можно ли выполнять распределенные развертывания с помощью системы стимулированного обучения SageMaker?
Да. Можно даже выбрать гетерогенный кластер, где обучение проходит в инстансе графического процессора, а моделирование – в нескольких инстансах ЦП.
Развертывание моделей
Что такое асинхронные логические выводы Amazon SageMaker?
Что такое Бессерверный вывод Amazon SageMaker?
Бессерверный вывод Amazon SageMaker – это специализированный вариант бессерверного предоставления моделей, который упрощает развертывание и масштабирование моделей ML. Адреса Бессерверного вывода SageMaker автоматически запускают вычислительные ресурсы и масштабируют их в нужном направлении в зависимости от трафика, исключая необходимость в выборе типа инстанса, запуске распределенных ресурсов или управлении масштабированием. Дополнительно вы можете указать требования к памяти для вашего адреса Serverless Inference. Вы платите только за продолжительность выполнения кода логического вывода и объем обработанных данных, а не за периоды простоя.
В каких случаях рекомендуется использовать Бессерверный вывод SageMaker?
Что такое Provisioned Concurrency для бессерверного инференса SageMaker?
В каких случаях следует использовать Provisioned Concurrency?
При использовании бессерверных адресов по запросу, если адрес какое-то время не получает трафик, а затем внезапно получает новые запросы, может потребоваться некоторое время, чтобы адрес выделил вычислительные ресурсы для обработки запросов. Это называется холодным стартом. Холодный старт также может произойти, если количество одновременных запросов превышает текущее использование одновременных запросов. Время холодного старта зависит от размера модели, времени загрузки модели и времени запуска контейнера.
Чтобы уменьшить вариативность профиля задержки, вы можете дополнительно включить функцию Provisioned Concurrency для бессерверных адресов. Благодаря Provisioned Concurrency ваши бессерверные адреса всегда готовы и могут мгновенно обслуживать большие объемы трафика без холодного старта.
Как начисляется плата за Provisioned Concurrency?
Как и для бессерверного получения логических выводов по требованию, при использовании функции Provisioned Concurrency платить нужно только за объем вычислительных ресурсов, использованных для обработки запросов на получение логических выводов (плата начисляется по миллисекундам), и объем обработанных данных. Вы также платите за использование Provisioned Concurrency в зависимости от настроенной памяти, продолжительности выделенной памяти и степени задействования функции Provisioned Concurrency. Подробнее см. на странице цен на Amazon SageMaker.
Что такое теневое тестирование SageMaker?
Почему нужно использовать SageMaker для теневого тестирования?
Что такое Рекомендательная система Amazon SageMaker для логического вывода?
Рекомендательная система Amazon SageMaker для логического вывода сокращает время, требующееся для запуска моделей машинного обучения в работу, посредством автоматизации тестирования и настройки производительности моделей в ML-инстансах SageMaker. Теперь вы можете использовать Рекомендательную систему SageMaker для логического вывода для развертывания своей модели на адресе, который обеспечивает наилучшую производительность и сводит расходы к минимуму. Приступить к работе с SageMaker Inference Recommender можно за считанные минуты, выбрав тип инстанса и получив рекомендации по оптимальным конфигурациям адреса в течение нескольких часов, исключая недели, требующиеся на тестирование и настройку вручную. При использовании SageMaker Inference Recommender вы платите только за ML-инстансы SageMaker, которые используются во время тестирования нагрузок. Никакие дополнительные платы не начисляются.
В каких случаях следует использовать SageMaker Inference Recommender?
Как Рекомендательная система Amazon SageMaker для логического вывода взаимодействует с другими сервисами AWS?
Возможна ли в сервисе SageMaker Inference Recommender поддержка адресов для нескольких моделей или контейнеров?
Нет. В настоящий момент мы обеспечиваем поддержку только для одной модели на адрес.
Какой тип адресов поддерживает Рекомендательная система Amazon SageMaker для логического вывода?
В настоящий момент мы обеспечиваем поддержку только адресов в реальном времени.
Можно ли использовать Рекомендательную систему SageMaker для логического вывода в одном регионе и тестирования производительности в других регионах?
Мы обеспечиваем поддержку всех регионов, которые поддерживаются в Amazon SageMaker, кроме регионов AWS Китай.
Поддерживает ли Рекомендательная система SageMaker для логического вывода инстансы Amazon EC2 Inf1?
Да. Мы обеспечиваем поддержку всех типов контейнеров. Для Amazon EC2 Inf1, в зависимости от чипа AWS Inferentia, требуется получение артефакта скомпилированной модели с использованием компилятора Neuron или Amazon SageMaker Neo. После получения скомпилированной модели для целевого объекта Inferentia и связанного с ней URI образа контейнера можно использовать Рекомендательную систему SageMaker для логического вывода с целью тестирования производительности для различных типов инстансов Inferentia.
Что такое Монитор модели Amazon SageMaker?
Можно ли получить доступ к инфраструктуре, на которой работает SageMaker?
Нет. SageMaker управляет вычислительной инфраструктурой от имени клиента, что позволяет выполнять проверку работоспособности, применять обновления безопасности и выполнять другие рутинные работы по обслуживанию. Кроме того, сервис дает возможность развертывать артефакты моделей обучения с собственным кодом логического вывода в своей среде хостинга.
Как увеличить размер и производительность модели SageMaker, запущенной в рабочей среде?
Хостинг SageMaker автоматически масштабирует производительность на основании потребностей приложения, используя Application Auto Scaling. Сервис также позволяет вручную изменить количество и тип инстансов при редактировании конфигурации адреса, не останавливая работу системы.
Как выполнять мониторинг SageMaker в рабочей среде?
SageMaker отправляет метрики производительности в Amazon CloudWatch. Это позволяет отслеживать метрики, устанавливать предупреждения и автоматически реагировать на изменения в рабочем трафике. Кроме того, SageMaker записывает журналы в Журналы Amazon CloudWatch, что дает возможность отслеживать и устранять проблемы рабочего развертывания.
Какие модели можно разместить с помощью SageMaker?
SageMaker может разместить любую модель, которая соответствует задокументированной спецификации для образов Docker, используемых для логического вывода. Сюда входят модели, созданные из артефактов моделей SageMaker и кода логического вывода.
Какое количество одновременных запросов API в режиме реального времени поддерживает SageMaker?
SageMaker рассчитан на масштабирование для обеспечения большого количества транзакций в секунду. Точное количество определяется конкретной моделью, а также количеством и типом инстансов, на которых выполнено развертывание.
Как SageMaker поддерживает полностью управляемый хостинг моделей и управление ими?
Что такое пакетное преобразование?
Пакетное преобразование позволяет выполнять прогнозирование на основе крупных или малых пакетов данных. Вам не придется разбивать набор данных на несколько фрагментов или управлять адресами реального времени. С помощью простого API можно запрашивать прогнозы для большого количества записей данных, а затем быстро и просто преобразовывать данные.
Какие варианты адресов развертывания поддерживает SageMaker?
Что такое автоматическое масштабирование для повышения эластичности?
Что такое Менеджер периферии Amazon SageMaker?
Менеджер периферии SageMaker упрощает оптимизацию, защиту, мониторинг и обслуживание моделей машинного обучения на большом числе периферийных устройств (интеллектуальные камеры, роботы, персональные компьютеры и мобильные устройства). Менеджер периферии SageMaker помогает разработчикам машинного обучения работать с моделями машинного обучения на множестве периферийных устройств в любом масштабе.
Нужно ли использовать SageMaker для обучения модели, чтобы применить Менеджер периферии SageMaker?
Нет, не нужно. Вы можете обучить свои модели любым другим способом или выбрать предварительно обученную моделью из открытого источника или от любого поставщика моделей.
Нужно ли использовать SageMaker Neo для компиляции модели, чтобы применить Менеджер периферии SageMaker?
Да, нужно. SageMaker Neo преобразует и скомпилирует модели в исполняемые фалы, которые вы сможете легко упаковать и развернуть на периферийных устройствах. После развертывания пакета модели агент Менеджера периферии SageMaker распакует его и запустит модель на устройстве.
Чем SDK Менеджера периферии SageMaker отличается от среды выполнения SageMaker Neo (dlr)?
Neo dlr представляет собой среду выполнения с открытым исходным кодом, которая выполняет только модели, скомпилированные в сервисе SageMaker Neo. В отличие от dlr с открытым исходным кодом, пакет SDK Менеджера периферии SageMaker содержит агент устройства корпоративного уровня, который обеспечивает дополнительные возможности для безопасности, управления моделями и обслуживания моделей. SDK Менеджера периферии SageMaker подходит для развертывания продукта в большом масштабе.
Как Менеджер периферии SageMaker связан с AWS IoT Greengrass?
Менеджер периферии SageMaker и AWS IoT Greengrass могут совместно работать в вашем решении для Интернета вещей. Упаковав модель машинного обучения с помощью Менеджера периферии SageMaker, вы сможете применить возможность обновления по беспроводной сети AWS IoT Greengrass для развертывания пакета модели на устройствах. AWS IoT Greengrass позволяет удаленно отслеживать устройства Интернета вещей, а Менеджер периферии SageMaker помогает контролировать и поддерживать модели машинного обучения на этих устройствах.
Как Менеджер периферии SageMaker связан с AWS Panorama? В каких случаях следует использовать Менеджер периферии SageMaker, а в каких – AWS Panorama?
AWS предлагает самые широкие и глубокие возможности для запуска моделей на периферийных устройствах. У нас есть сервисы для поддержки широкого набора сценариев использования, включая машинное зрение, распознавание голоса и профилактическое обслуживание.
Если ваша компания собирается применять машинное зрение на камерах и других периферийных устройствах, вы можете использовать AWS Panorama. AWS Panorama предоставит готовые к развертыванию приложения машинного зрения для периферийных устройств. Чтобы начать работу с AWS Panorama, достаточно лишь войти в облачную консоль, указать нужную модель для Amazon S3 или SageMaker, а затем реализовать бизнес-логику в формате скрипта Python. AWS Panorama скомпилирует эту модель для целевого устройства и создаст пакет приложения, который вы сможете всего в несколько щелчков мыши развернуть на соответствующих устройствах. Кроме того, независимые поставщики ПО смогут создать собственные приложения на основе AWS Panorama SDK, а Device SDK позволит производителям устройств сертифицировать свои устройства для работы с AWS Panorama.
Клиенты, которым нужны собственные модели или более детальный контроль за признаками модели, могут воспользоваться Менеджером периферии SageMaker. Управляемый Менеджер периферии SageMaker позволяет подготавливать, выполнять, контролировать и обновлять модели машинного обучения на большом числе периферийных устройств (интеллектуальные камеры, динамики, роботы и т. п.) для использования таких возможностей, как обработка естественного языка, обнаружение мошенничества и профилактическое техническое обслуживание. SageMaker Edge Manager предназначен для разработчиков машинного обучения для периферийных устройств, которым нужен более полный контроль за моделями, например для создания собственных признаков или отслеживания отклонений. Любой разработчик машинного обучения для периферийных устройств может работать с SageMaker Edge Manager через консоль SageMaker и SageMaker API. Менеджер периферии SageMaker позволяет применить всю мощь SageMaker для создания, обучения моделей и их развертывания на периферийных устройствах через облако.
В каких регионах доступен Менеджер периферии SageMaker?
Менеджер периферии SageMaker доступен в шести регионах AWS: Восток США (Северная Вирджиния), Восток США (Огайо), Запад США (Орегон), Европа (Ирландия), Европа (Франкфурт) и Азиатско-Тихоокеанский регион (Токио). Подробнее см. в списке региональных сервисов AWS.
Что такое Amazon SageMaker Neo?
SageMaker Neo позволяет обучить модели машинного обучения однократно, а затем запускать их где угодно в облаке и на периферии. SageMaker Neo автоматически оптимизирует модели, созданные на базе популярных платформ глубокого обучения, которые можно использовать для развертывания на нескольких аппаратных платформах. Оптимизированные модели выполняются до 25 раз быстрее и потребляют менее десятой части ресурсов по сравнению со стандартными моделями машинного обучения.
Требуется ли использовать SageMaker для обучения модели, чтобы использовать SageMaker Neo для преобразования модели?
Нет. Для обученных в любом месте моделей можно применить SageMaker Neo, чтобы оптимизировать их для инстансов машинного обучения SageMaker или устройств с поддержкой AWS IoT Greengrass.
Какие модели поддерживает SageMaker Neo?
В настоящее время SageMaker Neo поддерживает наиболее популярные модели машинного обучения, которые лежат в основе приложений компьютерного зрения и наиболее популярные модели дерева принятия решений, которые сегодня используются в SageMaker. SageMaker Neo оптимизирует производительность моделей AlexNet, ResNet, VGG, Inception, MobileNet, SqueezeNet и DenseNet, обученных в MXNet и TensorFlow, а также обученных в XGBoost моделей классификации и моделей на основе алгоритма Random Cut Forest.
Какие аппаратные платформы поддерживает SageMaker Neo?
Списки поддерживаемых облачных инстансов, периферийных устройств и версий платформ можно найти в документации по SageMaker Neo.
В каких регионах доступен SageMaker Neo?
Список поддерживаемых регионов приведен в списке региональных сервисов AWS.
Тарифы Amazon SageMaker Savings Plans
Что такое экономичные планы Amazon SageMaker?
Экономичные планы SageMaker предлагают гибкую модель ценообразования на основе использования для SageMaker, применяемую при условии, что клиент обязуется использовать постоянный объем вычислительных ресурсов (измеряемый в USD/час) на протяжении одного года или трех лет. Экономичные планы SageMaker – это самый гибкий вариант, помогающий экономить до 64 %. Эти тарифы автоматически применяются к соответствующим инстансам SageMaker ML, включая блокноты Студии SageMaker, блокноты SageMaker по требованию, Обработку SageMaker, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference и SageMaker Batch Transform, независимо от семейства инстансов, размера и региона. Например, для обработки рабочих нагрузок, связанных с получением логических выводов, вместо инстанса ml.c5.xlarge, работающего в регионе Восток США (Огайо), можно в любое время перейти к использованию инстанса ml.Inf1 в регионе Запад США (Орегон) и автоматически продолжать пользоваться тарифами Экономичных планов.
В каких случаях следует использовать экономичные планы SageMaker?
Как начать работу с экономичными планами SageMaker?
Экономичные планы SageMaker можно подключить в Обозревателе затрат AWS на Консоли управления или с помощью API либо командной строки. Пользуясь рекомендациями в AWS Cost Explorer, вы без труда выберете оптимальные обязательства по Savings Plans, чтобы добиться максимальной экономии средств. Рекомендуемые почасовые обязательства основаны на вашей истории использования ресурсов по требованию и личном выборе типа плана, срока действия и способа оплаты. После регистрации плана оплаты по схеме Savings Plans плата за использование вычислительных ресурсов автоматически станет начисляться в соответствии с льготными ценами этого плана, а превышение выбранного объема будет оплачиваться по тарифам схемы по требованию.
Чем отличаются экономичные планы SageMaker от планов экономии вычислительных ресурсов для Amazon EC2?
Разница между Экономичными планами для SageMaker и для Amazon EC2 заключается в перечне поддерживаемых ими сервисов. Экономичные планы SageMaker применяются только к использованию инстансов машинного обучения SageMaker.
Как экономичные планы работают с организациями AWS и консолидированной оплатой?
Тарифы Savings Plans можно приобрести в любом аккаунте группы AWS Organization и консолидированной оплаты. По умолчанию экономия, предоставляемая тарифами Savings Plans, распространяется на все аккаунты в рамках группы AWS Organization и консолидированной оплаты. Однако вы также можете ограничить действие экономичных планов только аккаунтом, в котором они были приобретены.