Amazon FSx›
FSx для Lustre›
Клиенты FSx для Lustre

Клиенты Amazon FSx для Lustre

Adobe

Компания Adobe была основана 40 лет назад с простой целью: создавать инновационные продукты, которые изменят мир. Adobe предлагает революционные технологии, позволяющие людям, где бы они ни находились, фантазировать, творить и воплощать в жизнь любые цифровые проекты.

Задача. Вместо того, чтобы полагаться на модели с открытым исходным кодом, компания Adobe решила обучить собственные базовые модели генеративного искусственного интеллекта, предназначенные для творческих задач.

Решение. Компания Adobe наладила супермагистраль для искусственного интеллекта на AWS, чтобы создать платформу обучения искусственного интеллекта и конвейеры данных для быстрой итерации моделей. Она создала свое решение, используя инстансы Amazon Elastic Compute Cloud (Amazon EC2) P5 и P4d на базе графических процессоров NVIDIA, Эластичный сервис Amazon Kubernetes (Amazon EKS), Магазин эластичных блоков Amazon (Amazon EBS) и Интерфейс эластичной матрицы (EFA) Amazon. Компания Adobe также использовала Amazon Simple Storage Service (Amazon S3) в качестве озера данных и основного репозитория для огромных массивов данных. Высокопроизводительное файловое хранилище Amazon FSx для Lustre позволило Adobe обеспечить быстрый доступ к данным и сделать так, чтобы ресурсы графического процессора никогда не простаивали.

Хотеть создать собственное облако для искусственного интеллекта и делать это – разные вещи, но партнерство с AWS позволило нам сосредоточиться на наших конкурентных преимуществах

Александру Костин, вице-президент по генеративному искусственному интеллекту и платформе Sensei, Adobe

Ознакомьтесь с примером использования Adobe. »
LG AI Research

LG AI Research Совместно с ведущими мировыми экспертами в области искусственного интеллекта LG AI Research нацелена на то, чтобы стать лидером следующей эпохи искусственного интеллекта и вместе с вами реализовать перспективы многообещающего будущего, обеспечив оптимальные условия для исследований и используя самые современные технологии искусственного интеллекта.

Задача: LG AI Research было необходимо внедрить в производство свою базовую модель EXAONE за один год. EXAONE, что расшифровывается как «экспертный искусственный интеллект для всех», представляет собой мультимодальную модель с 300 миллиардами параметров, в которой используются как изображения, так и текстовые данные.

Решение: компания LG AI Research использовала Amazon SageMaker для обучения своей крупномасштабной базовой модели и Amazon FSx для Lustre для распределения данных по инстансам с целью ускорения обучения моделей. LG AI Research требовалось запустить в производство свою базовую модель EXAONE за один год. Компания LG AI Research успешно внедрила EXAONE за один год и сократила расходы примерно на 35 процентов, устранив необходимость в отдельной группе по управлению инфраструктурой.

Прочитайте тематическое исследование LG AI Research. »
Paige

Paige — ведущий поставщик услуг по цифровой трансформации патологии, предлагающий полномасштабное веб-решение с поддержкой искусственного интеллекта, которое обеспечивает эффективность и надежность диагностики рака.

Проблема: локальные решения Paige были использованы до максимума. Их целью было обучение моделей искусственного интеллекта и машинного обучения для лечения онкологической патологии. Компания Paige обнаружила, что чем больше у них вычислительных мощностей, тем быстрее они могут обучать свои модели и решать диагностические проблемы.

Решение: для выполнения рабочих нагрузок по обучению системы машинного обучения компания Paige выбрала инстансы Amazon EC2 P4d на базе графических процессоров NVIDIA A100 Tensor Core, которые обеспечивают высокую производительность для машинного обучения и приложений высокопроизводительных вычислений в облаке. Paige использует Amazon FSx для Lustre — полностью управляемое общее хранилище, созданное на основе популярной высокопроизводительной файловой системы. Компания подключила этот сервис к некоторым корзинам Amazon S3, что помогает командам разработчиков обрабатывать петабайты входных данных машинного обучения без предварительной обработки данных в высокопроизводительных файловых системах вручную. Результатом решения AWS стало то, что Paige может обучать в 10 раз больший объем локальных данных, используя инфраструктуру AWS для машинного обучения. Кроме того, благодаря Amazon EC2 и Amazon FSx для Lustre внутренние рабочие процессы Paige ускорились на 72%.

Подключив Amazon FSx для Lustre к Amazon S3, мы сможем без проблем обрабатывать десятикратный объем данных по сравнению с когда-либо использованным в локальной инфраструктуре.

Александр ван Эк, инженер по искусственному интеллекту, компания Paige

Прочитайте тематическое исследование «Paige работает в области лечения рака с помощью гибридного рабочего процесса машинного обучения, созданного на основе инстансов Amazon EC2 P4d». »
Toyota

Toyota Research Institute выбирает FSx для Lustre, чтобы сократить продолжительность машинного обучения распознаванию объектов.

Toyota Research Institute (TRI) собирает и обрабатывает большие объемы данных датчиков, полученных во время тестирования автономных транспортных средств (AV). Каждый набор обучающих данных помещается на локальное устройство NAS и передается в Простой сервис хранения данных Amazon (Amazon S3), а затем обрабатывается на мощном вычислительном кластере GPU. Компании TRI требовалась высокопроизводительная файловая система для сопряжения с их вычислительными ресурсами, ускорения обучения моделей машинного обучения и анализа данных для специалистов компании по обработке данных.

Нам нужна была параллельная файловая система для наборов обучающих данных машинного обучения, и мы выбрали Amazon FSx для Lustre из-за более высокой доступности и надежности по сравнению с нашими устаревшими файловыми системами. Интеграция с сервисами AWS, включая S3, также сделала его предпочтительным вариантом для нашего высокопроизводительного файлового хранилища.

Дэвид Флюк, инженер-программист, Toyota Research Institute
Shell

Shell предлагает динамичный портфель вариантов энергетики — от нефти, газа и нефтехимии до ветра, солнца и водорода. Shell гордится тем, что поставляет своим клиентам энергию, необходимую для обеспечения их жизни.

Проблема: Shell использует высокопроизводительные вычисления для построения, тестирования и проверки моделей. С 2020 по 2022 год использование графических процессоров в среднем составляло менее 90%, что привело к задержкам в реализации проектов и ограничениям на эксперименты с новыми алгоритмами.

Решение: Shell расширяет свои локальные вычислительные мощности, используя кластеры Amazon EC2 и Amazon FSx для Lustre в облаке. Это решение дает Shell возможность быстро масштабировать в большую и меньшую сторону и приобретать дополнительные вычислительные мощности только при их необходимости. Графические процессоры Shell теперь используются полностью, что снижает затраты на вычисления и ускоряет тестирование моделей машинного обучения.
Storengy

Storengy, дочерняя компания группы ENGIE, – ведущий поставщик природного газа. Компания предлагает предприятиям по всему миру услуги по хранению газа, геотермальные решения, безуглеродное производство и технологии хранения энергии.

Чтобы обеспечить надлежащее хранение своих продуктов, Storengy использует высокотехнологичные симуляторы для оценки подземного хранения газа, что требует широкого использования рабочих нагрузок высокопроизводительных вычислений (HPC). Кроме того, компания использует технологию HPC для выполнения работ по разведке и изучению природного газа.

С AWS у нас есть масштабируемость и высокая доступность для одновременного выполнения сотен симуляций. Кроме того, решение автоматически масштабируется в большую или меньшую сторону в зависимости от пиковых рабочих нагрузок, то есть наша среда высокопроизводительных вычислений работает стабильно, без каких-либо сюрпризов.

Жан-Фредерик Тебо, инженер, Storengy
Smartronix

Smartronix использует FSx для Lustre, чтобы обеспечить надежную и высокую производительность развертывания SAS Grid.

Smartronix предоставляет облачные решения, средства кибербезопасности, системную интеграцию, всемирную аналитику C5ISR и аналитику данных, а также специализированное проектирование для многих ведущих мировых коммерческих и федеральных организаций. Smartronix использовала SAS Grid для анализа и предоставления ежедневной статистики COVID по всему штату и обнаружила, что администрировать их самоуправляемую параллельную файловую систему и защищать ее сложно.

Сотрудничество с AWS и использование их управляемых решений, таких как FSx для Lustre, позволило нам лучше обслуживать наших клиентов, а именно повысить доступность и на 29 % снизить затраты по сравнению с самоуправляемыми файловыми системами.

Роб Мунье, старший архитектор решений, Smartronix
Netflix

Netflix — это стриминговый сервис, который предлагает широкий выбор отмеченных наградами сериалов, художественных и документальных фильмов, аниме и многого другого.

Задача: Netflix использует крупномасштабное распределенное обучение для мультимедийных моделей машинного обучения, для создания постпроизводственных миниатюр, визуальных эффектов и трейлеров для тысяч видео и миллионов клипов. Межузловая репликация и 40-процентный простой графического процессора Netflix приводили к длительному ожиданию.

Решение: Компания Netflix изменила архитектуру конвейера загрузки данных и повысила его эффективность за счет предварительного вычисления всех видео/аудиоклипов. Netflix также выбрала Amazon UltraClusters (инстансы EC2 P4d) для повышения производительности вычислений. Производительность Amazon FSx для Lustre позволяет Netflix перегружать графические процессоры и практически исключать время их простоя. Теперь при использовании предварительных вычислений и FSx для Lustre производительность Netflix улучшилась в 3-4 раза, благодаря чему время обучения модели сократилось с недели до 1-2 дней.

Посмотрите видео: крупномасштабное распределенное обучение мультимедийным моделям машинного обучения с помощью Amazon FSx для Lustre. »
Hyundai

Hyundai Motor Company превратилась во всемирно признанного производителя автомобилей, который экспортирует свои фирменные автомобили более чем в 200 стран.

Проблема: одним из алгоритмов, часто используемых в автономном вождении, является семантическая сегментация, которая заключается в аннотировании каждого пикселя изображения классом объектов. Классом может быть дорога, человек, автомобиль, здание, растительность, небо и проч. Hyundai проверяет точность и собирает дополнительные изображения, чтобы исправить недостаточную эффективность прогнозирования в определенных ситуациях. Однако это может оказаться непростой задачей, поскольку часто не хватает времени на подготовку всех новых данных, при этом остается достаточно времени для обучения модели и соблюдения запланированных сроков.

Решение: Hyundai выбрала Amazon SageMaker для автоматизации обучения моделей и библиотеку Amazon SageMaker для параллелизма данных при переходе от одного графического процессора к распределенному обучению. Они выбрали Amazon FSx для Lustre для обучения моделей, не дожидаясь копий данных. Они также выбрали Amazon S3 в качестве постоянного хранилища данных. Hyundai достигла 93 % эффективности масштабирования при использовании 8 инстансов GPU или всего 64 графических процессоров. FSx для Lustre позволил Hyundai выполнять несколько обучающих заданий и экспериментов с одними и теми же данными без времени ожидания.

Прочтите публикацию в клиентском блоге »
Rivian

Миссия Rivian – навсегда сохранить мир приключений. Мы верим, что есть более ответственный подход к изучению мира, и полны решимости сделать переход к экологичным перевозкам увлекательным процессом.

Чтобы уложиться в сжатые сроки проектирования и снизить потребность в физических прототипах, производитель электромобилей Rivian использует передовые методы моделирования и симуляции. Моделирование с большой вычислительной мощностью дает возможность инженерам тестировать новые концепции и быстро выводить свои проекты на рынок.

Благодаря партнерству с Amazon компания Rivian может сосредоточиться на устойчивой разработке и доставке транспортных средств, а не на информационных технологиях. С Amazon мы быстрее запускаем ключевые приложения для разработки, чем на локальных мощностях, а именно на 56 % быстрее в Elements, на 35 % быстрее на Siemens и на 20 % быстрее на Ansys.

Мадхави Осанака, директор по информационным технологиям, Rivian

Ознакомьтесь с примером использования Rivian »
DENSO

Компания Denso разрабатывает датчики изображения для усовершенствованных систем помощи водителю (ADAS), которые облегчают водителям выполнять такие операции, как парковка и смена полосы движения.

Задача: для разработки необходимых моделей машинного обучения при распознавании изображений ADAS компания DENSO создала кластеры графических процессоров в своей локальной среде. Однако несколько инженеров машинного обучения одновременно использовали ограниченные ресурсы графического процессора, что сказалось на производительности, особенно в напряженный период перед выпуском нового продукта.

Решение: внедрив Amazon SageMaker и Amazon FSx для Lustre, компания Denso смогла ускорить создание моделей распознавания изображений ADAS за счет сокращения времени сбора данных, разработки, обучения и оценки моделей.

«Практика перехода в облако будет только ускоряться в сфере искусственного интеллекта и машинного обучения. Уверен, что AWS продолжит оказывать нам поддержку по мере добавления функций».

Кенсуке Ёкой, генеральный директор DENSO

Ознакомьтесь с примером использования Denso. »
Joby Aviation

Компания Joby Aviation использует AWS, чтобы совершить революцию в транспортной сфере.

Задача: инженеры Joby используют высокопроизводительные вычисления (HPC) для проведения тысяч сложных и ресурсоемких симуляций вычислительной гидродинамики (CFD). Каждая симуляция использует сотни ядер процессора и занимает много часов.

Решение: с Эластичным вычислительным облаком Amazon (Amazon EC2) и Amazon FSx для Lustre компания Joby смогла быстрее получать результаты при выполнении рабочих нагрузок CFD по сравнению с выполнением таких задач в локальной высокопроизводительной вычислительной инфраструктуре.

Когда мы пытались запускать десятки симуляций одновременно, нужно было одновременно читать и записывать несколько гигабайт данных, что замедляло процесс. Сервис FSx для Lustre устранил проблемы с пропускной способностью. Теперь мы можем легко увеличить размер нашего жесткого диска.

Алекс Столл, руководитель отдела аэромеханики, Joby Aviation

Ознакомьтесь с примером использования Joby Aviation »
T-Mobile

Благодаря Amazon FSx для Lustre компания T-Mobile ежегодно экономит 1,5 миллиона долларов и удваивает скорость рабочих нагрузок SAS Grid.

Проблема: T-Mobile столкнулась с большими затратами на управление и трудностями с производительностью из-за самоуправляемой рабочей нагрузки SAS Grid.

Решение: T-Mobile развернула Amazon FSx для Lustre, полностью управляемую высокопроизводительную файловую систему, для миграции и масштабирования инфраструктуры SAS Grid. Компания T-Mobile воспользовалась тесной интеграцией Amazon FSx и S3, чтобы снизить нагрузку на хранилище и оптимизировать операции.

С Amazon FSx для Lustre мы смогли удвоить скорость рабочих нагрузок SAS Grid, снизить совокупную стоимость владения на 83 % и полностью устранить операционное бремя. Партнерство с AWS позволяет нам сосредоточиться на том, что у нас получается лучше всего, – разрабатывать инновационные продукты для наших клиентов, используя передовые функции хранения данных FSx и возможности хостинга мирового уровня AWS.

Динеш Корде, старший менеджер по разработке программного обеспечения, T-Mobile
Netflix

При создании четвертого сезона драматического сериала «Корона» Netflix столкнулся с неожиданными проблемами: незадолго до начала послесъемочного монтажа спецэффектов мир оказался в изоляции из-за пандемии COVID-19. Собственная команда Netflix по визуальным эффектам внедрила облачный рабочий процесс на AWS, включая файловый сервер Amazon FSx для Lustre для повышения пропускной способности, чтобы всего за 8 месяцев десять художников смогли в удаленном режиме беспрепятственно обработать более 600 кадров для 10 серий сезона.

Прочтите публикацию в блоге «”Корона” в облаке» »
Maxar

Maxar использует AWS, чтобы составлять прогнозы на 58 % быстрее, чем это делает суперкомпьютер для прогнозирования погоды.

Задача: компании Maxar Technologies, надежному партнеру и новатору в области разведки Земли и космической инфраструктуры, необходимо было быстрее предоставлять прогнозы погоды по сравнению с локальным суперкомпьютером.

Решение: Maxar совместно с AWS работали над созданием решения для высокопроизводительных вычислений при помощи ключевых технологий, включая Эластическое вычислительное облако Amazon (Amazon EC2) для безопасных и высоконадежных вычислительных ресурсов, Amazon FSx для Lustre для повышения пропускной способности приложений при чтении и записи, а также AWS ParallelCluster для быстрого создания высокопроизводительных вычислительных сред на AWS.

Maxar использовала Amazon FSx для Lustre в нашем решении AWS для высокопроизводительных вычислений с целью запуска численной модели прогнозирования погоды NOAA. Это позволило сократить время вычислений на 58 % и сгенерировать прогноз примерно за 45 минут по гораздо более выгодной цене. Нам удалось невероятно повысить производительность благодаря максимальному использованию вычислительных ресурсов AWS.

Стефан Чесельски, доктор наук, старший научный сотрудник и инженер по обработке данных в Maxar Technologies

Ознакомьтесь с примером использования Maxar »
INEOS TEAM UK

С помощью AWS компания INEOS TEAM UK быстрее проектирует яхты для Кубка Америки.

Задача: компания INEOS TEAM UK, основанная в 2018 году, ставит перед собой цель привезти в Великобританию старейший международный спортивный трофей в мире – Кубок Америки. Согласно правилам Кубка Америки, испытания на воде запрещено проводить за 150 дней до начала события. Поэтому высокопроизводительное моделирование монокорпусов и крыльев с помощью вычислительной гидродинамики (CFD) играет ключевую роль в создании модели судна, которая одержит победу.

Решение: используя AWS, компания INEOS TEAM UK может в течение одной недели обработать тысячи проектных моделей судна, участвующего в Кубке Америки. В локальной среде на это требовалось более месяца. В 2021 году компания INEOS TEAM UK приняла участие в 36-м Кубке Америки. Команда использует среду высокопроизводительных вычислений, работающую на спотовых инстансах Amazon EC2. Чтобы обеспечить высокую производительность дисков для тысяч симуляций, выполняемых каждую неделю, команда также использовала Amazon FSx для Lustre с целью создания быстрой, масштабируемой и безопасной высокопроизводительной файловой системы на основе Простого сервиса хранения данных Amazon (S3).

С AWS мы можем принимать более масштабные меры по проектированию, поскольку имеем больше времени для анализа результатов.

Ник Холройд, руководитель отдела дизайна, INEOS TEAM UK

Ознакомьтесь с примером использования INEOS TEAM UK »
Hive VFX

Hive VFX сокращает первоначальные затраты на студию, поскольку работает как облачная студия визуальных эффектов на AWS.

Задача: Hive нуждалась в высокопроизводительной инфраструктуре для запуска небольшой независимой облачной студии для удаленных художников по всему миру с целью создания качественного контента.

Решение: полностью управляемый сервис Amazon FSx для Lustre, интегрированный с Amazon S3, обеспечил быстрый доступ к вычислительным ресурсам AWS без больших первоначальных инвестиций или опыта собственной ИТ-команды. Благодаря эффективной синхронизации файловых данных и разрешений на файлы между FSx для Lustre и S3 компания Hive VFX может хранить большой объем изображений и обмениваться данными проектов на разных континентах.

Я могу запустить файловую систему Amazon FSx для Lustre за 5 минут, и все это управляется AWS.

Берни Кимбахер, основатель Hive VFX

Ознакомьтесь с примером использования Hive VFX »
Lyell

С помощью Amazon FSx для Lustre компания Lyell быстрее исследует лечение рака на уровне клеток.

Задача: Lyell предлагает методы лечения рака на уровне клеток, требующие крупномасштабного компьютерного проектирования белков. Как правило, эти рабочие нагрузки выполнялись локально, но компании требовалось более масштабируемое и экономичное решение, поскольку компания могла проводить только один эксперимент в месяц.

Решение: после переноса файловой системы на FSx для Lustre специалисты по обработке данных могут ускорять и замедлять тысячи кластеров высокопроизводительных вычислений, состоящих из инстансов EC2 и файловых систем Amazon FSx, что позволяет им быстро проводить эксперименты с большими объемами обработки данных и платить только за вычислительные ресурсы и хранилище в течение всей рабочей нагрузки.

С Amazon для FSx Lustre мы быстрее выполняем исследования по разработке препаратов нового поколения для лечения рака. Благодаря FSx мы сократили время выполнения наших экспериментов с недель до часов, а ученые теперь могут проверять гораздо больше гипотез, чем раньше. Теперь мы можем использовать FSx для доступа к данным S3 в сверхвысоких наборах для рабочих нагрузок, выполняемых на десятках тысяч вычислительных узлов.

Аниш Кежариваль, руководитель отдела аналитики данных, Lyell Immunopharma
BlackThorn Therapeutics

BlackThorn Therapeutics ускоряет получение информации с помощью FSx для Lustre.

Задача: чтобы обработать данные магнитно-резонансной томографии (МРТ) с использованием стандартных облачных файловых систем типа «сделай сам», требовалось много ресурсов и времени. BlackThorn нуждалась в эффективном вычислительном решении для совместного хранения файлов, с помощью которого можно было бы упростить рабочие процессы обработки данных и машинного обучения.

Решение: Amazon FSx для Lustre интегрирован с Amazon S3 и Amazon SageMaker, что обеспечивает быструю обработку наборов обучающих данных машинного обучения и беспрепятственный доступ к вычислительным ресурсам с помощью инстансов Amazon EC2.

С FSx для Lustre мы смогли создать высокопроизводительный конвейер обработки данных МРТ. Время обработки данных в наших рабочих процессах на основе машинного обучения сократилось до минут, а раньше требовались дни и недели.

Оскар Родригес, старший директор по инновациям и технологиям, BlackThorn Therapeutics
Qubole

С помощью Amazon FSx для Lustre компания Qubole повышает надежность хранения данных и снижает затраты.

Задача: компания Qubole искала для своих клиентов высокопроизводительное решение для хранения данных с целью обработки аналитических задач и рабочих нагрузок искусственного интеллекта и машинного обучения. Им нужно было легко хранить и обрабатывать промежуточные данные, хранящиеся в их спотовом парке EC2.

Решение: компания Qubole использовала Amazon FSx для Lustre для хранения и обработки промежуточных данных через параллельную высокоскоростную файловую систему.

Две самые большие проблемы наших пользователей – высокая стоимость и потеря промежуточных данных – были связаны с использованием простаивающих инстансов EC2 и спотовых инстансов EC2 для обработки и хранения промежуточных данных, генерируемых платформами распределенной обработки, такими как Hive и Spark. Мы смогли решить эту проблему, используя высокопроизводительную файловую систему Amazon FSx для Lustre, чтобы разгрузить промежуточные данные. Теперь нашим пользователям не нужно платить за обслуживание простаивающих инстансов, и на них не влияют перебои в работе спотовых узлов EC2. Благодаря Amazon FSx наши пользователи сократили общие затраты на 30 %.

Джойдип Сен Сарма, технический директор, Qubole