AWS 기술 블로그

Category: Compute

그림 1. ‘HPC on AWS’ 스택

AWS 클라우드 기반의 HPC 클러스터는 어떤 서비스들로 구성될까?

온프레미스 환경에서 HPC 클러스터를 구성하기 위해서는 서버, 스토리지, 네트워크와 같은 여러 하드웨어 장비들 및 소프트웨어들이 필요합니다. 마찬가지로 AWS 클라우드 환경에서 HPC 클러스터를 구성하기 위해서는 여러가지 AWS 서비스들을 조합해서 사용합니다. 이번 블로그에서는 ‘HPC on AWS’를 구성하는 개별 AWS 서비스들에 대해 소개하도록 하겠습니다. ‘HPC on AWS’를 구성하는AWS 서비스 ‘HPC on AWS’는 단일 서비스가 아니라, 그림1과 같이 다양한 […]

Karpenter Drift를 사용하여 Amazon EKS 워커 노드를 업그레이드하기

이 글은 AWS Container Blog에 게시된 ‘How to upgrade Amazon EKS worker nodes with Karpenter Drift‘을 Karpenter v1beta1 API 변경 사항을 반영하여 업데이트되었습니다. 소개 Karpenter는 집계된 CPU, 메모리, 볼륨 요청 및 기타 쿠버네티스 스케줄링 제약 조건 (예: 어피니티 및 파드 topology spread constraints) 을 기반으로 스케줄링할 수 없는 파드에 대응하여 적절한 크기의 노드를 프로비저닝하여 인프라 […]

인프랩의 EC2 스팟 인스턴스를 활용한 Jenkins 기반의 CI/CD 구축 사례

인프랩은 IT 직군에 특화된 온라인 강의 플랫폼 인프런과 <채용 수수료 무료> 커리어 플랫폼인 랠릿 서비스를 운영하는 스타트업입니다. 인프런에서는 개발자를 위한 강의부터 디자이너, 데이터 분석가 등을 위한 폭넓은 학습 기회를 제공합니다. 랠릿 허브를 통해 자신의 이력서를 공유하고 커리어를 관리하는 채용 플랫폼을 운영하여 학습과 성장에 매진할 수 있도록 돕습니다. 인프랩은 SaaS 기반의 CI/CD를 사용하던 중 서비스 규모가 […]

AWS가 제공하는 고성능 컴퓨터 서비스(HPC on AWS)를 사용해야 하는 이유

고성능 컴퓨팅 환경(HPC: High Performance Computing)은 CAE(Computer Aided Engineering)라 불리우는 전통적인 엔지니어링 시뮬레이션을 수행하기 위해, 엔터프라이즈 기업에서는 필수적인 R&D 인프라입니다. 최근에는 생성형 AI의 확산에 따라, 엔지니어링 시뮬레이션 이외에도 많은 기업들이 자사의 머신 러닝용 분산 트레이닝을 위해 HPC 클러스터를 구축하고 있습니다. 이번 블로그에서는 AWS 클라우드 기반의 HPC 클러스터에 대한 개념 및 장점에 대해 자세히 소개하도록 하겠습니다. […]

Amazon CloudFront의 원본 액세스 제어를 활용하여 Lambda 함수 URL을 안전하게 관리하기

이 글은 AWS Networking & Content Delivery Blog에 게시된 Secure your Lambda function URLs using Amazon CloudFront origin access control by Karan Desai and Tanya Pahuja을 한국어 번역 및 편집하였습니다. 2022년 AWS는 별도의 서비스를 학습하고 구성, 운영할 필요 없이 AWS Lambda 함수에 대해 HTTPS 엔드포인트를 간단히 구성할 수 있는 Lambda 함수 URL을 출시했습니다. Lambda 함수 […]

셀렉트스타의 Amazon API Gateway WebSocket 을 활용한 AI Red teaming API 스트림 처리 방법

Data-centric AI company, 셀렉트스타(Selectstar) 학습 데이터 품질이 인공지능 성능을 결정하고 좋은 인공지능은 실서비스 환경에서 수집되는 다양하고 방대한 데이터와 상호작용하며 끊임없이 발전합니다. 특히, 좋은 품질의 데이터를 수집하고 관리하는 작업은 여러 가지 측면에서 복잡하고 매우 중요합니다. 고품질의 데이터를 확보하기 위해서는 데이터의 정확성, 완전성, 관련성, 그리고 시기적절성을 모두 충족시켜야 하는데 이를 위해 데이터 수집 과정에서 발생할수 있는 오류를 […]

AWS 인공 지능 (AI) 및 기계 학습 (ML) 서비스를 사용한 비디오 요약

이 글은 AWS M&E Blog에 게시된 Video summarization with AWS artificial intelligence (AI) and machine learning (ML) services를 한국어 번역 및 편집하였습니다. 동영상 제작사와 방송사는 짧은 쇼츠 비디오 클립이 젊은 시청자의 관심을 끄는 데 효과적이라는 것을 알고 있습니다. 젊은 시청자 중 다수는 틱톡과 같은 플랫폼에서 짧은 형식의 콘텐츠를 좋아합니다. 전통적인 M&E 업계의 기업들이 오리지널 콘텐츠에서 짧은 […]

AWS 고성능 컴퓨팅 네트워크, 2부: AWS가 제공하는 고성능 네트워크 프로토콜, SRD(Scalable Reliable Datagram)

지난 블로그에서는 AWS에서 제공하는 고속 네트워크 인터페이스인 EFA(Elastic Fabric Adaptor)에 대해 설명하였습니다. 또한 EFA에는 SRD(Scalable Reliable Datagram)라는 프로토콜이 탑재되어 있다고 소개하였습니다. 이번 블로그에서는 SRD란 무엇인지에 대해 좀 더 구체적으로 설명드리겠습니다. 일반적인 데이터센터의 네트워크 토폴로지 vs AWS 데이터센터 네트워크 토폴로지 본격적인 SRD 프로토콜에 대한 소개에 앞서, 일반적인 데이터센터의 네트워크 환경에 대해 알아보도록 하겠습니다. 전형적인 온프레미스 환경의 […]

Amazon Bedrock을 이용해 RAG, Fine tuning 없이 자동 고객 응대 서비스 구축하기

Generative AI를 이용한 고도화된 개인화 Gen AI(Generative AI, 생성형 AI)는 다양한 컨텐츠를 생성하는 기술로, 텍스트부터 이미지, 영상, 음악까지 다양한 영역에서 활용됩니다. 이를 위해 방대한 데이터와 사전 훈련된 대형 모델이 사용되며, 이러한 모델은 언어 이해, 텍스트 및 이미지 생성, 자연어 대화 등의 기능을 수행할 수 있습니다. Gen AI는 가파르게 발전하고 있으며 다양한 산업에서 고객 경험 개선, […]

AWS 고성능 컴퓨팅 네트워크, 1부: AWS가 제공하는 고속 네트워크 인터페이스, EFA(Elastic Fabric Adaptor)

고성능 컴퓨팅(HPC)에 관심 있는 고객분들을 위해 AWS 클라우드 환경에서 엔지니어링 시뮬레이션이나 분산 트레이닝을 수행할 때 거의 필수적으로 사용되는  고성능 컴퓨팅 네트워크 기술에 대해 알기쉽게 설명드리고자 합니다. 오늘은 첫 번째로 고속 네트워크 인터페이스인 Elastic Fabric Adapter에 대해 소개하고자 합니다. 오늘날의 인터커넥트 기술 현황 엔지니어링 시뮬레이션의 복잡도가 증가하고 처리해야할 데이터가 많아질수록 다수의 노드를 활용한 분산 처리는 필수가 […]