AWS 기술 블로그

Amazon Bedrock에서 DeepSeek-R1 Distilled Llama 모델 배포하기

오픈 파운데이션 모델(Open Foundation Models, FM)은 생성형AI 혁신의 초석이 되어, 조직들이 비용과 배치 전략을 통제하면서 AI 애플리케이션을 구축하고 맞춤화할 수 있도록 해줍니다. AI 커뮤니티는 공개적으로 이용 가능한 고품질의 모델을 제공함으로써, 개발자와 최종 사용자 모두에게 이익이 되는 신속한 반복, 지식 공유, 비용 효율적인 솔루션을 촉진합니다. AI 기술 발전에 주력하는 연구 회사인 DeepSeek AI는 이 생태계에 크게 […]

AWS가 제공하는 완전관리형 병렬 파일시스템, Amazon FSx for Lustre – 2

이전 블로그에서는 병렬 파일시스템의 기본 개념과 특징 그리고 대표적인 병렬 파일시스템인 Lustre에 대해 살펴보았습니다. 또한 AWS에서 제공하는 완전 관리형 Lustre 파일시스템인 Amazon FSx for Lustre에 대해서도 알아보았습니다. 병렬 파일시스템은 무엇이고 왜 필요할까? 지구상에서 가장 인기있는 병렬 파일시스템, Lustre 파일시스템 알아보기 AWS가 제공하는 완전 관리형 병렬 파일시스템, Amazon FSx for Lustre – 1 이번 블로그는 시리즈의 […]

AI 응답성 최적화하기: Amazon Bedrock 지연 시간 최적화 추론에 대한 실용적인 가이드

이 글은 AWS Machine Learning 블로그의 Optimizing AI responsiveness: A practical guide to Amazon Bedrock latency-optimized inference by Ishan Singh, Ankur Desai, Rupinder Grewal, Vivek Singh, and Yanyan Zhang의 한국어 번역입니다. 상용 생성형AI 애플리케이션에서 반응성은 모델의 성능(정확도)만큼이나 중요합니다. 시간에 민감한 문의 사항을 처리하는 고객 서비스 팀이든, 즉각적인 코드 제안이 필요한 개발자이든, 지연 시간(대기 시간)으로 알려진 1초의 지연도 상당한 영향을 미칠 […]

AWS 데이터 분석 서비스 기반 게임 레벨링 환경 구성 사례

개요 기존의 문제 상황 소규모 인디게임 개발사는 작은 규모와 한정된 자원에도 불구하고 창의성과 혁신성을 발휘하며 새로운 게임 경험을 선사합니다. 하지만 이러한 장점에도 불구하고, 게임 개발 과정에서 적지 않은 과제에 직면하곤 합니다. 특히 게임 출시 전 완성도를 높이기 위한 테스팅과 난이도 조정 작업은 매우 중요하지만, 인력이 부족한 인디 게임 스튜디오에서는 이러한 작업을 충분히 수행하기 어려운 상황입니다. […]

비정형 데이터! Amazon Bedrock으로 제대로 활용하기

오늘날 기업들은 전례 없는 규모의 비정형 데이터를 보유하고 있습니다. 이메일, 문서, 이미지, 동영상, 소셜 미디어 게시물 등 다양한 형태의 비정형 데이터는 모든 엔터프라이즈 데이터에서 80%~90%를 차지하고 있으며, 정형 데이터보다 몇 배나 빠르게 증가하고 있습니다. 이러한 방대한 비정형 데이터에는 시장 트렌드, 고객 니즈, 운영상의 문제점 등 귀중한 인사이트가 있습니다. 하지만 약 18%의 기업만이 이러한 데이터를 효과적으로 […]

Amazon Bedrock과 Amazon Neptune으로 지식 그래프를 활용한 GraphRAG 애플리케이션 구축하기

이 글은 AWS Database 블로그의 Using knowledge graphs to build GraphRAG applications with Amazon Bedrock and Amazon Neptune의 한국어 번역입니다. 검색 증강 생성(Retrieval Augmented Generation, RAG)은 대규모 언어 모델과 외부 지식 소스를 결합하는 혁신적인 접근 방식으로, 더 정확하고 정보가 풍부한 콘텐츠 생성을 가능하게 합니다. 이 기술은 언어 모델의 맥락 이해 및 일관된 응답 생성 능력과 […]

SK하이닉스의 RAG 플랫폼 구축 및 성능 평가/분석 연구 사례

이 블로그는 SK hynix 오세진 TL, 노정기 TL, 오태진 TL 이 함께 작성하였습니다. SK 하이닉스는 AI 시대라는 새로운 세상의 중심에 반도체가 있다는 사명감을 가지고 최고의 기술력을 향해 끊임없는 혁신을 이뤄 가고 있습니다. 세계 최고 성능의 HBM3를 최초 개발 및 출시한 데 이어 확장 버전인 HBM3E 역시 세계 최초 양산에 성공하며 메모리 반도체 시장을 선도하고 있고, 세계 […]

전용 코디네이터 노드를 사용한 Amazon OpenSearch Service 클러스터 복원력과 성능 향상

이 글은 Akshay Zade 님이 직성하신 “Improve OpenSearch Service cluster resiliency and performance with dedicated coordinator nodes” 포스팅을 한글로 번역 한 Posting입니다. Amazon OpenSearch Service에서 OpenSearch 도메인을 생성할 때, 기존에는 데이터 노드가 여러 역할을 동시에 수행했습니다. 데이터 노드는 색인 요청 및 검색 요청을 조정할 뿐만 아니라, 색인 문서를 처리하고 검색 쿼리에 응답하는 작업까지 담당했습니다. 또한, […]

Amazon Elasticache Valkey 8.0은 더 빠른 스케일링과 개선된 메모리 효율을 제공합니다

이 글은 AWS Database Blog에 게시된 Amazon ElastiCache version 8.0 for Valkey brings faster scaling and improved memory efficiency by Abhay Saxena and Rashim Gupta 을 한국어로 번역 및 편집하였습니다. 2024년 11월, Amazon ElastiCache에 Valkey 8.0 버전에 대한 지원이 추가 되었습니다. Valkey 전용 ElastiCache 버전 8.0은 서버리스에 대한 더 빠른 확장과 노드 기반 클러스터에 대한 […]

Amazon Network Firewall Suricata 규칙에서 HOME_NET 변수 사용하기

이 게시물에서는 AWS Network Firewall(이하 “ANF”) 모범 사례 시리즈의 첫 번째 게시물인 “AWS Network Firewall Suricata 규칙에서 Flow 키워드 사용하기”에 이어서 두 번째 게시물로 ANF의 규칙 그룹을 생성할 때 “HOME_NET 변수 설정”을 사용해야 하는 이유와 특징 및 활용 사례에 대해서 알아보도록 하겠습니다. ANF는 Suricata Engine을 사용하는 정책 기반의 네트워크 보안 서비스로, VPC 환경에서 트래픽을 필터링하고 […]