AWS 기술 블로그
분산 트레이닝 관점에서의 AWS 인터커넥트 기술 소개 – AWS 환경에서 NCCL을 이용한 GPU 간 통신
지난 블로그에서는 ENI(Elastic Network Interface)의 구조와 역할, 그리고 p5.48xlarge와 p6-b300 인스턴스에서 EFA(Elastic Fabric Adapter)를 실제로 어떻게 구성하는지 살펴보았습니다. 이번 블로그에서는 이렇게 구성된 EFA 네트워크 위에서 실제 GPU 간 통신이 어떻게 이루어지는지, 그 핵심에 있는 NCCL(NVIDIA Collective Communications Library) 통신에 대해 소개하고자 합니다. EFA가 고속도로를 깔아주는 인프라라면, NCCL은 그 위에서 수백 대의 GPU가 효율적으로 데이터를 주고받을 […]
Amazon EKS에서 운영하는 자체 관리형 Agentic AI 플랫폼 : 인프라 자동화와 관측성으로 운영 안정성 확보하기
서론 많은 기업이 LLM 기반 에이전틱 워크플로우를 실제 업무에 투입하고 있습니다. 그러나 프로덕션 규모로 확대하면 단일 거대 LLM에 모든 호출을 의존하는 방식의 한계가 드러납니다. 에이전트 내부에서 발생하는 도구 분류·요약·포맷팅 등 매 단계마다 동일한 토큰 과금이 누적되고, 거대 모델의 긴 응답 지연(TTFT)은 실시간 대화에 부적합합니다. 요금 계산이나 약관 검증처럼 정확성이 요구되는 업무에서 환각(hallucination)은 비즈니스 리스크가 되며, […]
Grafana k6로 Amazon EC2 비용 최적화 하기
들어가며 “우리 서비스에 어떤 EC2 인스턴스 타입을 써야 할까?” 클라우드 인프라를 운영하는 엔지니어라면 누구나 한 번쯤 마주치는 질문입니다. Amazon EC2는 700개가 넘는 인스턴스 타입을 제공하며, 각각 CPU 아키텍처와 세대, 메모리/네트워크 구성이 다릅니다. 스펙 시트에 적힌 vCPU 수와 메모리 용량만으로는 실제 워크로드에서의 성능을 예측하기 어렵습니다. 같은 8 vCPU라도 아키텍처(x86 vs ARM), 세대(5세대 vs 8세대), 워크로드 특성에 […]
GraphRAG Toolkit으로 지식 그래프 인덱싱하기
기존의 RAG(Retrieval-Augmented Generation) 방식은 주로 ‘벡터 유사성 검색’에 의존합니다. 하지만 이 방식은 단순히 질문과 언어적으로 유사한 정보만 찾기 때문에, 데이터 간의 복잡한 구조적 관계나 숨겨진 맥락을 놓칠 수 있다는 한계가 있습니다. 지식 그래프(Knowledge Graph)는 이러한 한계를 보완합니다. 데이터를 개체(Entity)와 관계(Relation) 중심으로 연결하여, 질문과 직접적인 단어 유사성이 낮더라도 답변에 꼭 필요한 연관 정보를 정확하게 찾아낼 수 […]
키다리스튜디오의 QA 테스트 케이스 생성 자동화 — Amazon Bedrock과 LangGraph 활용 사례
소개 웹툰/웹소설 플랫폼을 운영하는 키다리스튜디오는 레진코믹스, 봄툰 등 다수의 콘텐츠 플랫폼을 서비스하고 있습니다. 플랫폼의 품질을 보장하기 위해 QA 엔지니어링팀은 매 릴리스마다 수백 개의 테스트 케이스(TC)를 수동으로 작성해왔습니다. 숙련된 QA 엔지니어 한 명이 하나의 페이지에 대한 TC를 작성하는 데 3~4시간이 소요되었고, 이는 빠른 릴리스 주기에 큰 병목이 되고 있었습니다. 키다리스튜디오 AX 개발팀은 이 문제를 해결하기 위해 […]
AWS AI-DLC 기반 라포랩스 사내 배포 플랫폼 Raploy 구축 사례
”비개발 직군도 자기 손으로 배포까지 해내는 환경을 어떻게 만들 수 있을까요?” 라포랩스 AX팀은 AWS AI-DLC(AI-Driven Development Life Cycle) 방법론을 활용하여 사내 배포 플랫폼 Raploy를 구축했습니다. 2026년 2월 말 AWS와 함께 진행한 3일간의 AI-DLC 워크숍에서 Raploy의 뼈대를 만들었고, 이후 약 한 달간의 고도화를 거쳐 2026년 3월 중순 사내 서비스로 오픈했습니다. 이 글에서는 라포랩스가 왜 AI-DLC를 선택했는지, […]
한국어 파인튜닝된 SPLADE 기반 Neural Sparse 모델과 Amazon OpenSearch 하이브리드 검색 벤치마크
한국어 SPLADE v3 스타일 모델(sewoong/korean-neural-sparse-encoder-base-klue-large)을 Amazon OpenSearch Service에 배포하고, BM25 / Titan Embedding V2 / 각 하이브리드 조합을 MIRACL-ko로 비교했습니다. 코드와 정량 지표 중심으로 Sparse / Dense / Lexical을 어떻게 선택할지 판단할 수 있도록 정리했습니다. 검색의 출발점: TF-IDF와 BM25의 한계 정보 검색(Information Retrieval)은 사용자의 쿼리에 가장 관련성이 높은 문서를 찾아내는 문제입니다. 이 문제에 쓰이는 고전적인 […]
AI Native 제품의 GTM 을 위한 과금 모델 통합 전략
Agentic AI 시대가 본격화되면서 많은 기업들이 AI 에이전트 기반의 혁신적인 제품을 개발하며 공격적으로 투자하고 있습니다. 그러나 기술 개발만큼 중요한 것이 바로 글로벌 Go-To-Market(GTM) 전략입니다. 특히 과금 모델 설계는 제품의 가치를 고객에게 효과적으로 전달하고, 지속 가능한 비즈니스 모델을 구축하는 핵심 요소입니다. 2025년 7월, AWS Marketplace에 AI 에이전트 및 도구 제품 카테고리가 새롭게 도입되었습니다. 현재 3,000개 이상의 […]
에이전틱 AI와 Amazon Bedrock AgentCore를 활용한 전문가 팀 시뮬레이션
이 글은 AWS Spatial Computing Blog에 게시된 Simulating Expert Teams with Agentic AI and Amazon Bedrock AgentCore 를 한국어로 번역 및 편집하였습니다. 소개 여러 전문 분야에 걸친 기술적 질문에 답하는 것은 단순히 정답을 찾는 문제가 아닙니다. 가장 어려운 부분은 그 답을 제공할 수 있는 적절한 사람들을 조율하는 일인 경우가 많습니다. 만약 AI가 전문가 팀을 대체하는 […]
AWS SaaS Builder Toolkit을 활용한 엔터프라이즈 IdP 솔루션의 SaaS 전환 사례
온프레미스 환경에서 고객사마다 개별 설치·운영하던 IAM/MFA 솔루션을 Software as a Service (SaaS)로 전환하는 것은 단순한 기술 마이그레이션이 아닙니다. 제품을 판매하고 가치를 전달하는 방식 자체를 바꾸는 일입니다. AirCUVE는 AWS SaaS Builder Toolkit(SBT)을 활용해 단 3개월 만에 V-FRONT를 멀티테넌트 SaaS 플랫폼으로 전환하고 AWS Marketplace에 등재했습니다. 이 글에서는 그 기술적 여정과 아키텍처 설계 원칙을 공유합니다. 1. V-FRONT 소개 […]









