모든 블로그
AWS

AWS

블로그 방문

최신 게시글 (20)

3월 31일

AI

NVIDIA와 함께 AWS에서 자율주행 3.0을 위한 End-to-End Physical AI 데이터 파이프라인 구축하기

AWS와 NVIDIA가 AV 3.0을 위한 End-to-End Physical AI 데이터 파이프라인을 제시했습니다. 센서 수집, AI 기반 큐레이션·증강, 3D 복원, VLA 모델 학습과 폐쇄루프 시뮬레이션으로 반복적 검증합니다.

#AWS#자율주행#NVIDIA
11000

3월 31일

AI

클라우드 환경에서의 비디오 인텔리전스 구현: TwelveLabs로 시작하는 AI 영상 분석 1부 – VoD환경에서의 비디오 분석 파이프라인 구축하기

VoD 환경에서 TwelveLabs Marengo로 비디오 임베딩 파이프라인을 제시했습니다. 즉시 처리와 대규모 배치(람다, EventBridge, Step Functions, Batch) 옵션을 비교했습니다.

#AWS#TwelveLabs#embeddings
9000

3월 31일

AI

Neptune GraphRAG Toolkit을 활용하여 정교한 비정형 데이터 검색하기

GraphRAG Toolkit으로 Neptune 기반 그래프와 벡터 스토어를 자동 인덱싱할 수 있습니다. 그래프 탐색으로 연관 리스크까지 반영한 답변을 제공합니다.

#Python#RAG#OpenSearch Serverless
12000

3월 30일

AI

Amazon Aurora PostgreSQL에서 Amazon Bedrock으로 벡터 임베딩 생성 자동화

이 글에서는 Aurora PostgreSQL과 Amazon Bedrock을 연동해 벡터 임베딩 생성 자동화 방법을 소개했습니다. 트리거, aws_ml/aws_lambda, SQS 배치, pg_cron 등 다섯 가지 접근 방식의 장단점과 구현 고려사항을 설명합니다.

#Amazon Bedrock#AWS Lambda#PGVector
12000

3월 30일

AI

클라우드 환경에서의 비디오 인텔리전스 구현: TwelveLabs로 시작하는 AI 영상 분석 2부 – 준실시간 환경에서 AWS 미디어 서비스를 활용한 분석 파이프라인 구축하기

준실시간 비디오 분석을 AWS Elemental과 Kinesis를 활용해 파이프라인으로 구성하는 방법을 설명했습니다. TwelveLabs 모델로 생성된 MP4 클립을 분석하는 흐름을 제시합니다.

#Serverless#TwelveLabs#AWS Elemental
14000

3월 30일

AI

클라우드 환경에서의 비디오 인텔리전스 구현 : TwelveLabs로 시작하는 AI 영상 분석 5부 – 비디오 임베딩을 위한 Vector DB 비교

Marengo 3.0 비디오 임베딩을 OpenSearch Serverless와 S3 Vectors에 저장·검색해 성능과 운영 특성을 비교했습니다. 하이브리드 검색이 필요하면 OpenSearch를, 비용과 간편성을 우선하면 S3 Vectors를 권장합니다

#hybrid search#TwelveLabs#OpenSearch Serverless
19000

3월 30일

AI

클라우드 환경에서의 비디오 인텔리전스 구현: TwelveLabs로 시작하는 AI 영상 분석 4부 – TwelveLabs Marengo 3.0 임베딩 및 검색 전략과 구현 가이드

Marengo 3.0을 통해 비디오의 시각·청각·전사 임베딩을 통합 또는 분리해 검색 품질을 개선하는 방법을 제시했습니다. Fused, Multi-Vector(Score/RRF), Intent-based Dynamic Routing 세 가지 전략의 장단점과 구현 고려사항을 안내합니다.

#Multimodal#TwelveLabs#Marengo 3.0
16000

3월 30일

AI

클라우드 환경에서의 비디오 인텔리전스 구현: TwelveLabs로 시작하는 AI 영상 분석 3부 – Strands Agent를 활용한 Agentic video engine구현

이 글은 Strands Agents SDK와 TwelveLabs 모델을 활용해 에이전틱 비디오 엔진 구축 방법을 제시했습니다. AWS 서비스 통합, 도구 설계, 멀티 에이전트 오케스트레이션 예시를 제공합니다.

#Amazon Bedrock#TwelveLabs#Strands Agents SDK
14000

3월 27일

AI

Part 1: 삼성계정 서비스의 AI SecOps, Multi-Agent로 진화하는 보안 위협 탐지

WAF 로그 기반 대규모 보안 위협 탐지에 GenAI와 멀티에이전트 아키텍처를 도입해 자동화했습니다. 이를 통해 탐지 정확도와 운영 효율을 개선하고 실시간 대응 기반을 마련했습니다.

#EKS#Amazon Bedrock#AWS WAF
29000

3월 27일

AI

Part2: 삼성계정 서비스의 Agentic AIOps, 운영환경에서 Multi-Agent 시스템으로 RCA 자동화 하기

삼성계정 서비스에 Agentic AIOps를 도입해 Multi-Agent로 RCA 자동화를 구현했습니다. FastMCP 기반 Custom MCP와 Agents as Tools 패턴으로 데이터 맥락 제공과 역할 분리를 구현했습니다.

#multi-agent#Agentic AIOps#Strands Agents SDK
22000

3월 25일

데브옵스

엠넷플러스 실시간 글로벌 투표 시스템 아키텍처 개선 사례

엠넷플러스는 AWS 관리형 서비스와 이벤트 드리븐 아키텍처로 투표 시스템을 내재화했습니다. 그 결과 대규모 동시 투표 처리 성능과 데이터 정합성, 비용 효율을 개선했습니다.

#AWS#DynamoDB#elasticache
63000

3월 25일

데브옵스

Agent 로 최적화 하는 EKS 운영: AWS DevOps Agent + K8s Operator로 MTTR 줄이기

EKS에서 DevOps Agent Operator로 Pod 장애를 자동 감지해 DevOps Agent로 조사를 트리거했습니다. 자동 컨텍스트 수집과 분석으로 MTTR을 단축합니다.

#Kubernetes#EKS#MTTR
32000

3월 24일

AI

지능형 Physical AI 구축: Strands Agents, Bedrock AgentCore, Claude 4.6, NVIDIA GR00T, Hugging Face LeRobot으로 엣지에서 클라우드까지

엣지의 실시간 제어와 클라우드 추론을 결합한 Physical AI 구축 방법을 설명했습니다. Strands, Bedrock, GR00T, LeRobot 사례와 코드 제공했습니다.

#strands agents#Bedrock AgentCore#NVIDIA GR00T
20000

3월 18일

AI

AWS에서 NVIDIA Cosmos 월드 파운데이션 모델 실행하기

이 글은 AWS에서 NVIDIA Cosmos WFM을 EKS 기반 실시간과 AWS Batch 기반 배치로 배포하는 방법을 설명합니다. 아키텍처별 성능·비용·운영 고려사항을 제시합니다.

#AWS#EKS#Cosmos WFM
19000

3월 18일

데브옵스

중앙 집중식 및 분산형 비밀 관리 방식 알아보기

이 글에서는 AWS 환경에서 중앙 집중식과 분산형 비밀 관리의 생성·저장·교체·모니터링별 장단점을 비교했습니다. 조직 규모와 운영 역량에 맞춰 중앙화와 분산화를 조합한 전략을 권장합니다.

#AWS#IaC#Secrets Manager
24000

3월 16일

데브옵스

대규모 환경에서의 MCP를 활용한 효율적인 EBS 모니터링

대규모 EBS 성능 모니터링을 MCP와 Kiro로 자연어 기반 자동화했습니다. 버스팅 성능, 스냅샷 실제 크기, EC2‑EBS 병목 진단으로 최적화합니다.

#자동화#cloudwatch#MCP
56000

3월 16일

AI

Amazon Bedrock과 Claude Agent SDK로 서버리스 멀티 에이전트 구현하기

AWS Lambda와 Amazon Bedrock을 연계해 Claude Agent SDK 기반의 Orchestrator-Worker 멀티 에이전트 아키텍처를 구현했습니다. Worker는 Sonnet으로 병렬 전문 작업을 수행하고 Opus로 결과를 종합하는 방식으로 비용과 품질을 균형있게 관리합니다.

#Serverless#Amazon Bedrock#AWS Lambda
38000

3월 13일

AI

네오사피엔스의 AWS g6e 기반 LLM 추론 배치 워크로드 최적화 사례

네오사피엔스는 경량 LLM 추론에서 AWS g6e(L40S)와 INT8 조합을 최적 선택으로 도입했습니다. 벤치마크와 운영 제약(배치 분포·PrivateLink·리전 가용성)을 반영해 throughput과 첫 토큰 지연을 함께 평가했습니다.

#AWS#LLM#inference
30000

3월 13일

AI

Embodied AI 블로그 시리즈, 파트 1: AWS Batch에서 로봇 학습 시작하기

GR00T N1.5를 AWS Batch로 미세 조정하고 시뮬레이션에서 평가했습니다. CDK로 인프라 자동화하고 EFS·ECR·DCV로 학습 모니터링과 반복 실험을 지원합니다

#AWS CDK#AWS Batch#Embodied AI
19000

3월 11일

데브옵스

AWS Organizations에서 Amazon Aurora 및 Amazon RDS 자동 마이너 버전 업그레이드를 위한 업그레이드 롤아웃 정책 지원

업그레이드 롤아웃 정책으로 조직 단위에서 Aurora 및 RDS 자동 마이너 업그레이드를 단계화할 수 있습니다. 태그·OU·계정 기반 순서 지정과 검증 기간, AWS Health 및 RDS 이벤트로 모니터링할 수 있습니다.

#amazon rds#Amazon Aurora#AWS Organizations
32000