어떤 의도든 똑똑하게 이해하고 추론하는! Agent for Amazon Bedrock
Agents for Amazon Bedrock 소개
챗봇 기능 구현
예약 기능
고객 DB, 예약/발권 정보 등 기간계 시스템과 연동하여 예약 정보 업데이트
주소 검색 기능
알림 기능
RAG vs Agent
RAG (Retrieval-Augmented Generation)
외부 데이터베이스에 엑세스하여 관련 정보를 가져와 생성 모델에서 사용
Agent
LLM 추론을 위해 실시간 정보를 사용하는 사용 사례에서 활용
#ReAct (Reasoning + Acting)
질문
사용자가 요청한 작업이나 해결해야 할 문제
사고
문제 해결을 위한 행동 식별 및 계획 생성/유지/조정
행동
사전 허용된 범위의 API 등 외부 환경과 모델의 상호작용
관찰
LLM이 사고 과정을 거쳐 행동을 수행하는 과정
Langchain Agent
Tools
에이전트가 외부 환경과 상호작용할 때 사용하는 내장 도구 인터페이스
Toolkits
특정 작업에서 함께 작동할 수 있는 도구 모음
Agent Types
Langsmith hub 내 프롬프트
특정 작업을 수행하기 위해 Pull
Agents for Amazon Bedrock
프롬프트 활용
AWS가 제공하는 각 모델에 적합한 프롬프트 활용
Knowledge Bases for Amazon Bedrock
완전 관리형 경험 RAG와 원클릭 통합
안전한 접근 및 조회, 가드레일 설정
동작 방식
Question
Agent 런타임 Endpoint로 인입된 쿼리
Thought
사용자 요청의 여러 의도 이해, 작업 분할 및 오케스트레이션 자동화
Action
람다 함수 호출
Observation
작업 그룹 구성 요소
OpenAPI 스키마
함수 오케스트레이션을 위한 요청 및 응답
정보를 YAML, JSON 형식으로 정의
Lambda 함수
Agent와 호환되는 요청 방식으로 작성
최적화 기법 및 Lesson Learned
신규 Agent 생성 시 CDK 사용 권장
Generate-ai-cdk-constructs
Lambda Web Adapter
기존 백엔드가 이미 구성되어 있는 경우, 오픈소스 툴을 통해 Agent와 병합
HTTP를 지원하는 모든 웹서버에 대해 코드 변경 없이 람다로 마이그레이션
FastAPI와 궁합이 좋음
Self-Managed RAG
Hybrid Search
키워드 기반 laxical search와 유사도 기반 semantic search 결합
메타데이터 기반 필터링
특정 제품명, 도메인에 대한 필터링으로 검색 범위 제한
쿼리 캐싱
인메모리 DB에 질문-답변 저장, 전체/유사도 일치 기반 쿼리 캐싱으로 빠른 답변 반환
멱등성
모든 작업이 람다를 통해 실행되므로, API 호출에 대한 멱등성 보장 필요
idempotency 유틸리티에서 idempotent 데코레이터로 쉽게 통합
Warp Up
LLM의 빠른 발전
성능 향상을 위한 다양한 기법 등장
모든 기법 테스트는 리소스 낭비
AWS의 추상화된 관리형 서비스 제공
Agent를 통한 실시간 작업 자동화
기존 백엔드와 Agent의 긴밀한 통합으로 새로운 비즈니스 가치 창출 가능
Last updated