AWS 기술 블로그

Category: Generative AI

HAQM Bedrock기반에서 Contextual Retrieval 활용한 검색 성능 향상 및 실용적 구성 방안

개요 인공지능 기술의 발전과 함께 대규모 언어 모델(LLM)의 성능 향상을 위한 다양한 방법들이 연구되고 있습니다. 그 중에서도 Retrieval Augmented Generation (RAG)은 외부 지식을 활용하여 모델의 응답 능력을 크게 개선하는 주요 기술로 주목받고 있습니다. RAG는 사용자의 질문에 관련된 정보를 외부 데이터베이스에서 검색하고, 이를 프롬프트에 추가하여 더 정확하고 맥락에 맞는 응답을 생성하는 방식으로 작동합니다. 하지만 기존의 RAG […]

SF 시리즈: HAQM Bedrock 기반 IAM Policy 자동 생성 및 할당 🚀

SF 시리즈 소개 과거 공상과학(SF) 작품에서만 가능할 것 같았던 기술들이 이제는 AWS의 다양한 서비스와 기능을 통해 현실이 되고 있습니다. 이러한 혁신적인 기능들은 여러 서비스의 기능 조합과 복잡한 패턴을 필요로 하며, 이를 효과적으로 오케스트레이션할 수 있는 도구가 필수적입니다. AWS에서는 이러한 복잡한 프로세스를 손쉽게 설계하고 자동화할 수 있도록 AWS Step Functions을 제공합니다. Step Functions을 활용하면 복잡한 비즈니스 […]

AI 응답성 최적화하기: HAQM Bedrock 지연 시간 최적화 추론에 대한 실용적인 가이드

이 글은 AWS Machine Learning 블로그의 Optimizing AI responsiveness: A practical guide to HAQM Bedrock latency-optimized inference by Ishan Singh, Ankur Desai, Rupinder Grewal, Vivek Singh, and Yanyan Zhang의 한국어 번역입니다. 상용 생성형AI 애플리케이션에서 반응성은 모델의 성능(정확도)만큼이나 중요합니다. 시간에 민감한 문의 사항을 처리하는 고객 서비스 팀이든, 즉각적인 코드 제안이 필요한 개발자이든, 지연 시간(대기 시간)으로 알려진 1초의 지연도 상당한 영향을 미칠 […]

SK하이닉스의 RAG 플랫폼 구축 및 성능 평가/분석 연구 사례

이 블로그는 SK hynix 오세진 TL, 노정기 TL, 오태진 TL 이 함께 작성하였습니다. SK 하이닉스는 AI 시대라는 새로운 세상의 중심에 반도체가 있다는 사명감을 가지고 최고의 기술력을 향해 끊임없는 혁신을 이뤄 가고 있습니다. 세계 최고 성능의 HBM3를 최초 개발 및 출시한 데 이어 확장 버전인 HBM3E 역시 세계 최초 양산에 성공하며 메모리 반도체 시장을 선도하고 있고, 세계 […]

AWS가 제공하는 완전 관리형 병렬 파일시스템, HAQM FSx for Lustre – 1

이전 글에서는 병렬 파일시스템의 기본 개념과 특징, 그리고 대표적인 병렬 파일시스템인 Lustre에 대해 살펴보았습니다. 병렬 파일시스템은 무엇이고 왜 필요할까? 지구상에서 가장 인기있는 병렬 파일시스템, Lustre 파일시스템 알아보기 이번에는 AWS가 제공하는 완전 관리형 병렬 파일시스템 서비스인 HAQM FSx for Lustre를 알아보겠습니다. What is HAQM FSx for Lustre? 고성능 컴퓨팅(HPC) 환경에서는 대량의 데이터를 신속하게 처리해야 하며, 이를 […]

HAQM Bedrock에서 교차 리전 추론 시작하기

이번 게시글은 AWS Machine Learning Blog에 게시된 Getting started with cross-region inference in HAQM Bedrock by Talha Chattha, Andrew Kane, Rupinder Grewal, and Sumit Kumar를 한국어 번역 및 편집하였으며, 현재 2025.02 기준으로 변경된 내용 (에: 가능 모델) 을 반영하여 작성되었습니다. 생성형 AI 솔루션의 등장으로 기업들이 파운데이션 모델을 도입하여 전례 없는 기회를 창출함에 따라, 산업 전반에서 […]

AWS AI Day Hackathon 고객 사례 3부: 카카오스타일의 AI 기반 맞춤형 여행 가이드 서비스

지난 11월 진행된 AWS AI Day Hackathon 2024에서 13개 기업들이 선보인 혁신적인 프로젝트들을 시리즈로 소개해 드리고자 합니다. 해커톤 고객 사례 시리즈를 통해 각 기업들이 HAQM Bedrock을 활용해 실제 비즈니스 과제를 어떻게 해결했는지, 기술적 접근 방식과 구현 과정에서의 인사이트를 심층적으로 다뤄보고자 합니다. 본 시리즈가 생성형 AI 도입을 고민하시는 분들께 실질적인 참고 사례가 되길 바랍니다. 해커톤의 전반적인 […]

AWS AI Day Hackathon에서 GenAI로 미래를 창조하기

지난 2024년 11월 15일, AWS Korea가 위치한 센터필드 18층에서는 해커톤 ‘AWS AI Day Hackathon 2024’가 진행되었습니다. AWS Korea는 2024년 처음으로 대고객 해커톤 행사를 주최했습니다. 뜨거운 참여 열기 속에 13개 팀이 최종 참가팀으로 선별되었으며, 총 59명의 참가자가 각 산업군에서 발생하는 기술 과제를 식별하고 AI를 통해 해결해 나가는 시간을 가졌습니다. 접수 마감 이후 결과물 발표까지 3주간의 시간 […]

AWS re:Invent 2024, EC2 인스턴스 RECAP 살펴보기

AWS가 매년 주최하는 세계 최대 규모의 클라우드 컴퓨팅 컨퍼런스인 AWS re:Invent가 2024년도에도 미국 라스베이거스에서 성황리에 개최되었습니다. Re:Invent를 통해 새롭고 다양한 서비스 및 기술들이 매년 쏟아지고 있습니다. 이번 블로그에서는 AWS re:Invent 2024 를 전후로 출시된 EC2 인스턴스 관련 새로운 기술 중, 특히 머신 러닝 용 가속기 관련 내용들을 중심으로 소개하고자 합니다. 이 블로그는 단순히 신규 출시된 […]

HAQM Bedrock Knowledge Bases의 Structured Data Retrieval로 이제 자연어로 구조화된 데이터를 쉽게 조회하세요!

생성형 AI 기술의 발전은 기업들에게 혁신적인 기회를 제공해왔습니다. 특히 HAQM Bedrock의 Knowledge Base는 기업의 비정형 데이터를 활용하여 맥락에 맞는 정확한 응답을 생성하는 데 큰 역할을 해왔습니다. 그러나 기업 환경에서는 비정형 데이터 못지않게 구조화된 데이터의 중요성이 매우 큽니다. 특히 재무 보고서, 판매 실적, 재고 현황 등 100% 정확성이 요구되는 정보를 조회할 때는 기존의 생성형 AI 모델만으로는 […]