亚马逊AWS官方博客
基于 LobeChat 构建企业内部 LLM 知识库平台
![]() |
1. LobeChat 介绍
LobeChat 是一款开源的 AI 对话应用,专为用户打造高效便捷的智能对话解决方案。通过与 HAQM Bedrock 的深度集成,LobeChat 可以无缝调用多种强大的大语言模型,包括 HAQM Titan、Anthropic Claude、AI21 Labs 等,充分利用 Bedrock 的灵活性和扩展能力,为用户提供优质的对话体验。
LobeChat 提供丰富的功能扩展,包括多轮对话、知识库问答和自定义 API 调用,特别适合企业在客户服务、业务咨询以及内部知识管理等多种场景中使用。对于企业内部知识库管理,LobeChat 能够高效整合分散的信息资源,构建统一的知识问答平台,帮助员工快速获取所需信息,大幅提升内部协作与效率。
借助 HAQM Bedrock 的无服务器架构,LobeChat 可灵活应对业务增长需求,实现高度可扩展的服务能力,同时确保高安全性与高可靠性。这使其成为零售、电商等企业在内部知识管理、智能问答和高效运营中不可或缺的智能化工具。LobeChat 为企业实现数字化转型提供了强大的支持,并助力打造高效、智能的工作流程。
2. 部署架构图
![]() |
本架构展示了 LobeChat 与 AWS 服务集成的整体流程,提供高效、灵活的 LLM 知识库解决方案:
- 用户认证与访问加速:
-
- 使用 HAQM Cognito 进行用户登录和身份验证,确保安全访问。
- 通过 HAQM CloudFront 提供低延迟和高速的内容分发,优化全球访问速度,确保全球用户均能享受到快速稳定的服务,提升用户体验。
- 系统部署与存储:
-
- ECR (Elastic Container Registry):用于存储 LobeChat 镜像,通过 EC2 进行镜像构建和推送,并直接部署到 EC2 实例,实现镜像构建与部署的高效性。
- HAQM S3:存储知识库的原始文件,为后续处理提供数据支持,支持大规模非结构化数据的管理。
- HAQM RDS for PostgreSQL:用于存储知识库向量,支持高效的检索和管理。RDS 提供的数据库自动扩展和备份功能,确保了数据的高可用性和容灾能力。
- 模型集成与嵌入:
-
- 对接 HAQM Bedrock,支持 Claude 3.5 Sonnet v2 和 Llama 等多种大语言模型,满足不同场景下的生成式 AI 需求,保证系统的强大处理能力。
- 使用 Titan Embedding 作为知识库的嵌入模型,提供高质量的文本向量化能力。
- 高效、安全的知识库管理:
-
- 通过 RDS 和 S3,LobeChat 能够高效存储和管理大规模的结构化与非结构化数据,优化了知识库的检索速度与准确性。
- 灵活的 AI 模型支持:
-
- 集成多种强大的 AI 模型(如 Claude 3.5 Sonnet v2 和 Llama)和 Titan Embedding,确保系统能够满足各种自然语言处理任务的需求。
- HAQM Bedrock 的弹性和多模型支持让企业可以根据需求选择最合适的模型,并进行灵活的定制。
3. 部署说明
3.1 确定 LobeChat 访问域名
对于 HAQM Cognito 和 LobeChat 来说,域名是必不可少的,因为它能够有效防止开放重定向攻击,确保回调请求来源的合法性,避免恶意攻击者通过伪造 IP 地址绕过安全验证。同时,域名支持 HTTPS 加密通信,确保敏感数据在传输过程中得到保护。使用域名还简化了跨多个环境(如开发、生产环境)的管理,增强了系统的可扩展性和灵活性。总之,必须使用域名,以确保遵循 OAuth2.0 等身份验证标准,从而保障系统的安全性、合规性和可靠性。
本方案中将使用 lobechat.xxx.com 作为示例,您在部署时请更改为您自己合适的域名。
3.2 创建 HAQM Cognito
HAQM Cognito 是一项由 AWS 提供的身份管理服务,旨在简化用户身份验证、授权和用户数据同步。它允许开发者轻松地在应用程序中实现用户注册、登录、身份验证和访问控制功能,同时保证安全性和可扩展性。Cognito 主要面向移动应用和 Web 应用开发者,提供了多种身份验证方式,支持单点登录(SSO)和社交登录。
1. 创建 Cognito 用户池
![]() |
- 应用程序类型选择《传统的 Web 应用程序》
- 命名您的应用程序修改为 LobeChat
- 登录标识符的选项选择电子邮件
- 点击创建
2. 设置允许的 URL
![]() |
在《编辑管理登录页面》设置允许回调 URL 和运行的注销 URL,分别为 http://lobechat.xxx.com/api/auth/callback/cognito 和 http://lobechat.xxx.com。
![]() |
在《编辑管理登录页面》设置允许回调 URL 为 http://lobechat.xxx.com/api/auth/callback/cognito。
3. 记录应用程序的客户端 ID 和客户端密钥,后续会在 LobeChat 的环境文件中进行配置使用
![]() |
本示例的客户端 ID 为:6r1gj6jvt6a61cagvtfbvv9b1t,客户端密钥为:ctooihnq68bjenrdkae2k5scdf03273l4enqusov7m67b8ge5s。
3.3 启动 EC2
1. 登录 AWS 管理控制台,导航到 EC2 控制面板
![]() |
2. “HAQM Machine Image (AMI)” 选择 “HAQM Linux 2023 AMI”,实例类型选择 m5.xlarge。
3. 设置密钥对、网络、存储等其他设置。
4. 点击下一步,启动 EC2。
3.4 创建 RDS 数据库
1. 选择 PostgreSQL 引擎
![]() |
2. 数据库实例选择 db.m6gd.large
![]() |
3. 使用 SSH 连接到 EC2 实例
4. 修改以下红色参数
5. 修改参数后,执行以下命令:
3.5 配置 CloudFront
1. 创建 CloudFront 分配,设置自定义源为 EC2 地址,以及端口号
![]() |
2. 配置域名及证书
![]() |
3. 创建分配,待部署完成后,访问 http://lobechat.xxxx.com 进行 Lobechat 访问
3.6 访问 Lobechat
1. 点击左上角进行登录,跳转到 HAQM Cognito 页面进行用户登录,如下:
![]() |
2. 登录成功后,进入首页,如下:
![]() |
3. 添加知识库,上传知识库文件,如下:
![]() |
4. 对上传的知识库进行 Chunking 向量存储,如下:
![]() |
5. 点击 Chunking 后,将调用 Embedding 模型进行自动向量化,如下:
![]() |
6. 使用知识库进行对话,点击对话框上的书架进行知识库的选择即可,如下:
![]() |
7. 对话框中提出问题后,LobeChat 将自动引用知识库进行回答,如下:
![]() |
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。