从想法到现实:如何构建自己的个人 AI 助理 Web 应用程序。是否希望拥有一个像托尼·斯塔克饰演的贾维斯那样的个人人工智能助理?或者《钢铁侠星期五》来帮助完成任务、回答问题并陪伴在身边?
很庆幸生活在这个时代,本文将把这个科幻梦想变成了现实!算是很少的一部分,一个雏形。在本文中,将展示如何使用 Python FastAPI、ReactJS 和 GPT-3 语言模型构建自己的 AI 助手。
将看到人工智能助手的演示,并探索系统设计和架构。将详细介绍后端和前端的工作原理,以便更好地了解幕后所发生的一切。
从想法到实现:将梦幻般的人工智能助手变成有形的网络应用程序!在之前的文章《掌握AI摘要技术解锁个人第二大脑》中,探索了如何使用 Python 和 ChatGPT 创建人工智能驱动的第二大脑。第二个大脑能够根据用户提供的上下文数据来记住和组织信息。
在这篇文章中,通过实际构建一个个人人工智能助理来将事情提升到一个新的水平,可以用自然语言与它交谈、倾听和提问。
此外,借助 GPT-3 和网络抓取的强大功能,该人工智能助手可以提供超出用户提供的上下文数据的更多见解和答案。
人工智能助手的交互方式
先来看下这个简单版本的 JARVIS 所涉及的步骤:
- 将鼠标悬停在 按钮上
- 录音开始
- 对着麦克风说出你的问题
- 将鼠标光标移离按钮
- 后端魔法奇迹发生了!
- 人工智能助手通过扬声器向你说出答案
- 还可以在用户界面中获得问题/答案的文本记录
系统设计和架构一览
从这里开始将注意力转移到技术细节上。将系统分解为多个组件,它会是这样的:
- GPT-3 作为大型语言模型 (LLM)
- Llama-Index 用于向量化上下文数据并将其传递给 GPT-3
- Python FastAPI 服务器与经过训练的 LLM 模型进行交互
- ReactJS 和 ChakraUI 构建前端 UI
- 用于语音输入的 Webkit SpeechRecognition 库
- 用于文本转语音的 Webkit SpeechSynthesisUtterance 库
如果把所有这些放在一起,系统就是这样的。
从左到右、从上到下阅读系统设计图。
现在对系统的工作原理有了更全面的了解,接下来将按照前端和后端实现逐步深入的介绍。
后端:为 AI 助手提供支持
在过去的几个月里,ChatGPT 毫不夸张地说已经占领了世界。可以要求它做作业、准备演示文稿、编写 SQL 查询、编写代码、书写商务邮件、生成逼真的图像和视频等等。