推广 热搜： page 关键词链接搜索红书获取哪些数据分析服务数据

dialogbot：开箱即用的对话机器人解决方案，涵盖问答型对话、任务型对话和聊天型对话等多种场景，为您提供全方位的对话交互体验。

日期：2025-01-01 作者：g22go caijiyuan 评论：0 移动：https://sicmodule.kub2b.com/mobile/news/14474.html

核心提示：人机对话系统一直是AI的重要方向，图灵测试以对话检测机器是否拥有高度的智能。如何构建人机对话系统或者对话机器人呢

人机对话系统一直是AI的重要方向，图灵测试以对话检测机器是否拥有高度的智能。如何构建人机对话系统或者对话机器人呢？

对话系统经过三代的演变：
1. 规则对话系统：垂直领域可以利用模板匹配方法的匹配问句和相应的答案。优点是内部逻辑透明，易于分析调试，缺点是高度依赖专家干预，
  缺少灵活性和可可拓展性。
2. 统计对话系统：基于部分可见马尔科夫决策过程的统计对话系统，先对问句进行贝叶斯推断，维护每轮对话状态，再跟进对话状态进行对话策略的选择，
  从而生成自然语言回复。基本形成现代的对话系统框架，它避免了对专家的高度依赖，缺点是模型难以维护，可拓展性比较受限。
3. 深度对话系统：基本延续了统计对话系统的框架，但各个模型采用深度网络模型。利用了深度模型强大的表征能力，语言分类和生成能力大幅提高，
  缺点是需要大量标注数据才能有效训练模型。
对话系统分为三类：
- 问答型对话：多是一问一答，用户提问，系统通过对问题解析和查找知识库返回正确答案，如搜索。
- 任务型对话：指由任务驱动的多轮对话，机器需要通过理解、主动询问、澄清等方式确定用户目标，然后查找知识库返回结果，完成用户需求。
  如：机器人售电影票。
- 聊天型对话：目标是产生有趣且富有信息量的自然答复使人机对话持续下去，如小度音响。

计算用户问句与问答库中问句的相似度，选择最相似的问句，给出其对应的答复。

句子相似度计算包括以下方法：

TFIDF
BM25
OneHot
Query Vector

对百度、Bing的搜索结果摘要进行答案的检索

百度搜索，包括百度知识图谱、百度诗词、百度万年历、百度计算器、百度知道
微软Bing搜索，包括bing知识图谱、bing网典

End to End Memory Networks(memn2n)
BABi dataset

GPT2 Model
Sequence To Sequence Model(seq2seq)
Taobao dataset

Official Demo: https://www.mulanai.com/product/dialogbot/

The project is based on transformers 4.4.2+, torch 1.6.0+ and Python 3.6+.
Then, simply do:

or

example: examples/bot_demo.py

output:

example: examples/taskbot_demo.py

3.3.1 GPT2模型使用

基于GPT2生成模型训练的聊天型对话模型。

模型已经 release 到huggingface models：shibing624/gpt2-dialogbot-base-chinese

example: examples/genbot_demo.py

output:

3.3.2 GPT2模型fine-tune

数据预处理
在项目根目录下创建data文件夹，将原始训练语料命名为train.txt，存放在该目录下。train.txt的格式如下，每段闲聊之间间隔一行，格式如下：

运行preprocess.py，对data/train.txt对话语料进行tokenize，然后进行序列化保存到data/train.pkl。train.pkl中序列化的对象的类型为List[List],记录对话列表中,每个对话包含的token。

训练模型
运行train.py,使用预处理后的数据，对模型进行自回归训练，模型保存在根目录下的model文件夹中。

在训练时，可以通过指定patience参数进行early stop。当patience=n时，若连续n个epoch，模型在验证集上的loss均没有下降，则进行early stop，停止训练。当patience=0时，不进行early stop。

代码中默认关闭了early stop，因为在实践中，early stop得到的模型的生成效果不一定会更好。

更多的训练参数介绍，可直接看train.py中的set_args()函数中的参数说明

3.3.3 预测模型（人机交互）

运行interact.py，使用训练好的模型，进行人机交互，输入q结束对话之后，聊天记录将保存到sample.txt文件中。

执行interact.py时，可以尝试通过调整topk、topp、repetition_penalty、max_history_len等参数，调整生成的效果。更多的参数介绍，可直接看interact.py的set_args()函数中的参数说明
如果要使用GPU进行生成，则不要调用–no_cuda参数，并且通过–device gpu_id来指定使用哪块GPU。

问答示例

sample1

sample2

闲聊语料分享
|中文闲聊语料 | 数据集地址 |语料描述|
|---------|--------|--------|
|常见中文闲聊|chinese_chatbot_corpus|包含小黄鸡语料、豆瓣语料、电视剧对白语料、贴吧论坛回帖语料、微博语料、PTT八卦语料、青云语料等|
|50w中文闲聊语料 | 百度网盘【提取码:4g5e】或 GoogleDrive |包含50w个多轮对话的原始语料、预处理数据|
|100w中文闲聊语料 | 百度网盘【提取码:s908】或 GoogleDrive|包含100w个多轮对话的原始语料、预处理数据|

中文闲聊语料的内容样例如下:

模型分享

模型共享地址模型描述model_epoch40_50wshibing624/gpt2-dialogbot-base-chinese 或百度网盘(提取码:taqh) 或 GoogleDrive使用50w多轮对话语料训练了40个epoch，loss降到2.0左右。

Reference

Wen T H, Vandyke D, Mrksic N, et al. A Network-based End-to-End Trainable Task-oriented Dialogue System[J]. 2016.
How NOT To evaluate Your Dialogue System: An Empirical Study of Unsupervised evaluation Metrics for Dialogue Response Generation
A. Bordes, Y. Boureau, J. Weston. Learning End-to-End Goal-Oriented Dialog 2016
Zhao T, Eskenazi M. Towards End-to-End Learning for Dialog State Tracking and Management using Deep Reinforcement Learning [J]. arXiv preprint arXiv:1606.02560, 2016.
Kulkarni T D, Narasimhan K R, Saeedi A, et al. Hierarchical deep reinforcement learning: Integrating temporal abstraction and intrinsic motivation [J]. arXiv preprint arXiv:1604.06057, 2016.
BBQ-Networks: Efficient Exploration in Deep Reinforcement Learning for Task-Oriented Dialogue Systems
Deep Reinforcement Learning with Double Q-Learning
Deep Attention Recurrent Q-Network
SimpleDS: A Simple Deep Reinforcement Learning Dialogue System
Deep Reinforcement Learning with a Natural Language Action Space
Integrating User and Agent Models: A Deep Task-Oriented Dialogue System
The Curious Case of Neural Text Degeneration
DialoGPT: Large-Scale Generative Pre-training for Conversational Response Generation
vyraun/chatbot-MemN2N-tensorflow
huggingface/transformers
Morizeyao/GPT2-Chinese
yangjianxin1/GPT2-chitchat

参考链接:https://github.com/shibing624/dialogbot

本文地址：https://sicmodule.kub2b.com/news/14474.html 企库往 https://sicmodule.kub2b.com/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

更多>同类最新资讯

0 条相关评论

文章列表

相关文章

先一步开启“年味”：鲸灵羽绒季&年货节刷新品牌战绩

最新动态

推荐图文

最新资讯

点击排行

• 过年无忧｜一键get这些春节话术！	• 2025在新加坡生活的我们将迎来“至暗时刻”：房
• 太抽象！太抽象！2024年游戏行业简直太抽象！	• TikTok会如何收场
• 今天上午10：00，成绩发布！	• 农村土地托管服务的理论基础
• 头上三尺有神明，每个人头顶都有一颗星，当星光	• 运营师抖音代运营
• 微短剧，2024年“最大赢家”？｜年终盘点	• 同类第一！20%弹性的人工智能 ETF 科创(588760)