Uber 开源研究对话系统 Plato,用于开发和训练会话 AI
“在过去的几十年中,智能会话代理已经发生了显著的变化,从关键字定位交互式语音应答(IVR)系统到正在成为日常生活中不可或缺的一部分的跨平台智能个人助理。随着这种增长,需要直观、灵活和全面的研究和开发平台,可以作为开放的测试平台,帮助评估新算法,快速创建原型,并可靠地部署会话代理。 ”
在这种背景下,Uber AI(Uber 的人工智能研究部门)开发并且开源了柏拉图( Plato )研究对话系统。Plato 旨在构建、训练和部署会话 AI 代理,使数据科学家和业余爱好者能够从原型和演示系统中收集数据。它提供干净且易于理解的设计,并与现有的深度学习和贝叶斯优化框架(用于调整模型)集成,可减少编写代码的需要。
目前,Plato 支持通过语音、文本或结构化信息(换句话说,对话行为)进行交互,并且每个会话代理可以与人类用户、其他会话代理(在多代理设置中)或数据进行交互。最重要的是,Plato 可以为会话代理的每个组件包裹现有的预训练模型,并且每个组件都可以在线(在交互期间)或离线(从数据)进行训练。
Plato 通过模块化设计实现了这一目标,将数据处理分为七个步骤:
- 语音识别(将语音转录为文本)
- 语言理解(从该文本中提取意义)
- 状态跟踪(到目前为止已经说过和完成的内容的汇总信息)
- API 调用(搜索数据库,查询 API 等)
- 对话策略(生成代理人回应的抽象含义)
- 语言生成(将抽象意义转换为文本)
- 语音合成(将文本转换为语音)
每个单独的组件都可以使用任何机器学习库(例如,Ludwig、TensorFlow 或 PyTorch)进行在线或离线训练,因为 Plato 是一个通用框架。
▲Plato 的架构允许对多个代理进行并发训练
为了证明其可扩展性,Plato 用户可以通过提供该类模块的 Python 类名和包路径以及模型的初始化参数来定义自己的体系结构或插入自己的组件。只要模块按照它们应该执行的顺序列出,Plato 就会处理其余部分,包括包装输入和输出,链接和执行模块(串行或并行),以及促进对话。
在数据记录方面,Plato 会在名为 Dialogue Episode Recorder 的结构中跟踪事件,该结构包含有关先前对话状态、所采取的操作、当前对话状态等信息。还包括一个自定义字段可用于跟踪不属于定义类别的任何内容。
Uber AI 的研究人员在***表示:“我们相信,Plato 能够在和其他开源的深度学习框架中更加无缝地训练会话代理,从而改善学术和行业应用中的对话 AI 技术,随着时间的推移,他们的谈话会变得越来越自然。”
时间:2019-07-26 23:12 来源:未知 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
- [人工智能]2021年可供选择的开源物联网工具
- [人工智能]蔡自兴院士:开源开放是人工智能发展新趋势
- [人工智能]联邦学习也不安全?英伟达研究用「没有隐私」的数据直接重建原图
- [人工智能]外媒:美研究人员发明全新感应设备 通过AI识别手势
- [人工智能]研究公司统计了9大AI领域,分析了世界各国AI法律举措
- [人工智能]单张图像就可以训练GAN!Adobe改良图像生成方法 | 已开源
- [人工智能]人工智能技术在作战筹划系统中的应用研究
- [人工智能]PyTorch版《动手学深度学习》开源了,最美DL书遇上超赞DL框架
- [人工智能]浪潮开源发布全球首个完整方案的FPGA高效AI计算
- [人工智能]TPU、GPU、CPU深度学习平台哪家强?有人做了一个基准测试研究
相关推荐:
网友评论: