一、用VoiceXML实现语音浏览(论文文献综述)
张勤[1](2013)在《基于XML的Voice XML解析器的设计框架》文中研究指明VoiceXML是建立于XML语言规范基础之上的一种应用于语音浏览的标记语言。利用VoiceXML,用户可以开发出基于语音的Web应用系统,能够通过语音来方便的访问网络,获取信息和得到资源,从而简化网络的访问手段,扩大网络的访问范围。本文将着重通过分析设计VoiceXML解析器的基本框架,突出VoiceXML解析器的作用和地位。
张坤飞[2](2012)在《基于CTI技术的断电告警监控系统的设计与实现》文中指出随着网络技术的发展,计算机网络与电信网产生了交集,并且有不断相互融合的趋势。CTI技术以语音卡作为两网连接的媒介,实现信息交换的目的。利用计算机的软硬件技术,容易实现电信业务的扩展。当前,CTI技术已经被应用到了各行各业中,为企业创造了更多的价值,同时给客户带来了更好的服务体验。信息技术的发展使得人们对服务的质量提出了更高的要求,对作为基础设施的电力系统的要求更为严格,为一般用户和企业提供正常的供电是电力企业的一项基本服务,与当今社会发展和人们生活水平的息息相关。当前电信运营商的各个接入网点都接有断电告警器,断电告警器与被监测的电力线电源连接,当电源断电时通过固定电话线路拨号到预先设定的维护人员电话号码,维护人员根据来电显示号码和报警声,可确定何处断电,达到设备的电源一有故障立即通知有关人员的目的,以便及时处理。但由于每个断电告警器可设置的号码个数有限,且通知的方式过去简单,导致部分模块网点断电后,是否成功通知到相关维护人员也未可知,没办法做到统一调度、统一管理。鉴于以上问题,开发这套断电告警监控系统,将全市各区县的各个模块局网点的断电报警集中到本系统,再由本系统负责去通知对应的维护人员,并记录通知结果,从而实现统一调度、统一管理,并以此为考核维护人员工作效率之依据。本文首先介绍了CTI技术的相关背景知识、呼叫中心的发展、几种信令方式和电话语音卡特点及相关标准,然后针对断电告警系统的要求进行架构设计、模块设计和数据库设计,第五章详细说明了系统的三大部分的实现过程和其中用到的一些技术原理。最后总结了系统中的不足,提出了以后的改进方向。
闫贺[3](2012)在《基于语音的移动机器人控制研究》文中提出语音识别是智能机器人研究领域的一个重要分支。如今各式各样的机器参与了人类的生产活动和社会活动。随着电子计算机和人工智能机器的广泛应用,人们发现,人和机器之间最好的信息交流方式就是语言通信,而语音就是语言的声学表现形式。实现人机之间毫无阻碍的语音交流是人类梦寐以求的想法。本文围绕语音识别和移动机器人的语音控制等技术开展研究,主要完成了如下工作:首先,介绍了语音识别技术的发展情况。对国内外该技术的研究现状、研究方法等进行了归纳和总结,分析了各方法的优点和不足之处,为本文的研究工作奠定了重要的基础。其次,在时域领域介绍了语音信号的产生模型、预处理、加窗分帧、端点检测及特征提取等,提取了语音的短时能量和平均幅度、短时平均过零率等特征参数,将语音的模拟信号转化成数字信号。再次,分别对语音识别领域的两种常用算法进行了详细的介绍。DTW算法采用模板匹配的方法来进行语音识别,它应用动态规划方法解决了语音特征参数不等长的问题,主要应用在特定人、孤立词或字语音识别领域;HMM算法根据语音发音的变化,采用概率计算的方法实现语音识别,主要应用在非特定人、小词汇量的语音识别领域。并通过设计相关的实验分别实现了基于上述两种算法的语音识别技术。实验结果表明,在小词汇量语音识别领域,DTW算法比较适合特定人语音识别,HMM算法比较适合非特定人语音识别。最后介绍了实验室MT-ARM移动机器人的系统架构,设计了基于HMM算法的机器人语音控制软件,实现了对机器人本体和四自由度模块化机械臂的语音控制操作。机器人检测到有语音输入后,进行语音识别,匹配成功后输出控制指令并执行相关的控制操作。实验结果验证了方案的有效性。
王晓峰[4](2010)在《基于VoiceXML的语音门户设计和实现》文中进行了进一步梳理VoiceXML(语音扩展标记语言)是一种基于XML(扩展标记语言)的互联网标记语言,它突破性实现了互联网与电话网的融合,并用于开发语音应用系统,使得用户能通过电话来访问互联网上的信息服务。为了克服传统的IVR(Interactive Voice Response)中获取信息手段单一,信息量过少的缺点,本文设计并实现了基于VoiceXML的语音门户,以此代替传统IVR作为呼叫中心的入口。首先,本文分析了语音门户的特点与功能,并在此基础上提出了语音门户的整体架构设计,将其细分为用户、语音浏览器、后台服务三层。然后对系统中各功能模块进行细分,将语音浏览器分为语音平台和VoiceXML解析器两大模块。最后,以广东省高速公路呼叫中心项目需求为出发点,结合SIP开源项目,在此基础上设计并实现了基于SIP协议栈并应用VoiceXML技术的语音门户。该系统不仅具备传统IVR功能,更利用了VoiceXML语言的特性,达到了电话访问Internet资源的目的。
于周锋,蒋泽军,王丽芳[5](2009)在《动态加载TTS的IVR平台设计与实现》文中研究表明分析了交互式语音自动应答平台的功能特点,设计系统平台的网络拓扑架构,详细分析了平台的设计原理和结构,及其工作流程。使用Microsoft Speech SDK与第三方语音库SmartRead Fe-male Chinese将文字转换为语音音频文件,完成系统动态加载TTS功能,集成了语音卡,实现系统的语音识别、播放、状态控制等功能。给出了系统总体设计结构类图,最后使用了一个测试实例,给出了结果,并分析了输出音频频率与波形。语音卡能够很好地播放第三方语音库合成的语音,整个系统的扩展性安全性得到大幅度提升。
刘锋[6](2009)在《基于VoiceXML的语音智能交互平台的研究与实现》文中提出交互式语音应答(Ineractive Voice Response, IVR)是呼叫中心中负责与客户交互完成自助服务的设备。传统的IVR系统主要以按键式为主,业务流程使用自定义的脚本语言描述。这种解决方案存在脚本语言无法统一、无法与Web服务紧密结合、产品缺乏竞争力等缺点。随着语音技术的发展,人机语音交互将是IVR技术发展的必然趋势。语音扩展标记语言(Voice eXtensible Markup Language, VoiceXML)是一种基于Web的标记语言,用来描述人与计算机进行语音对话的过程,同时该标记语言可以用来描述语音流程。本文在对传统IVR技术研究的基础上,采用VoiceXML解决方案,使用语音合成技术、语音识别技术完成了基于VoiceXML的语音智能交互平台的研究与实现。语音智能交互平台以VoiceXML作为标准脚本语言,以浏览器和电话方式进行交互并支持语音合成,语音识别功能。语音智能交互平台在开源项目OpenVXI的基础上实现了对语音合成引擎,语音识别引擎的集成,完成了VoiceXML的解析和语音系统接口的设计开发,使人机可以语音交互。同时在语音智能交互平台中定义了满足本项目需求的VoiceXML标记的子集,并采用MSXML解释器实现了对该子集的解析使智能交互平台实现了导航功能和服务功能。智能交互平台的服务功能可以根据不同的应用需求,进行可定制的服务,而且根据本文提出的智能化策略完成了智能服务功能。最后本文设计了一个测试实例,对智能交互平台进行了测试。
查玮[7](2009)在《基于VoiceXML技术的可视化IVR系统设计和实现》文中提出为了缩短交互式语音应答(IVR:Interaction Voice Response)系统流程开发周期,克服传统IVR系统业务流程编写复杂的困难,同时与VoiceXML技术相结合,本文设计并实现了基于VoiceXML技术的可视化IVR系统。本文设计的IVR系统,将整个系统分为流程编辑工具、含有VoiceXML标签的Web页面和执行引擎三个部分,完成了总体框架及其核心部分的设计与实现。本文研究了可视化技术的现状和理论,并对传统IVR系统流程编辑工具做了分析与对比,并在此基础上,从灵活、方便以及友好的用户界面的设计原则出发,对IVR系统的流程工具进行了详细的设计与实现。然后,在分析当前Web技术发展的情况下,本文与企业数据业务紧密结合,提出了将业务流程类比成企业门户网站的解决方案。该方案结合OpenVXI开源项目,使用VoiceXML技术,设计并实现了IVR系统的执行引擎。
王京雷[8](2008)在《基于VoiceXML的图书馆语音服务研究》文中研究指明近年来,移动通信技术得到了空前迅速的发展,移动电话的用户出现了爆炸式的增长。人们对使用移动电话在任何时间和任何地点访问因特网产生了浓厚的兴趣,并且这已经成为许多人的普遍愿望。可以预言,届时,利用语音技术通过移动电话来访问因特网将会成为一种非常流行的手段。VoiceXML(语音扩展标记语言)是一种基于XML(扩展标记语言)的因特网标记语言,它可以用来开发交互式语音应用程序。通过交互式语音应用程序,用户就可以通过电话来访问因特网上的内容,而不是通过计算机键盘和显示器与应用程序进行交互操作。本文通过研究VoiceXML和相关语音技术,以及提高VoiceXML语音系统性能的方法,以VoiceXML标准设计并开发出一个属于图书馆的语音应用服务模型系统。该系统可供用户通过使用自然语音(或按键)查询相关信息及办理一些常用的业务。另外,由于该系统采用文语转换技术直接将系统的应答从文本转换成语音,因而具有极佳的动态性和交互性。基于VoiceXML的图书馆语音服务系统,为传统图书馆提供了创新的服务渠道,使读者可以通过电话访问图书馆Web数据库中的内容,从而大大扩展了图书馆的应用范围和服务能力。
朱瑞贤[9](2008)在《VoiceXML解析器的研究与实现》文中研究说明电信技术和计算机技术的发展,使得计算机和电信技术出现了融合。Java技术和XML技术是当前计算机领域的热门技术,把这两种技术和电信的业务开发结合起来是大势所趋。VoiceXML的出现就是计算机Web技术和XML技术和电信融合的产物。VoiceXML语言1.0版本的应用,在电信业务开发方面VoiceXML语言体现出来较大的优势,已经成为电信业通用的业务提供语言之一。在VoiceXML之后,迅速出现了CCXML、SSML等电信专用XML标记语言作为VoiceXML语言的补充,现在已经有支持CCXML、SSML语言的产品出现,对电信专用XML语言的研究是当前电信领域学术研究的一个热点。本文首先介绍VoiceXML出现的技术背景,其次VoiceXML语言本身的一些特征和业界的解析器研究状况。然后说明了VoiceXML在一些系统中的具体应用。第四章阐述VoiceXML解析器设计和实现,首先分析现有的解析器,说明其中存在的一些问题,然后提出相应的系统优化。在系统整体结构方面,增加了解析器对SSML语言的支持,把SSML的解析作为一个完整的单元模块提供出来;在VoiceXML语言方面,扩充对会议控制的功能,提高了VoiceXML语言的控制能力;在效率方面,引入线程池的技术,减少由于线程频繁创建和销毁产生的系统开销。然后分别从模块接口、内部数据结构和功能内部封装三个方面,详细说明基本模块、脚本解析模块、线程模块、缓存模块、SSML等模块的具体实现。第五章介绍了VoiceXML实现的业务和VoiceXML业务生成环境。第六章对论文的撰写和读研期间的工作做简要的回顾。
于翔[10](2008)在《VoiceXML语音浏览器的实现与整合》文中进行了进一步梳理人们可以使用电话或移动电话、PC、PDA和其它智能设备通过语音识别、语音合成的交互技术,以及语音浏览、智能信息处理技术等实现访问互联网,实现个人服务和商业服务的语音应用。其中,作为建立于网络与语音通讯之间的桥梁,语音浏览技术发挥着重要的作用。而作为语音浏览技术以及语音互联网的核心,VoiceXML突破性地实现了互联网与电话网的融合,为语音应用领域展现了一个更为广阔的未来。本文在分析VoiceXML、语音识别、语音合成、文档解析等技术的基础上,完成了基于窄带智能网的VoiceXML语音浏览平台的原型系统设计并对系统结构、设计思想进行了详细介绍。本语音浏览平台以卡耐基梅隆大学的开源项目OpenVXI为核心,分为执行平台,VoiceXML语音浏览器和文档服务器三部分,本文重点介绍了VoiceXML语音浏览器的设计、实现、优化以及与执行平台的整合。针对语音浏览器与执行平台高度耦合的局限,本语音浏览器采用标准的INAP/UIScript消息与执行平台进行交互,使其很容易、快速地部署到现有的窄带智能网平台中,并可以轻松地在不同设备制造商的智能网平台间迁移。本语音浏览器的设计充分考虑了大规模商业应用的需要,通过采用多线程多通道的呼叫控制模型满足了商业应用环境下的大话务量并发呼叫请求。由于OpenVXI没有对语音文件播放进行缓存,常常导致不必要的语音文件重复下载,严重地影响语音浏览平台的性能。因此本文提出了一种对语音浏览器的优化方案,通过引入VoiceAgent模块实现对语音文件的缓存,从而极大地提高了整个语音浏览平台的性能。为了更方便快捷地测试语音本浏览器的功能和性能,本文提出了自主开发的自动测试工具VxmlEmul,该工具可以模拟窄带智能网的功能,在不需要SCP、SSP、媒体处理等智能网设备的参与下对语音浏览器进行测试。文章的最后使用VxmlEmul完成了对语音浏览器的测试和性能分析,证实了其实际可行性。本论文的研究工作为进一步的产品化研究和商业应用奠定了一定的基础,并具有实际的参考价值。
二、用VoiceXML实现语音浏览(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、用VoiceXML实现语音浏览(论文提纲范文)
(1)基于XML的Voice XML解析器的设计框架(论文提纲范文)
0 引言 |
1 Voice XML解析器在Web应用系统中的位置及作用 |
2 Voice XML解析器的整体构造 |
2.1 控制接入模块 |
2.2 资源代理模块 |
2.3 对象树生成模块 |
2.4 语义解释模块 |
2.5 输入输出接口模块 |
2.6 Web Server模块 |
3 总结 |
(2)基于CTI技术的断电告警监控系统的设计与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题的意义 |
1.2 国内外的发展 |
1.2.1 基于 CTI 技术的统一网络 |
1.2.2 基于 CTI 技术平台的统一消息 |
1.3 CTI 的概念及应用 |
1.3.1 CTI 的概念 |
1.3.2 呼叫中心系统(CC) |
1.3.3 交互式语音应答(IVR) |
1.3.4 客户关系管理(CRM) |
1.3.5 IP 电话 |
1.4 本章小结 |
第二章 呼叫中心 |
2.0 呼叫中心的发展 |
2.1 第一代呼叫中心系统 |
2.2 第二代呼叫中心系统 |
2.3 第三代呼叫中心系统 |
2.4 第四代呼叫中心系统 |
2.5 国内呼叫中心技术现状与未来 |
2.5.1 呼叫中心的现状 |
2.5.2 呼叫中心的未来 |
2.6 本章小结 |
第三章 信令系统及语音卡 |
3.1 信令的划分及电话呼叫过程 |
3.2 用户线信令 |
3.3 交换机信令 |
3.4 局间信令 |
3.5 语音卡简介 |
3.5.1 电话语音卡的发展 |
3.5.2 语音卡接口及总线 |
3.5.3 语音卡的功能及分类 |
3.5.4 电话应用程序接口 |
3.6 本章小结 |
第四章 系统的总体设计 |
4.1 系统设计思想 |
4.1.1 面向对象技术 |
4.1.2 多线程技术 |
4.2 系统拓扑与架构 |
4.2.1 系统拓扑图 |
4.2.2 系统架构设计 |
4.3 系统功能模块的设计 |
4.3.1 语音卡流程控制设计 |
4.3.2 WEB 系统管理部分设计 |
4.4 数据库设计 |
4.4.1 设计原则 |
4.5 本章小结 |
第五章 系统的实现 |
5.1 自动呼叫应答的实现 |
5.1.1 系统组成 |
5.1.2 主要流程处理过程 |
5.1.3 主要数据结构的分析 |
5.1.4 系统界面 |
5.2 WEB 管理系统的实现 |
5.2.1 系统菜单 |
5.2.2 功能展示 |
5.3 数据库的实现 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 研究展望 |
参考文献 |
致谢 |
(3)基于语音的移动机器人控制研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 本课题研究背景和意义 |
1.2 语音识别技术的国内外发展现状 |
1.3 语音识别系统的分类及性能指标 |
1.4 论文的主要内容及章节安排 |
1.5 资助本课题的专项研究基金 |
第二章 语音识别的基本理论 |
2.1 语音信号的产生模型 |
2.1.1 激励模型 |
2.1.2 声道模型 |
2.1.3 辐射模型 |
2.2 语音信号的预处理 |
2.3 语音信号的加窗处理 |
2.4 端点检测 |
2.4.1 短时平均幅度 |
2.4.2 短时平均过零率 |
2.5 特征提取 |
2.5.1 线性预测系数(LPC) |
2.5.2 线性预测倒谱系数(LPCC) |
2.5.3 Mel频率倒谱系数(MFCC) |
2.6 本章小结 |
第三章 基本DTW的语音识别技术 |
3.1 DTW算法的基本原理 |
3.2 模板训练算法 |
3.2.1 偶然模板训练法 |
3.2.2 顽健模板训练方法 |
3.2.3 非特定人识别的模板训练算法——聚类方法 |
3.3 基于DTW算法的孤立词语音识别实验 |
3.4 本章小结 |
第四章 基于HMM算法的语音识别技术 |
4.1 HMM基本思想 |
4.1.1 马尔可夫链 |
4.1.2 HMM的基本思想 |
4.1.3 HMM定义 |
4.2 HMM基本算法 |
4.2.1 前向-后向算法 |
4.2.2 Viterbi算法 |
4.2.3 Baum-Welch算法 |
4.3 HMM算法实现中的问题 |
4.3.1 初始模型选取 |
4.3.2 多个观察值序列训练 |
4.3.3 数据下溢问题 |
4.3.4 马尔可夫链的形状以及HMM类型 |
4.4 语音识别实验 |
4.5 本章小结 |
第五章 MT-ARM机器人语音控制实验及分析 |
5.1 移动机器人实验平台及环境 |
5.2 软件系统的设计及分析 |
5.2.1 语音识别软件设计 |
5.2.2 移动机器人控制软件设计 |
5.3 语音控制系统的设计及分析 |
5.4 本章小结 |
第六章 结束语 |
6.1 论文的主要工作 |
6.2 论文的创新点 |
6.3 进一步的研究工作 |
参考文献 |
研究生期间发表的论文及专利申请情况 |
致谢 |
(4)基于VoiceXML的语音门户设计和实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题的背景和意义 |
1.2 国内外研究的近况 |
1.2.1 VoiceXML标准 |
1.2.2 VoIP介绍 |
1.3 论文的研究内容 |
1.3.1 本文的课题来源 |
1.3.2 本文的主要工作 |
1.4 论文的章节安排 |
第二章 相关技术研究 |
2.1 VOICEXML概述 |
2.1.1 VoiceXML的目标和特点 |
2.1.2 VoiceXML结构模型和范围 |
2.1.3 VoiceXML的语法 |
2.1.4 VXML的标记 |
2.1.5 Voi ceXML的Form解释算法 |
2.2 集成XML PARSER |
2.2.1 DOM接口 |
2.2.2 SAX接口 |
2.2.3 集成Xerces-C XML Parser |
2.3 SIP协议概述 |
2.3.1 SIP结构及会话流程 |
2.3.2 SIP消息机制 |
2.4 SDP协议概述 |
2.4.1 功能概述 |
2.4.2 SDP消息格式 |
2.4.3 RTP实时传输协议 |
2.5 本章小结 |
第三章 语音门户系统的总体设计 |
3.1 语音门户系统概述和目标 |
3.2 用户需求分析 |
3.3 早期和现有的IVR系统模型的对比分析 |
3.3.1 早期系统模型分析 |
3.3.2 现有系统模型分析 |
3.4 语音门户系统访问架构设计 |
3.5 语音门户系统概要设计 |
3.6 本章小结 |
第四章 基于SIP协议语音平台的设计与实现 |
4.1 语音平台设计目标 |
4.2 语音平台的架构设计 |
4.3 OPAL开源项目的研究与应用 |
4.4 语音平台的具体设计与实现 |
4.4.1 呼叫功能的实现 |
4.4.2 语音功能的实现 |
4.5 本章小结 |
第五章 VOICEXML解析器的设计与实现 |
5.1 流程控制器的设计与实现 |
5.2 输入输出接口的设计与实现 |
5.2.1 Prompt接口的实现 |
5.2.2 Rec接口的实现 |
5.2.3 Tel接口的实现 |
5.2.4 语音合成接口的实现 |
5.2.5 语音识别接口的实现 |
5.3 本章小结 |
第六章 系统验证与测试 |
6.1 系统验证用例 |
6.2 系统功能测试 |
6.3 本章小结 |
第七章 总结 |
致谢 |
参考文献 |
(6)基于VoiceXML的语音智能交互平台的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 论文背景 |
1.1.1 呼叫中心的定义 |
1.1.2 呼叫中心的发展历程 |
1.1.3 呼叫中心相关技术 |
1.2 论文来源和研究的意义 |
1.2.1 论文来源 |
1.2.2 研究的意义 |
1.3 论文工作与结构 |
1.3.1 论文工作 |
1.3.2 论文结构 |
第二章 关键技术研究 |
2.1 VoiceXML概述 |
2.1.1 基于XML的数据浏览 |
2.1.2 VoiceXML简介 |
2.1.3 VoiceXML技术原理 |
2.1.4 VoiceXML编程 |
2.2 OpenVXI介绍 |
2.2.1 OpenVXI结构和组件说明 |
2.2.2 OpenVXI系统框架 |
第三章 IPCC智能客户服务中心方案设计 |
3.1 IPCC智能客户服务中心总体方案设计 |
3.1.1 设计目标 |
3.1.2 体系结构 |
3.1.3 系统特色 |
3.2 语音智能交互平台解决方案 |
3.2.1 自定义脚本语言 |
3.2.2 VoiceXML |
3.2.3 比较与选择 |
3.3 VoiceXML解决方案 |
3.3.1 体系结构 |
3.3.2 交互流程 |
第四章 语音智能交互平台中语音系统的实现 |
4.1 语音系统结构 |
4.2 VoiceXML解释器模块的实现 |
4.2.1 解释器主程序 |
4.2.2 解析线程 |
4.2.3 Prompt接口实现 |
4.2.4 Tel接口实现 |
4.2.5 Rec接口实现 |
4.3 TTS服务器的实现 |
4.3.1 TTS引擎的集成 |
4.3.2 TTS接口实现 |
4.4 ASR服务器的实现 |
4.4.1 ASR引擎的集成 |
4.4.2 ASR接口实现 |
第五章 语音智能交互平台中智能交互平台的实现 |
5.1 智能交互平台的功能 |
5.1.1 导航功能 |
5.1.2 服务功能 |
5.2 智能交互平台系统设计策略 |
5.2.1 VoiceXML标记子集 |
5.2.2 VoiceXML脚本格式 |
5.2.3 智能策略 |
5.3 智能交互平台的结构与流程 |
5.3.1 控制模块 |
5.3.2 业务管理模块 |
5.3.3 业务解析模块 |
第六章 系统测试 |
6.1 测试目的 |
6.2 测试环境 |
6.3 系统测试 |
6.3.1 语音系统测试用例 |
6.3.2 智能交互平台测试用例 |
6.4 测试结果 |
6.4.1 语音系统测试结果 |
6.4.2 智能交互平台测试结果 |
结束语 |
致谢 |
参考文献 |
在研期间研究成果 |
附录 术语表 |
(7)基于VoiceXML技术的可视化IVR系统设计和实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状与应用前景 |
1.2.1 可视化技术的发展现状和应用前景 |
1.2.2 VoiceXML技术的发展现状与应用前景 |
1.3 论文研究内容 |
1.4 本文结构 |
第二章 相关技术研究 |
2.1 可视化技术综述 |
2.1.1 可视化技术的研究 |
2.1.2 可视化建模语言描述方法 |
2.2 基于VoiceXML的交互式语音应答 |
2.2.1 VoiceXML概述 |
2.2.2 VoiceXML基本体系结构 |
2.2.3 在IVR系统中运用VoiceXML技术 |
2.3 本章小结 |
第三章 基于VoiceXML技术的可视化IVR系统分析和设计 |
3.1 IVR系统结构的总体分析与设计 |
3.2 可视化过程化定义工具的分析 |
3.2.1 过程定义建模语言的描述 |
3.2.2 基于可视化技术的过程定义工具的功能 |
3.2.3 IVR系统流程工具的用户交互方式 |
3.2.4 IVR系统流程的节点抽象和定义 |
3.3 可视化过程定义工具的设计 |
3.3.1 主框架类包的定义 |
3.3.2 主框架类描述 |
3.3.3 Link类的设计 |
3.4 目标文件的描述与分析 |
3.4.1 文件基本框架描述 |
3.4.2 目标文件的生成 |
3.5 IVR系统执行引擎的分析 |
3.5.1 基于VoiceXML的执行引擎 |
3.5.2 基于VoiceXML执行引擎的结构分析 |
3.6 IVR系统执行引擎的设计 |
3.6.1 执行引擎的总体架构设计 |
3.6.2 VoiceXML解析器的设计 |
3.6.3 Telephoney Service的设计 |
3.7 本章小结 |
第四章 基于VoiceXML技术的可视化IVR系统实现 |
4.1 可视化流程定义工具实现 |
4.2 IVR系统执行引擎的实现 |
4.2.1 OpenVXI的系统架构 |
4.2.2 OpenSpeech Browser PIK组件结构 |
4.2.3 接口实现(取键、录音、放音、转接) |
4.3 本章小结 |
第五章 IVR系统的应用及测试 |
5.1 IVR系统在某商用车呼叫中心的应用 |
5.1.1 IVR系统的流程设计 |
5.2 IVR系统测试 |
5.3 IVR系统中图形界面的节点结构组织和执行效率 |
5.4 本章小结 |
第六章 结束语 |
6.1 本文工作总结 |
6.2 存在的不足 |
致谢 |
参考文献 |
作者在读期间的研究成果 |
附录A |
(8)基于VoiceXML的图书馆语音服务研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
第一章 绪论 |
1.1 引言 |
1.1.1 课题来源 |
1.1.2 国内外研究现状 |
1.1.3 研究意义 |
1.2 本文主要研究内容、创新点及意义 |
1.3 论文组织 |
第二章 语音技术概述 |
2.1 语音处理技术简介 |
2.1.1 语音合成技术 |
2.1.2 自动语音识别技术 |
2.1.3 双音多频 |
2.1.4 打断功能 |
2.2 VoiceXML概述 |
2.2.1 VoiceXML简介 |
2.2.2 VoiceXML的优势和特点 |
2.2.3 基于VoiceXML的信息发布模型 |
2.2.4 VoiceXML系统结构 |
2.2.5 VoiceXML工作过程 |
2.2.6 重要概念及定义 |
2.3 小结 |
第三章 VoiceXML开发环境研究 |
3.1 VoiceXML开发环境概述 |
3.2 基于WEB的开发环境 |
3.2.1 Nuance Caf(?) |
3.2.2 Tellme Studio |
3.2.3 Letsvv |
3.3 模拟开发环境 |
3.3.1 IBM Websphere Voice Toolkit |
3.3.2 Microsoft Office Communications Server 2007 Speech Server |
3.4 两种开发环境中各开发平台的比较 |
3.5 小结 |
第四章 基于VoiceXML的图书馆语音服务 |
4.1 需求分析 |
4.2 语音用户界面设计 |
4.2.1 语音用户界面概述 |
4.2.2 语音用户界面与图形用户界面的区别 |
4.2.3 人在语音交互中的特点 |
4.2.4 语音用户界面的设计原则 |
4.3 图书馆语音服务系统功能及体系架构 |
4.3.1 系统功能结构及各模块流程 |
4.3.2 系统体系的架构 |
4.4 系统实现的关键技术解析 |
4.4.1 识别用户语音输入以及语音合成输出 |
4.4.2 VoiceXML读取Web数据库 |
4.5 小结 |
第五章 提高VoiceXML语音系统性能的方法研究 |
5.1 影响VoiceXML语音系统性能的主要因素 |
5.2 方法一:利用缓存减少网络时延 |
5.2.1 缓存的用途 |
5.2.2 缓存在VoiceXML语音平台的应用 |
5.2.3 实例研究 |
5.3 方法二:优化VoiceXML文档的获取 |
5.3.1 一种优化VoiceXML文档获取对提高语音平台性能的认识 |
5.3.2 本研究的观点 |
5.4 方法三:减少VoiceXML语音平台的解析时间 |
5.4.1 VoiceXML文档在语音平台内部执行的过程 |
5.4.2 一种加快VoiceXML文档解析的方法 |
5.4.3 对缓存DOM树方法的改进 |
5.5 小结 |
第六章 总结与展望 |
参考文献 |
致谢 |
在学期间公开发表论文及着作情况 |
(9)VoiceXML解析器的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 前言 |
1.1.技术背景介绍 |
1.2.CCXML和SSML |
1.2.1.CCXML |
1.2.2.SSML |
1.3.项目研究的意义 |
1.4.论文的结构 |
第二章 VoiceXML简介 |
2.1.VoiceXML的产生 |
2.2.VoiceXML语言 |
2.2.1.VoiceXML介绍 |
2.2.2.VoiceXML语言的设计目标 |
2.2.3.VoiceXML相关的概念 |
2.3.VoiceXML语言的版本 |
2.4.业界VoiceXML解析器的状况 |
2.5.小结 |
第三章 VoiceXML解析器的应用 |
3.1.VoiceXML解析器在智能网中的应用 |
3.1.1.智能网介绍 |
3.1.2.智能网系统结构 |
3.1.3.VoiceXML在智能网中的应用 |
3.2.VoiceXML解析器在IMS中的应用 |
3.2.1.IMS介绍 |
3.2.2.IMS系统结构 |
3.2.3.VoiceXML解析器在IMS中的应用 |
3.3.小结 |
第四章 VoiceXML解析器的实现 |
4.1.概述 |
4.1.1.OpenVXI的结构 |
4.1.2.OpenVXI存在的问题及优化方案 |
4.2.VoiceXML业务执行环境的总体结构 |
4.3.基本模块设计 |
4.3.1.基本数据类型模块 |
4.3.2.Swichar模块 |
4.3.3.Log模块 |
4.4.脚本解析模块设计 |
4.5.线程和线程池模块设计 |
4.5.1.线程模块 |
4.5.2.线程池模块 |
4.6.缓存模块设计 |
4.6.1.MD5简介 |
4.6.2.Base64简介 |
4.7.网络模块设计 |
4.8.SSML模块设计 |
4.9.解释器核心模块设计 |
4.9.1.XML文档的处理 |
4.9.2.FIA算法 |
4.10.放音模块实现 |
4.11.语音识别模块实现 |
4.12.通信模块实现 |
4.13.会议控制模块扩展 |
4.14.VoiceXML业务执行环境流程 |
4.15.关键技术介绍 |
4.15.1.文档对象模型 |
4.15.2.线程池技术 |
4.15.3.FIA算法 |
4.16.小结 |
第五章 VoiceXML业务 |
5.1.VoiceXML业务介绍 |
5.1.1.企业总机 |
5.2.VoiceXML业务生成环境 |
5.3.小结 |
第六章 结束语 |
6.1.论文总结 |
6.2.作者读研期间主要工作 |
参考文献 |
附录 |
会议扩展部分标签 |
技术术语中英文对照 |
致谢 |
(10)VoiceXML语音浏览器的实现与整合(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 背景 |
1.2 国内外研究现状 |
1.2.1 VoiceXML标准的发展状况 |
1.2.2 国外研究状况 |
1.2.3 国内研究状况 |
1.2.4 待解决问题 |
1.3 论文的主要研究内容 |
1.4 论文的组织结构 |
第二章 VoiceXML及关键技术介绍 |
2.1 VoiceXML介绍 |
2.1.1 VoiceXML简介 |
2.1.2 VoiceXML的体系结构 |
2.1.3 VoiceXML的特点 |
2.1.4 VoiceXML的基本概念 |
2.2 语音识别技术 |
2.2.1 语音识别技术简介 |
2.2.2 语音识别技术在语音浏览平台中的应用 |
2.3 语音合成技术 |
2.3.1 语音合成技术简介 |
2.3.2 语音合成技术在语音浏览平台中的应用 |
2.4 文档解析 |
2.4.1 对象树生成模块 |
2.4.2 解释器模块 |
2.4.3 JavaScript集成 |
2.5 OpenVXI介绍 |
2.5.1 OpenVXI的组件 |
2.5.2 OpenVXI的系统框架 |
2.5.3 OpenVXI在语音浏览平台中的应用 |
2.6 智能网技术介绍 |
2.6.1 智能网的产生背景 |
2.6.2 智能网的概念和目标 |
2.6.3 智能网系统结构 |
2.7 小结 |
第三章 VoiceXML语音浏览平台的设计 |
3.1 实现原理 |
3.2 网络结构图 |
3.3 平台模块结构 |
3.3.1 协议接口 |
3.3.2 功能模块描述 |
3.4 小结 |
第四章 VoiceXML语音浏览平台的整合 |
4.1 实现思路 |
4.2 呼叫控制原理 |
4.3 VoiceXML服务主程序 |
4.3.1 处理流程 |
4.3.2 初始化阶段 |
4.3.3 处理阶段 |
4.3.4 关闭阶段 |
4.4 解析线程 |
4.4.1 处理流程 |
4.4.2 呼叫状态机 |
4.4.3 主要消息处理概述 |
4.5 电话接口的实现 |
4.5.1 扩充OSBtelTransferBlind接口函数 |
4.5.2 扩充OSBtelTransferBridge接口函数 |
4.6 录音接口的实现 |
4.6.1 扩充Record函数 |
4.6.2 扩充OSBrecRecord接口函数 |
4.6.3 录音状态迁移 |
4.7 放音接口的实现 |
4.7.1 数据结构扩充 |
4.7.2 扩充OSBpromptQueue接口函数 |
4.7.3 扩充OSBBpromptPlay接口函数 |
4.7.4 扩充OSBpromptwait接口函数 |
4.7.5 放音状态迁移 |
4.8 识别接口的实现 |
4.8.1 扩充OSBrecRecognize接口函数 |
4.9 小结 |
第五章 VoiceXML语音浏览器优化及自动测试工具介绍 |
5.1 VoiceXML语音浏览器的优化 |
5.1.1 优化策略 |
5.1.2 优化后的平台模块结构 |
5.1.3 VoiceAgent模块描述 |
5.1.4 VoiceXML语音浏览器的修改 |
5.2 语音浏览器自动测试工具 |
5.2.1 概述 |
5.2.2 测试平台模块结构 |
5.2.3 VxmlEmul模块描述 |
5.2.4 模拟消息交互 |
5.3 小结 |
第六章 VoiceXML语音浏览器的测试与分析 |
6.1 测试环境 |
6.1.1 硬件环境描述 |
6.1.2 软件环境描述 |
6.1.3 组网结构图 |
6.2 测试配置 |
6.2.1 VxmlEuml的配置 |
6.2.2 VoiceXML浏览器的配置 |
6.3 功能测试 |
6.3.1 测试文档 |
6.3.2 测试用例 |
6.3.3 测试方法和结果 |
6.4 性能测试 |
6.4.1 测试文档 |
6.4.2 测试用例 |
6.4.3 测试方法和结果 |
6.5 测试分析 |
6.6 小结 |
第七章 结论 |
7.1 总结 |
7.2 展望 |
致谢 |
参考文献 |
在学期间的研究成果 |
四、用VoiceXML实现语音浏览(论文参考文献)
- [1]基于XML的Voice XML解析器的设计框架[J]. 张勤. 科技视界, 2013(33)
- [2]基于CTI技术的断电告警监控系统的设计与实现[D]. 张坤飞. 济南大学, 2012(04)
- [3]基于语音的移动机器人控制研究[D]. 闫贺. 武汉科技大学, 2012(03)
- [4]基于VoiceXML的语音门户设计和实现[D]. 王晓峰. 西安电子科技大学, 2010(05)
- [5]动态加载TTS的IVR平台设计与实现[J]. 于周锋,蒋泽军,王丽芳. 航空计算技术, 2009(06)
- [6]基于VoiceXML的语音智能交互平台的研究与实现[D]. 刘锋. 西安电子科技大学, 2009(02)
- [7]基于VoiceXML技术的可视化IVR系统设计和实现[D]. 查玮. 西安电子科技大学, 2009(02)
- [8]基于VoiceXML的图书馆语音服务研究[D]. 王京雷. 山东理工大学, 2008(06)
- [9]VoiceXML解析器的研究与实现[D]. 朱瑞贤. 北京邮电大学, 2008(10)
- [10]VoiceXML语音浏览器的实现与整合[D]. 于翔. 电子科技大学, 2008(04)