OpenVXI

OpenVXI -

TTS/语音合成和处理

授权协议: 未知

操作系统: 未知

开发语言:

软件简介

OpenVXI 提供的是完整的 VXML 解析服务，同时也提供了有限语言的 TTS 支持。

Voice eXtensible Markup Language（简称
VXML）是被用来创建语音对话系统，可以调用语音合成以及语音识别服务，可以用来记录语音录入和连接电话系统。创建 VXML 语音的主要目的就是用 Web
开发的理念来开发交互式的语音应用。VXML 提供了基于 Menu 和基于 Form
的两套框架，整合了语音识别和语音合成两个关键服务，使得语音应用的开发变得更为方便和快捷。

VXML 和普通的标记语言一样，需要有浏览器进行解析；还需要提供语音识别和语音合成服务的应用服务器；有时也需要有 http
服务器提供文档服务；当然，如果需要与电话系统相连，就必须加上 VOIP （网络电话）的支持。如下图所示的就是 VXML 的运行环境：

图 1. VXML 运行环境

一个企业级应用的系统框架

IVR (interactive voice-response services) 也就是自动应答服务，是使用 VXML的典型企业级应用。IVR和使用者通过电话，按键 (DTMF)互动，如语音订票，语音查询，语音投票等。普通的 IVR都是支持 VXML的解析和提供了 sip协议的支持，通过和 ASR (语音识别 )应用服务器以及 TTS(语音合成 ) 应用服务器的集成，可以实现几乎所有的 VXML封装的操作。

企业级的 VXML应用需要如下的体系结构，以使用 IBM Voice Server (WVS)为例：

图 2. 一个 VXML 具体应用的例子

上图中的 IVR事实上就是 VXML解析器，通过解析 VXML，分发相应的工作给 WVS，实现 VXML封装的语音识别和语音合成的功能。

软件首页