◆ 论文集萃
 

利用语音技术的创新构建证券非现场交易语音平台
——语音技术的发展及在证券行业的应用

徐海军 韩军阳 张治国
(中原证券股份有限公司,郑州市经三路15号,450003)


摘要   本文对当前语音及相关技术发展进行了全面的论述,并特别介绍了相关技术在证券行业的应用和发展现状,重点介绍了TTS、声文识别与安全、语音识别以及证券语音门户的建设概况,对语音相关技术在证券特别是非现场交易发展中的运用提出了基本概念。
关键词: 语音 语音技术 语音识别 语音门户 证券 非现场交易
一、概述
  独立的证券营业部作为当前从事证券经纪业务的主要运作模式,证券营业部经历了高速发展、发展缓慢到现在发展稳步等几个阶段,目前券商行业内部竞争日益激烈,经纪业务已开始进入“微利时代”或“无利时代”;证券营业部的经营环境也正在发生重大变化,正面临着境外证券公司介入、佣金改革、商业银行业务多元化等带来的新挑战。在营业部业务经营模式上营业部正逐步缩小经营规模,数据进行交易大集中,将过去的现场交易逐步重点发展非现场交易。在新形势下,根据券商营业部的模式转变分析如何利用语音技术的创新手段进行非现场交易保证交易具有重要的现实意义。
  通过对证券业务进行个性化开发,语音技术应用平台(Voice Application Platform VAP)能够满足证券非现场交易业务对各种语音服务的需要。语音技术将涉及电信信号技术、CTI技术、语音技术、通讯技术和互联网整合技术等领域。其中电信信号技术包括模拟信号、数字信号、有线及无线信号传输技术等;计算机与电话整合(CTI)技术包括交互式语音应答技术、自动呼叫分配技术、电话会议技术、电话呼叫服务技术等;语音技术包括语音识别技术、语音合成技术、声纹识别与安全技术及各种语音库技术等;计算机数据及通讯技术包括数据库技术、文字翻译技术、各种统计分析技术、数据挖掘技术等;互联网整合技术包含HTML、XML、邮件技术、网络安全技术等。
二、构建语音证券电子商务平台
  所谓证券语音电子商务是指人们由语音技术应用平台搭建而成的,利用声音识别和语音合成技术,通过固定或移动电话等语音通道终端获取证券信息、进行证券交易以及进行其他信息交互工作。这种方式的特点是使用便捷、接入面广、速度快,使得电话用户能够享受廉价和丰富的证券金融服务。它将使证券公司出现语音特别服务中心,并使其实现自动化,降低成本,提高系统的安全性,改善客户服务,它将是未来证券信息技术革命的主要内容之一。
  证券语音电子商务的模式之一是由企业建立语音处理中心和数据库系统, 用以作为现有的交互式语音应答系统(或称为呼叫中心)的延伸,可以将数据通过网站传送至浏览器,或传送至无线应用网关,或利用声音识别及合成技术,由语音来传送至各类语音终端。
  证券语音电子商务的另一种模式是利用Voice XML技术,Voice XML是一种把网页转变成语音的技术协议。使用基于互联网协议的全语音网络接入技术,能够使人们在任何时候、任何地点利用各种无所不在的装置工作和上网。 语言用户与图形用户两用接口可以使网站的访问者拨打一个语音电话,与一个提供信息并驱动该网站的语音系统进行互动交流。
语音门户的出现,使网络的触角伸向每一个拥有电话的投资人。
(一)文字-语音转换系统(TTS):
  计算机的“合成语音”应该是可懂、清晰、自然、具有表现力,这是语音合成追求的目标。英语TTS系统在20世纪60年代首先被研制成功。80年代,我国开始从事汉语语音合成领域的研究。目前国内的TTS系统主要使用的方式有 :
1、从应用需求出发,设计出特定应用和通用计算机语音输出系统 。
  特定应用的语音输出系统:适合于特定场合的要求,它可以采用录音/ 重放技术,或针对有限词汇采用某种拼接技术,不需要语言理解,例如证券公司电话委托系统的提示音或证券呼叫中心的欢迎语等。
  文字-语音转换(TTS)系统:基于语音合成技术实现的文字到语音的转换,是通用计算机语音输出系统。它并不只是文字到语音的简单映射,还包括了对文字的理解,以及对语音的韵律处理。
2 、从采用的合成技术来划分,有基于规则或拼接合成两种技术。
  基于规则的合成:主要是计算参数的轨迹,形成规则,完成语音的参数合成。
  拼接语音合成技术:基本思想是存储语音的基元,合成时读取基元、拼接、韵律修饰。拼接语音合成直接把语音基元相互拼接在一起,输出连续语流。
  随着证券市场日臻完善,投资者的投资理念逐步成熟,人们将更多的依赖证券资讯来辅助自己进行投资分析。目前客户获取资讯的主要方式之一就是互联网,但互联网终端的覆盖率远没有电话高,所以基于语音的证券服务平台能够使人们随时随地的接受服务。电话已成为人与网络交互信息的终端,通过电话查询股票行情、资讯,进行股票交易,查询电子邮件等,TTS促进了电话网和数据网的结合,为人们提供了全新的服务。当用户以电话方式获取服务时,证券公司语音特别服务中心能自适应地传送用户所需信息,即将文字、图表及有关信息转换成声音,传送到用户的电话上。
(二)声纹识别与数据安全
  随着呼叫中心和IVR在证券公司的股票交易系统中越来越广泛的被使用,系统的安全性越来越受到业界人士的关注,传统的DTMF输入密码的方式的安全性越来越受到质疑。随着语音识别技术的发展,我们将考虑使用DTMF与声紋识别并用的身份校验机制来保证系统的安全性。
1、生物特征进行身份认证
  以人类生物特征(指纹、语音、脸像等)进行身份验证的生物识别技术,在未来几年将成为证券公司信息系统建设最为重要的技术革命之一。目前可以使用的生物特征资源大概包括面孔、指纹和掌纹、虹膜、视网膜、气味、DNA、血管纹路、声纹等。所有这些生物特征在进行身份鉴别或确认时,其普遍性、唯一性、永久性、易获取性、可区分性、防伪能力以及用户接受程度等等,都不尽相同,因此,在不同场合、不同应用环境下,应选择不同的特征。
2、声纹识别及其在证券行业的应用
  声纹识别的应用有一些缺点,比如同一个人的声音具有易变性,易受身体状况、年龄、情绪等的影响;比如不同的麦克风和信道对识别性能有影响;比如环境噪音对识别有干扰;又比如在混合说话的情形下人的声纹特征不易提取等等。尽管如此,与其他生物特征相比,声纹识别的应用有一些特殊的优势:(1)蕴含声纹特征的语音获取方便、自然,使用者的接受程度高;(2)获取语音的识别成本低廉,使用简单;(3)适合远程身份确认;(4)声纹辨认和确认的算法复杂度低; (5)配合一些其他措施,如通过语音识别进行内容鉴别等,可以提高准确率等等。这些优势使得声纹识别的世界市场占有率15.8%,仅次于手指和手的生物特征识别,并有不断上升的趋势。
3、声纹识别的关键问题
  声纹识别可以说有两个关键问题,一是特征提取,二是模式匹配(模式识别)。特征提取的任务是提取并选择对说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征。
  根据不同的任务需求,声纹识别还面临一个特征选择或选用的问题。在证券交易,希望用信道信息,即希望信道对说话人识别有较大影响,从而可以剔除录音、模仿等带来的影响。
  总之,较好的特征,应该能够有效地区分不同的说话人,但又能在同一说话人语音发生变化时保持相对的稳定;不易被他人模仿或能够较好地解决被他人模仿问题;具有较好的抗噪性能。
  目前的证券公司电话委托系统是基于密码体系的,容易被截获并破解,或容易产生密码丢失等情况,系统安全性不高,因此我们将使用声纹识别技术对电话委托业务中的用户身份进行确认,为了提供安全性,还可以采取一些其他措施,如密码和声纹双保险,如随机提示文本用文本相关的声纹识别技术进行身份确认。美林证券为了提供更有效率的客户服务,针对其客服中心的系统功能做了升级。从2000年1月开始,美林证券已选择使用先进的声纹识别软件,客户只要通过生纹识别系统的鉴定后,既可听取他们的投资组合及股票交易纪录。
(三) 语音识别
  语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言,其最终目标是实现人与机器进行自然语言通信。
  语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。
目前语音识别所存在的问题主要有:
(1)高噪声环境下语音识别困难。
(2)语音识别系统的适应性差,主要体现在对环境依赖性强,另外一个问题是对用户的错误输入不能正确响应,使用不方便。
(3)语音识别系统识别速度、拒识问题及关键词(句)检测技术等技术细节要解决。
  语音识别技术在证券行业的应用,可以将客户从繁杂的语音流程中解放出来,客户只需告诉CTI系统他想干什么, 系统将自动检索出他所需要的信息并完成他想进行的任何交易,并且自动返回语音结果。通过本方式,证券公司的语音特别服务中心才能够真正实现7X24小时全天候服务,极大的提高证券公司呼叫中心或电话委托系统的工作效率,使得原本手工操作的工作用语音就可方便地完成。
(四)语音门户建设
  语音合成技术在证券网站语音门户中的应用,可以提供诸如有声电子邮件、语音咨询和资讯、电话客户服务等。在不远的将来,语音门户系统必将成为一个全能的“翻译器”,将无穷的证券资源通过电话提供给用户,为用户提供全天候、全方位的服务。
  证券语音门户系统能够进行动态、海量证券信息数据查询。系统建设所使用的核心技术有:
  语音合成技术(TTS):用以将文本信息转换为语音信息提供给用户。
  语音识别技术(ASR):用以取代繁琐的按键输入,使输入更为便捷和人性化。
  Voice XML技术:用以IVR平台与互联网络交互信息。(IVR:Interactive Voice Response,交互式语音应答系统。)
  对于信息服务来说,TTS和ASR的融合意味着两重含义。其一,由于声音更加接近人类的语言,改进后的TTS增强了用户对该技术的认可程度;其二,更加自然的TTS和高质量的语音识别器能让计算机和人们进行真正意义上的对话,这样,计算机就能理解对方(人)说的是什么,并且在自己模糊不清的时候, 向对方(人)询问,在交流中明晰客户的需求。
  证券语音门户系统是以先进的CTI技术以及开放的Voice XML工业标准为基础,通过电话畅游互联网,轻松“听”网上的证券信息,“说”E-mail,“点击”网上的链接。这是对传统证券电话信息服务的一个重大改革。由于引入了Voice XML及其相关技术,可将平台的复杂内容屏蔽,无须熟悉底层平台即可进行高层应用开发;大大地减轻了开发的难度,缩短开发周期,降低人力成本。
  在不影响证券公司现有平台的结构和业务功能的前提下,主要完成三个功能模块的系统建设。在动态和海量证券信息的查询业务上,首先必须完成的是对原有的数字录音回放方式向TTS平台的升级;进而在进行了TTS改造的平台上构建互联网上的证券信息查询服务和个性化信息查询服务。
  Voice XML系统的目的就是为了使电话和语音可以应用在互联网络之上。通过Voice XML技术可以使语音门户系统访问到证券公司互联网站上的各种信息,并实现信息的交互。再结合语音合成技术,将文本信息合成为语音信号,用户就可以通过IVR平台来访问Web页面上的信息了。结合Voice XML技术,语音系统可以提供更多的个人信息服务和证券交易服务等。
  证券市场不断的变革是一个永恒的主题,而证券业务的发展,未来证券服务一定要体现全面化、个性化、差别化。从语音技术平台的发展可以看出,科学技术推动了社会发展,满足人们的需求,社会需求也反过来推动科学技术发展。多媒体时代的来临,迫切要求推动语音识别技术的发展和广泛应用,我们将从中体会到语音识别带来的种种便利。要在这个不断前进的市场里始终立于不败之地,券商的选择就是利用各种先进的技术,不断创新,不断改变,为本券商和客户的良好合作、沟通提供桥梁和联系的纽带,提高企业竞争力 。


 
 
| 关于我们 | 联系我们 | 友情链接
Copyright © 2000-2004 中国电子商务协会证券信息传播委员会 设计制作:多媒体设计中心
未经书面授权,请勿转载内容或建立镜像,违者依法必究! Email: [email protected]