InterPhonic5.0完整破解版
分享到:
InterPhonic5.0破解版是飞讯公司设计的最新一代的语音合成系统,可提供自动语音服务,包括语言转换和语音混读等功能。它具有高精度且准确的智能文本分析技术,该技术可有效保障语音合成准确、流程和自然,它的出现解决了其他软件所不能解决的难点“多音字、特殊符号、韵律短语、未登录词等”不能有效识别的问题。InterPhonic5.0的出现有效地改变原有的语音信息制作方式,其多路并发的实时语音合成服务可显著提高信息更新,同时它具有更加全面的Client/Server架构及完善的系统设计,可充分考虑大规模语音应用的需求。InterPhonic5.0提供多语种、多音色的语言功能,它为用户提供普通话、广东话、英语、法语、德语和葡萄牙语等几十个语种以及浑厚淳正的男声、温柔甜美的女声和标准英语女声等十几种音色,而这些的存在可适用各种用户所需要的业务需求。
新版InterPhonic5.0新增“增强工具集套件”该套件包含“离线语音应用工具”、“CSSML可视化编辑工具”和“DOC/XLS文本格式转换工具”等大量便捷的高效组件,而这些组件的存在可大大提高用户对语音合成的操作。新版最具特色的优点—它拥有高智能的自然语音理解能力,该功能可自动进行文本分析和韵律描述,并可表现出“拟人化”的语气,如叹气等,且比真人更富表现力。旧版中用户并不能提供主流应用环境效果优化的解决方案,而新版则解决此类问题,它提供对CSSML和虚拟不定长和语音合成模板等主流环境的效果优化解决方案。InterPhonic5.0无需繁琐的破解程序,安装完成即可完全免费的使用。
二、提示用户正在安装InterPhonic5.0,直接跳过内容浏览并点击下一步
三、显示InterPhonic5.0的许可证协议,协议具体内容:
您一旦安装、复制或以其它方式使用"软件产品",即表示您同意接受本《协议》各项条件的约束。如果您不同意本《协议》的条件,则应立即将未使用的"软件产品"退回原销售者,并可获得全额退款
用户可自主选择是否要浏览协议,完成协议浏览并勾选“我接受许可证协议”,并点击下一步
四、输入InterPhonic5.0用户信息,具体输入:
1.全称:3322软件站
2.单位:www.32r.com
并需勾选应用程序的使用者:
1.使用本机的任何人
2.仅限本人
建议默认勾选,并完成信息输入点击下一步
五、选择InterPhonic5.0的安装路径,默认路径为C:Program Files (x86)iFly Info TekInterPhonic 5.0,可点击浏览更换安装路径,或直接默认点击下一步
六、直接默认点击下一步
七、完成InterPhonic5.0的安装,现在开始下一步的工具包和语言包安装
2、提示用户正在安装InterPhonic5.0,直接默认点击下一步
3、并直接默认下一步安装,并开始安装
4、在安装的过程中,会提示用户绑定运行库,一般程序会自动选择,双击选中运行库并点击绑定运行库
5、提示InterPhonic5.0工具包安装完成
2、选择InterPhonic5.0的语音,默认为中文(简体),可选英文和中文,用户自行决定
3、直接默认下一步下一步安装,并直到安装完成
进入程序的安装目录,默认路径C:Program Files (x86)iFly Info TekInterPhonic 5.0,进入bin文件夹,InterPhonic安装完成出现四个可启动的应用程序,具体作用:
1、iFlyTTSGUI.exe是一个演示程序,可以直接运行,听InterPhonic系统的合成效果,在其中还可以改变合成的参数,看到语音系统的功能,但它对合成参数的设置只对iFlyTTSGUI这个程序起作用,对TTS系统实际的合成不起作用。它还有一个很重要的作用就是在音库安装完成后,检验音库是否能够正常运行、文本合成是否正常
2、TTSCtrlCenter.exe是资源管理中心应用程序,在这里可以控制多种合成的资源,比如说系统设置、合成参数、标点符合、加词管理、音库管理等,这里对合成参数的设置会对TTS系统实际的合成产生影响。这个程序只出现在KD2000的2.0版本和InterPhonic版本中
3、CEditor.exe是音频输出设备,该设备能够自动将任意文字实时转换为连续的自然语音,是一种能够在任何时间、任何地点,向任何人提供语音信息服务的高效便捷手段,非常符合信息时代海量数据、动态更新和个性化查询的需求
4、TtsDoctor.exe程序是日志文件,包含产品信息、系统信息和错误分析
2、对于GBK编码的文本,TTS系统首先通过字符集转换转成GB2312的文本,然后进行语音合成。对于GBK中的繁体字通过转换能得到更多认识的汉字(字符集转换将繁体字转成对应的简体字),但是有一些繁体字没有对应的简体字,就不能正确转换,对于这些繁体汉字,系统将会读成“rong2”
3、对于BIG5编码的文本,TTS系统也是通过字符集转换转成GB2312的文本,然后进行语音合成。如果将BIG5编码通过字符集转换转成对应的简体字时,一些字没有对应的简体字,系统也会读成“rong2”
4、KD2000 Rev2.0和InterPhonic系统还支持Unicode编码,对于这样的文本,系统合成时也是首先转换成为GB2312编码的文本,然后进行语音合成
提供实时语音合成功能,即能实时地将任何文本转换成高自然度的连续语音输出,支持多个合成特性,是在安装时必须首先安装的组件
2、语音合成服务器
指网络中的一台主机,它能够为其他客户机提供TTS服务,客户端应用程序通过网络开发接口与TTS服务器进行通讯
3、讯飞语音合成开发包
在讯飞语音合成系统基础上,为语音合成开发者提供的一个能够使用讯飞语音合成技术进行应用开发的用户编程接口
4、HASP软件锁
必须插在计算机的并口上,用于防止非法拷贝和控制授权数量
5、动态负载均衡系统
提供了一种服务,动态监测网络中的多台TTSServer的运行状态,获得负载最小的服务器,将当前的语音合成任务分配给该服务器,从而维持多台TTS Server负载的动态均衡。它在大规模应用需要多台TTS语音服务器的情况下才使用
◆合理的架构
采用基于TCP/IP的高效网络语音合成服务和集中式的资源管理机制,形成客户端-资源管理器-服务器有机结合的体系架构,构建可灵活伸缩的方案,其高可用性历经众多重点行业大规模关键业务的应用检验,确保提供值得信赖的7×24小时不间断自动化语音服务
◆灵活高效的开发接口
InterPhonic SDK针对不同开发工具,不同集成要求和方案,提供多种形式的开发接口,包括:标准开发接口(DLL)、简单开发接口、COM组件、SAPI开发接口及Java开发接口,开发者可以根据实际需要灵活选择。提供丰富的开发例程和文档,帮助加速语音应用开发过程
◆丰富的参数设置与调节功能
丰富完善的参数设置与调节功能和工具,帮助用户对语音合成效果进行灵活高效的控制与管理。提供对全局参数(如音量、语速、音高等)、用户词典、用户规则、定制资源包统一进行配置和管理的工具;数字、标点符号、英文发音方式的设定;中英文加词功能,可以指定每个字词的拼音或音标等等;提供统一的简单易用图形化用户界面进行操作设定,并可通过API参数进行动态设置和调整,还支持以CSSML(中文语音合成标记语言)进行标记、描述和控制
◆高效便捷的增强工具集
InterPhonic的增强工具集套件包括了使用便捷的高效组件,如离线语音应用工具、CSSML可视化编辑工具、DOC/XLS文本格式转换工具等
◆智能Email预处理功能
能够解析普通文本格式、MIME格式和html格式的Email,合成邮件主题、发件人、收件人、信件内容和文本附件,根据语境自动判断读法
◆实用的URI合成功能
增加了URI合成功能。自动获取用户指定的网络URI文本,方便使用网络上的信息资源
◆字符集、语音数据格式支持
全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE编码字符集,自动识别UNICODE文本;支持直接输出多种采样率的语音数据格式(包括6K/8K/11K/16K)的线性Wav、A/U率Wav和Vox等多种格式的语音数据
◆平台支持
与业内知名的相关平台和设备商均有过成功的集成案例。通过与众多平台和设备提供商、系统集成商及软件开发商的紧密合作,能够保证向用户提供围绕语音应用全程的专业服务
二、细致周到的优化方案
◆优化定制,高效的应用效果方案
提供以定制资源包(加载于合成引擎之上,有效提升既定应用领域语音效果的资源集合)、CSSML、虚拟不定长和语音合成模板等工具为代表的主流应用环境进行效果优化的高效解决方案,显著提升实际应用效果。科大讯飞专业服务体系提供高效的定制与优化方案,提升客户体验,帮助客户获得语音自助服务的持续成功。
◆CSSML,效果提升更自如
CSSML(Chinese Speech Synthesis Markup Language)是由科大讯飞提出并牵头制订的中文语音数据描述规范。该标准得到了国家863专家组、国家信标委和国家技术监督局的大力关注与支持,2005年正式通过国家标准化组织的评审,成为中文语音合成技术标准与规范的重要内容。CSSML针对中文语音应用设计和扩展,可以对多种特性进行灵活标注与控制,并与SSML兼容。
◆预录语音,衔接流畅应用简便
InterPhonic提供业界创新的预录音统一管理功能,将预录音作为语音合成系统的资源,并通过提示音智能匹配和合成模板等方式使预录音与合成音匹配更加容易、衔接更加流畅,同时避免频繁处理提示音播放与语音合成的切换与过渡问题,简化应用流程的复杂程度,进一步提高服务效果与质量。
◆背景音乐,快捷提升用户体检
InterPhonic提供业界首创的背景音功能,通过系统提供的简单易用工具,可以便捷高效的添加背景音乐,调整背景音乐和合成语音的音量对比,并可直接试听实际效果,使语音服务更加亲切自然
提供普通话、广东话、英语、法语、德语、葡萄牙语、意大利语、荷兰语、西班牙语、瑞典语、挪威语、丹麦语、俄语、希腊语、朝鲜语、日本语等几十个语种,包含业界创新的普通话与英语同音混读、广东话与英语同音混读,适应不同语音应用业务的需求。多引擎管理接口可对不同语种的系统提供一致化的访问界面,应用层可以灵活透明的选择所需的语音合成语种,并支持实时语种切换
2、多音色,满足不同环境的个性化应用
主导个性化语音服务新潮流,提供丰富、风格多样化的音色选择,如浑厚淳正的男声,成熟稳重、轻快活泼、或温柔甜美的女声,标准地道的英语女声,甚至童声、少男、少女、老年人等等,所有音色库均继承科大讯飞语音合成技术一贯的优良品质。可供用户根据不同应用业务需要,选择最适合应用场景的语音风格,并支持实时动态的音色切换
3、增强表现力,语音合成效果更自然
InterPhonic产品拥有高智能的自然语言理解能力,自动进行文本分析和韵律描述,可以表现出典型的语气,如疑问和感叹等,合成效果更富表现力。语音合成效果对于语气的表现能力,是科大讯飞语音技术又一项重要的创新性突破,将帮助自动语音服务以更加人性化的语音用户界面提升客户体验
4、高准确度的智能文本分析与预处理
InterPhonic语音合成产品所拥有的高准确度智能文本分析与预处理技术,有效保障语音合成准确、流畅、自然。得益于科大讯飞在语言学上的深厚积累、与相关权威科研机构的紧密合作,以及通过宽广的应用实践平台所积累的海量专业知识库,通过不断训练和优化,InterPhonic即使在面对针对语言分析处理的难点,如多音字、特殊符号、韵律短语、未登录词(如地名、人名)等等,也能保障得到高度准确的自动处理结果
5、 数字、短语文本合成效果显著提升
针对主流应用环境的普遍需求,科大讯飞广泛收集实际应用的语料,并进行细致分析和专业的优化,InterPhonic产品在数字数值、短语短句等最常见应用下效果提升显著,合成效果更加清晰准确、节奏感更强
Windows 2000 Server在安装时,如果安装Windows Media组件,其中的一个服务Windows Media Unicast Server占用的端口号和TTS系统的Server Express软件使用的端口号是一样的,同时使用时会造成冲突,造成Server Express无法运行。这时只要把Windows Media Unicast Server服务停止掉,即可正常使用我们的语音合成系统
二、TTS系统的开发接口中的初始化和逆初始化函数使用的错误?
TTS语音合成系统的开发接口在使用进行语音合成时,首先需要调用TTSInitialize进行语音合成系统的全局初始化,作用是把语音合成系统使用的一些全局数据装载到系统内存中,退出时需要进行全局逆初始化语音合成系统(TTSUninitialize),从系统内存中移出语音合成系统。在一个应用程序中初始化和逆初始化函数允许调用一次,可以在程序开始进行时进行初始化,在程序退出时进行逆初始化过程。如果在程序中进行多次初始化和逆初始化,那么程序在运行时,会出现某一个连接正在合成,而另外一个连接进行逆初始化过程,会使程序崩溃
三、KD2000 Rev1.1/1.5系统和InterPhonic的iflyTTS接口的区别?
1.InterPhonic的iFlyTTS接口增加了分句时对回车符的处理、最大分句长度、当前可用音库列表、读出所有的标点符号、停顿风格、数字字符串的读法等很多控制合成参数的设置,功能更强大
2.对于合成系统输出的声音数据格式设置,由于KD2000 Rev1.1/1.5系统同时只能安装一种采样率的音库,因此它只能正确输出此种采样率下的声音数据文件,输出其它采样率下的声音数据文件会不正确。而InterPhonic系统可以同时安装一个发音人4种采样率的音库,它可以自动在各种采样率的音库之间切换,因此可以输出文档种所列的所有格式的声音数据文件
3.在合成参数的音库设置上,KD2000 Rev1.1/1.5系统有两个发音人,音库设置即在两个发音人之间进行选择,而现在的InterPhonic系统只存在一个发音人,音库设置返回的是发音人各采样率的音库编号,由于InterPhonic系统可以自动在各种采样率的音库之间进行切换,合成时此参数可以不需要进行设置。 两个系统的在以上参数设置时意义有了很大变化,使用时需要特别注意它们的区别
四、向TTS Server发30路请求,合成速度特别慢,另外连接时间长了会导致TTS Server已经死掉,只发一路请求都连接不上,必须重新启动才可以?
在TTS系统多路条件下运行时,因为合成的声音数据量也较大,在网络传输时对网络带宽要求比较高,需要100M的以太网,如果用户所使用的网络是10M网,一方面合成的性能达不到我们的文档所描述的指标,另一方面会造成TTS系统出错
五、TTS在多个线程下合成时声音数据相混杂的问题问题?
系统在多线程使用时,某个线程调用Connect函数后,生成的实例句柄不能被多个线程同时使用,只能被这个线程使用(当一个线程使用完后,这个句柄才能被其它线程使用),因此在合成时,这个线程对某个文本的合成是从头到尾进行合成。其它线程调用Connect函数后,生成它自己的实例句柄,从头到尾地去合成一个文本。不能多个线程分割合成一个大文本
新版InterPhonic5.0新增“增强工具集套件”该套件包含“离线语音应用工具”、“CSSML可视化编辑工具”和“DOC/XLS文本格式转换工具”等大量便捷的高效组件,而这些组件的存在可大大提高用户对语音合成的操作。新版最具特色的优点—它拥有高智能的自然语音理解能力,该功能可自动进行文本分析和韵律描述,并可表现出“拟人化”的语气,如叹气等,且比真人更富表现力。旧版中用户并不能提供主流应用环境效果优化的解决方案,而新版则解决此类问题,它提供对CSSML和虚拟不定长和语音合成模板等主流环境的效果优化解决方案。InterPhonic5.0无需繁琐的破解程序,安装完成即可完全免费的使用。
InterPhonic5.0运行库安装
一、双击解压InterPhonic5.0的“运行库”压缩包,进入“Runtime Demo”文件夹并点击“Runtime(Demo)_Chinese (PRC).exe”开始正式的安装二、提示用户正在安装InterPhonic5.0,直接跳过内容浏览并点击下一步
三、显示InterPhonic5.0的许可证协议,协议具体内容:
您一旦安装、复制或以其它方式使用"软件产品",即表示您同意接受本《协议》各项条件的约束。如果您不同意本《协议》的条件,则应立即将未使用的"软件产品"退回原销售者,并可获得全额退款
用户可自主选择是否要浏览协议,完成协议浏览并勾选“我接受许可证协议”,并点击下一步
四、输入InterPhonic5.0用户信息,具体输入:
1.全称:3322软件站
2.单位:www.32r.com
并需勾选应用程序的使用者:
1.使用本机的任何人
2.仅限本人
建议默认勾选,并完成信息输入点击下一步
五、选择InterPhonic5.0的安装路径,默认路径为C:Program Files (x86)iFly Info TekInterPhonic 5.0,可点击浏览更换安装路径,或直接默认点击下一步
六、直接默认点击下一步
七、完成InterPhonic5.0的安装,现在开始下一步的工具包和语言包安装
InterPhonic5.0工具包安装
1、再次进入运行库文件夹,点击ToolKit文件夹的“ToolKit_Chinese (PRC).exe”开始工具包的安装2、提示用户正在安装InterPhonic5.0,直接默认点击下一步
3、并直接默认下一步安装,并开始安装
4、在安装的过程中,会提示用户绑定运行库,一般程序会自动选择,双击选中运行库并点击绑定运行库
5、提示InterPhonic5.0工具包安装完成
InterPhonic5.0语音库安装
1、双击解压InterPhonic5.0“语音库”压缩包,并点击“setup.exe”开始语音库的安装2、选择InterPhonic5.0的语音,默认为中文(简体),可选英文和中文,用户自行决定
3、直接默认下一步下一步安装,并直到安装完成
InterPhonic5.0使用教程
InterPhonic5.0安装完成,并不会出现在桌面快捷方式上,打开方法:进入程序的安装目录,默认路径C:Program Files (x86)iFly Info TekInterPhonic 5.0,进入bin文件夹,InterPhonic安装完成出现四个可启动的应用程序,具体作用:
1、iFlyTTSGUI.exe是一个演示程序,可以直接运行,听InterPhonic系统的合成效果,在其中还可以改变合成的参数,看到语音系统的功能,但它对合成参数的设置只对iFlyTTSGUI这个程序起作用,对TTS系统实际的合成不起作用。它还有一个很重要的作用就是在音库安装完成后,检验音库是否能够正常运行、文本合成是否正常
2、TTSCtrlCenter.exe是资源管理中心应用程序,在这里可以控制多种合成的资源,比如说系统设置、合成参数、标点符合、加词管理、音库管理等,这里对合成参数的设置会对TTS系统实际的合成产生影响。这个程序只出现在KD2000的2.0版本和InterPhonic版本中
3、CEditor.exe是音频输出设备,该设备能够自动将任意文字实时转换为连续的自然语音,是一种能够在任何时间、任何地点,向任何人提供语音信息服务的高效便捷手段,非常符合信息时代海量数据、动态更新和个性化查询的需求
4、TtsDoctor.exe程序是日志文件,包含产品信息、系统信息和错误分析
InterPhonic5.0支持的文本内码
1、支持的GB2312编码包含了GB2312-80的全部汉字(一级和二级),汉字数量为6762条2、对于GBK编码的文本,TTS系统首先通过字符集转换转成GB2312的文本,然后进行语音合成。对于GBK中的繁体字通过转换能得到更多认识的汉字(字符集转换将繁体字转成对应的简体字),但是有一些繁体字没有对应的简体字,就不能正确转换,对于这些繁体汉字,系统将会读成“rong2”
3、对于BIG5编码的文本,TTS系统也是通过字符集转换转成GB2312的文本,然后进行语音合成。如果将BIG5编码通过字符集转换转成对应的简体字时,一些字没有对应的简体字,系统也会读成“rong2”
4、KD2000 Rev2.0和InterPhonic系统还支持Unicode编码,对于这样的文本,系统合成时也是首先转换成为GB2312编码的文本,然后进行语音合成
InterPhonic5.0组件作用
1、TTS语音合成系统运行库提供实时语音合成功能,即能实时地将任何文本转换成高自然度的连续语音输出,支持多个合成特性,是在安装时必须首先安装的组件
2、语音合成服务器
指网络中的一台主机,它能够为其他客户机提供TTS服务,客户端应用程序通过网络开发接口与TTS服务器进行通讯
3、讯飞语音合成开发包
在讯飞语音合成系统基础上,为语音合成开发者提供的一个能够使用讯飞语音合成技术进行应用开发的用户编程接口
4、HASP软件锁
必须插在计算机的并口上,用于防止非法拷贝和控制授权数量
5、动态负载均衡系统
提供了一种服务,动态监测网络中的多台TTSServer的运行状态,获得负载最小的服务器,将当前的语音合成任务分配给该服务器,从而维持多台TTS Server负载的动态均衡。它在大规模应用需要多台TTS语音服务器的情况下才使用
InterPhonic5.0新功能
一、全面完善的功能特性◆合理的架构
采用基于TCP/IP的高效网络语音合成服务和集中式的资源管理机制,形成客户端-资源管理器-服务器有机结合的体系架构,构建可灵活伸缩的方案,其高可用性历经众多重点行业大规模关键业务的应用检验,确保提供值得信赖的7×24小时不间断自动化语音服务
◆灵活高效的开发接口
InterPhonic SDK针对不同开发工具,不同集成要求和方案,提供多种形式的开发接口,包括:标准开发接口(DLL)、简单开发接口、COM组件、SAPI开发接口及Java开发接口,开发者可以根据实际需要灵活选择。提供丰富的开发例程和文档,帮助加速语音应用开发过程
◆丰富的参数设置与调节功能
丰富完善的参数设置与调节功能和工具,帮助用户对语音合成效果进行灵活高效的控制与管理。提供对全局参数(如音量、语速、音高等)、用户词典、用户规则、定制资源包统一进行配置和管理的工具;数字、标点符号、英文发音方式的设定;中英文加词功能,可以指定每个字词的拼音或音标等等;提供统一的简单易用图形化用户界面进行操作设定,并可通过API参数进行动态设置和调整,还支持以CSSML(中文语音合成标记语言)进行标记、描述和控制
◆高效便捷的增强工具集
InterPhonic的增强工具集套件包括了使用便捷的高效组件,如离线语音应用工具、CSSML可视化编辑工具、DOC/XLS文本格式转换工具等
◆智能Email预处理功能
能够解析普通文本格式、MIME格式和html格式的Email,合成邮件主题、发件人、收件人、信件内容和文本附件,根据语境自动判断读法
◆实用的URI合成功能
增加了URI合成功能。自动获取用户指定的网络URI文本,方便使用网络上的信息资源
◆字符集、语音数据格式支持
全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE编码字符集,自动识别UNICODE文本;支持直接输出多种采样率的语音数据格式(包括6K/8K/11K/16K)的线性Wav、A/U率Wav和Vox等多种格式的语音数据
◆平台支持
与业内知名的相关平台和设备商均有过成功的集成案例。通过与众多平台和设备提供商、系统集成商及软件开发商的紧密合作,能够保证向用户提供围绕语音应用全程的专业服务
二、细致周到的优化方案
◆优化定制,高效的应用效果方案
提供以定制资源包(加载于合成引擎之上,有效提升既定应用领域语音效果的资源集合)、CSSML、虚拟不定长和语音合成模板等工具为代表的主流应用环境进行效果优化的高效解决方案,显著提升实际应用效果。科大讯飞专业服务体系提供高效的定制与优化方案,提升客户体验,帮助客户获得语音自助服务的持续成功。
◆CSSML,效果提升更自如
CSSML(Chinese Speech Synthesis Markup Language)是由科大讯飞提出并牵头制订的中文语音数据描述规范。该标准得到了国家863专家组、国家信标委和国家技术监督局的大力关注与支持,2005年正式通过国家标准化组织的评审,成为中文语音合成技术标准与规范的重要内容。CSSML针对中文语音应用设计和扩展,可以对多种特性进行灵活标注与控制,并与SSML兼容。
◆预录语音,衔接流畅应用简便
InterPhonic提供业界创新的预录音统一管理功能,将预录音作为语音合成系统的资源,并通过提示音智能匹配和合成模板等方式使预录音与合成音匹配更加容易、衔接更加流畅,同时避免频繁处理提示音播放与语音合成的切换与过渡问题,简化应用流程的复杂程度,进一步提高服务效果与质量。
◆背景音乐,快捷提升用户体检
InterPhonic提供业界首创的背景音功能,通过系统提供的简单易用工具,可以便捷高效的添加背景音乐,调整背景音乐和合成语音的音量对比,并可直接试听实际效果,使语音服务更加亲切自然
InterPhonic5.0新特点
1、多语种,适应不断发展的业务需求提供普通话、广东话、英语、法语、德语、葡萄牙语、意大利语、荷兰语、西班牙语、瑞典语、挪威语、丹麦语、俄语、希腊语、朝鲜语、日本语等几十个语种,包含业界创新的普通话与英语同音混读、广东话与英语同音混读,适应不同语音应用业务的需求。多引擎管理接口可对不同语种的系统提供一致化的访问界面,应用层可以灵活透明的选择所需的语音合成语种,并支持实时语种切换
2、多音色,满足不同环境的个性化应用
主导个性化语音服务新潮流,提供丰富、风格多样化的音色选择,如浑厚淳正的男声,成熟稳重、轻快活泼、或温柔甜美的女声,标准地道的英语女声,甚至童声、少男、少女、老年人等等,所有音色库均继承科大讯飞语音合成技术一贯的优良品质。可供用户根据不同应用业务需要,选择最适合应用场景的语音风格,并支持实时动态的音色切换
3、增强表现力,语音合成效果更自然
InterPhonic产品拥有高智能的自然语言理解能力,自动进行文本分析和韵律描述,可以表现出典型的语气,如疑问和感叹等,合成效果更富表现力。语音合成效果对于语气的表现能力,是科大讯飞语音技术又一项重要的创新性突破,将帮助自动语音服务以更加人性化的语音用户界面提升客户体验
4、高准确度的智能文本分析与预处理
InterPhonic语音合成产品所拥有的高准确度智能文本分析与预处理技术,有效保障语音合成准确、流畅、自然。得益于科大讯飞在语言学上的深厚积累、与相关权威科研机构的紧密合作,以及通过宽广的应用实践平台所积累的海量专业知识库,通过不断训练和优化,InterPhonic即使在面对针对语言分析处理的难点,如多音字、特殊符号、韵律短语、未登录词(如地名、人名)等等,也能保障得到高度准确的自动处理结果
5、 数字、短语文本合成效果显著提升
针对主流应用环境的普遍需求,科大讯飞广泛收集实际应用的语料,并进行细致分析和专业的优化,InterPhonic产品在数字数值、短语短句等最常见应用下效果提升显著,合成效果更加清晰准确、节奏感更强
InterPhonic5.0常见问题解答
一、为什么InterPhonic系统在Windows 2000 Server和Advance Server上无法运行?Windows 2000 Server在安装时,如果安装Windows Media组件,其中的一个服务Windows Media Unicast Server占用的端口号和TTS系统的Server Express软件使用的端口号是一样的,同时使用时会造成冲突,造成Server Express无法运行。这时只要把Windows Media Unicast Server服务停止掉,即可正常使用我们的语音合成系统
二、TTS系统的开发接口中的初始化和逆初始化函数使用的错误?
TTS语音合成系统的开发接口在使用进行语音合成时,首先需要调用TTSInitialize进行语音合成系统的全局初始化,作用是把语音合成系统使用的一些全局数据装载到系统内存中,退出时需要进行全局逆初始化语音合成系统(TTSUninitialize),从系统内存中移出语音合成系统。在一个应用程序中初始化和逆初始化函数允许调用一次,可以在程序开始进行时进行初始化,在程序退出时进行逆初始化过程。如果在程序中进行多次初始化和逆初始化,那么程序在运行时,会出现某一个连接正在合成,而另外一个连接进行逆初始化过程,会使程序崩溃
三、KD2000 Rev1.1/1.5系统和InterPhonic的iflyTTS接口的区别?
1.InterPhonic的iFlyTTS接口增加了分句时对回车符的处理、最大分句长度、当前可用音库列表、读出所有的标点符号、停顿风格、数字字符串的读法等很多控制合成参数的设置,功能更强大
2.对于合成系统输出的声音数据格式设置,由于KD2000 Rev1.1/1.5系统同时只能安装一种采样率的音库,因此它只能正确输出此种采样率下的声音数据文件,输出其它采样率下的声音数据文件会不正确。而InterPhonic系统可以同时安装一个发音人4种采样率的音库,它可以自动在各种采样率的音库之间切换,因此可以输出文档种所列的所有格式的声音数据文件
3.在合成参数的音库设置上,KD2000 Rev1.1/1.5系统有两个发音人,音库设置即在两个发音人之间进行选择,而现在的InterPhonic系统只存在一个发音人,音库设置返回的是发音人各采样率的音库编号,由于InterPhonic系统可以自动在各种采样率的音库之间进行切换,合成时此参数可以不需要进行设置。 两个系统的在以上参数设置时意义有了很大变化,使用时需要特别注意它们的区别
四、向TTS Server发30路请求,合成速度特别慢,另外连接时间长了会导致TTS Server已经死掉,只发一路请求都连接不上,必须重新启动才可以?
在TTS系统多路条件下运行时,因为合成的声音数据量也较大,在网络传输时对网络带宽要求比较高,需要100M的以太网,如果用户所使用的网络是10M网,一方面合成的性能达不到我们的文档所描述的指标,另一方面会造成TTS系统出错
五、TTS在多个线程下合成时声音数据相混杂的问题问题?
系统在多线程使用时,某个线程调用Connect函数后,生成的实例句柄不能被多个线程同时使用,只能被这个线程使用(当一个线程使用完后,这个句柄才能被其它线程使用),因此在合成时,这个线程对某个文本的合成是从头到尾进行合成。其它线程调用Connect函数后,生成它自己的实例句柄,从头到尾地去合成一个文本。不能多个线程分割合成一个大文本
展开更多
InterPhonic5.0完整破解版下载地址
- 需先下载高速下载器:
- 专用下载:
- 其它下载: