智能语音交互

为产品赋予真正能听会说、听你懂你的能力
智能语音交互
为产品赋予真正能听会说、听你懂你的能力
千库网_蓝色暗色语音助手科技光感旋转GIF动效_GIF编号35892
语音识别

轻量化架构
使用轻量化架构,考虑特征的时序,改善语速、连音造成的辨识错误以提高辨识效率。模拟20种以上扩增情境,例如:回声、背景噪音、信道压缩等,使模型有高度强健性。

定制化学习
文本语料强化识别使用客户可提供话术文本、产品讯息、扩写语料等语句资料来更新模型以强化语音辨识效果。可定制化自学习模组专项模型识别增强

文本正规化
高度智能的文本范式辨识功能具备文本正规化能力,包含标点智能侦测、汉字与阿拉伯数字转写等功能,提高文本可读性。

噪音消除
实时语音串流活性检测透过对输入的音频流进行分析,确定用户说话的起始和终止 使用多个局部感知器和权重共享特性大幅提升准确度使模型有高度环境适应力、抗噪能力。

优化语音识别
半自动化数据迭代自动语料标注结合验证机制,最后运用少量人力协助确认,以降低数据搜集之成本。 协助利用客户语音记录,自动迭代模型,持续优化语音识别识别率。

智能分析法
高品质的语音合成效果该平台基于新的语音合成研究成果,集成了智能的文本分析算法,让合成的音色更加自然接近真正的人声。 
语音合成
 
专属语音定制
专属的语音定制提供可客制化定制语音服务的功能。客户只需依照规范提供发音人的语料,Markverse将以发音人为基准定制出专属的语音合成系统
专属语音定制
专属的语音定制提供可客制化定制语音服务的功能。客户只需依照规范提供发音人的语料,Markverse将以发音人为基准定制出专属的语音合成系统。
 
高度智能的学习方法
高度智能的文本处理能力多音字处理Markverse采用高度智能的学习方法,结合多种上下文语境特征对多音字的读法进行智能判断,以确保多音字发音正确。 数字处理 根据数字的上下文语境,自动做出智能判断,正确区分出 10/12 读音为十月十二日,或是十二分之十。 符号处理 竹间语音合成系统能正确判断出符号的读法,以及其符号与相邻文本(数字)朗读的先后顺序。比如 40% - 50% 读作“百分之四十到百分之五十”
高度智能的学习方法
高度智能的文本处理能力多音字处理Markverse采用高度智能的学习方法,结合多种上下文语境特征对多音字的读法进行智能判断,以确保多音字发音正确。 数字处理 根据数字的上下文语境,自动做出智能判断,正确区分出 10/12 读音为十月十二日,或是十二分之十。 符号处理 竹间语音合成系统能正确判断出符号的读法,以及其符号与相邻文本(数字)朗读的先后顺序。比如 40% - 50% 读作“百分之四十到百分之五十”。
 
定制化语音合成内容
可定制化语音合成的内容灵活的播放调节功能 用户可以根据自己的喜好,选择加快或减慢语音播放的速度,提高或降低合成语音的声调、音高 语音合成标记语言 (SSML) 用户可指定专用的词汇发音,例如生僻字、姓氏、数字读音。 透过语法可实时调控语音合成的停顿点、停顿时长、音量、语速、音高等变数
定制化语音合成内容
可定制化语音合成的内容灵活的播放调节功能 用户可以根据自己的喜好,选择加快或减慢语音播放的速度,提高或降低合成语音的声调、音高 语音合成标记语言 (SSML) 用户可指定专用的词汇发音,例如生僻字、姓氏、数字读音。 透过语法可实时调控语音合成的停顿点、停顿时长、音量、语速、音高等变数。

欢迎加入Markverse合作生态 一起窥探未来!

欢迎加入Markverse合作生态 一起窥探未来!