慧聪网首页-所有行业-资讯中心-企业管理-商务指南-展会-访谈-行业研究-博客-慧聪吧-找供应-找求购-免费注册-立即登录-加入买卖通-即时沟通-站点地图

产综研开发用语音直接检索多媒体技术

2008/10/16/08:34 来源:技术在线

    使用此次开发技术的检索系统的验证网站

    日本产业技术综合研究所宣布,开发出利用语音直接检索视频共享网站等多媒体内容的技术。并将公开基于该技术的检索系统验证网站。除互联网方面的应用外,还设想应用于呼叫中心通话录音系统的语音检索、以及使用大量多媒体内容的广播·教育领域。

    此次公开的检索系统,能够利用关键词直接检索互联网视频共享网站和语音网站等多媒体内容中包含的语音。由于不使用原检索系统所必需的语音识别辞典,因此即使是包含新固有名词和生词的单词,也可不受限制地作为检索关键词。另外,无需维护、可实时检索互联网上的新内容。使用普通浏览器即可利用该系统。

    检索使用的是,比通常的语音检索采用的音素更为细分、被认为是可保留语言信息最小单位的“音素片(SPS:Sub-PhoneticSegment)”。根据音素片进行检索,检索处理的精度降低问题得以抑制,从而能够实现不使用辞典的检索。作为检索对象的数据、检索关键词均按照音素片单位进行拆分·编码,将符号间的匹配数值化并进行对照。这一对照处理方法中,也开发了自主高速处理算法。

检索系统的构成

检索系统的构成

点击此处查看全部新闻图片

    由于不再依靠基于辞典的语言,较为容易支持多种语言及方言。另外,不仅可使用文字、还可通过语音输入检索关键词。因此,老年人和残疾人等难以用键盘输入检索语词的用户也能轻松利用该服务。

    今后,产综研将通过在用户中招募试用者,验证该系统的有效性,面向实用化进行改进。另外,还计划促进与原测试库的语音检索技术及多媒体内容的分类·归纳等技术的融合,开发更为地道的媒体检索技术。

    此外,产综研预定在2008年10月20~21日于产综研筑波中心举办的“产综研开放实验室”上公开该技术。

我要评论

】 【打印