荟萃馆

位置:首页 > 网络 > 速录速记

浅析语音识别与速录速记技术

从发展的眼光看,人工智能代替纯手工速录是历史发展的必然趋势,但从现有的科学技术来看,路还很长。现在都有语音识别了,速录师是不是该下岗了呢?下面是YJBYS小编带来的资深速录师对语音识别与人工速录谈谈的看法。

浅析语音识别与速录速记技术

十年前,当我打算重新投身于速录事业之际,和很多人一样,对速录的可持续发展持有疑虑,对语音识别代替速录技术同样表示担心。恰逢同学回国,聊起此事。同学对投身速录事业表示赞赏,并补充说:美国的速录师从业人数非常多,速录技术应用非常广泛。还举例说:一千人参加的会议,只要有一位听障人士,会务组必须单独为其配备速录师。谈到语音识别对速记、速录的影响(当年有机构开发这类软件),美国的语音识别技术发展非常超前,但是美国现有的语音识别技术也只限用于军事、医疗这种标准化程度非常高的行业。

抛开语种的.差别,汉语言的博大精深咱不赘述。单从中国的软件技术与美国相比,差距可不止是一点点。美国的语音识别技术也只是在极少数专业领域进行发展和应用,中国的语音识别技术怎么可能在短时间内完成这种华丽转身呢?

有人可能会说,你同学说的为什么要听?他说的就代表权威吗?所以必须得说明,该同学当时受聘于美国知名IT公司,从事语音识别技术研发工作,方向是英语语种,其夫人受聘于同一家公司,从事同类工作,方向是阿拉伯语系。

可能上面的故事不足以让大多数人顿悟,下面我们就以实战进行分析。了解速录的人都知道,速录师有国家标准,标准里的关键词是速度、准确率。现在就以这两个关键词为基础,结合影响会议的相关因素,对语音识别与人工速录进行综合比对。

※ 错字数以A4纸为例,满页5号字,约1500字。

分析

1.准确率相信绝大多数一线速录师会议记录现场交稿的准确率不低于99%(95%以上只是行业标准),但即使99%以上的准确率(即一页纸错15个字以下),很多严苛的单位还是相当不满意。所以大多数时候,速录师会把错误率控制在千分之三以下(主要是专业术语的误听)。

反观语音识别,语音识别推销的广告词往往是“高辨识度,准确率高达80%以上”。我想请问,80%的准确率(即单页错300个字)这还能算是文稿吗?

2.速度两者都能同步记录。

3.会场环境当会场环境较恶劣时,比如话筒音量不够或无话筒,离音源较远,夹杂着各种声音,我不知道软件该如何去识别?但我知道,我们速录师能。

4.文稿美观度带过实习生的速录师都知道,很多实习生对于分段特别不适应,所以改他(她)的文稿特别累。光分段就会让你好好地去重听整个音频,因为不分段的文稿客户是不会满意的。而语音识别恰恰就是永远不分段。

一线速录师的文稿一定会做到分段、分层次、分角色,而且会做到段落清楚,层次分明。角色,我特别提出来,多人对话、现场激烈讨论这种场景,是我们速录师碰到的常态,电视节目“扒词”是要分角色的,但不管哪种情况,角色绝不会自报家门,全靠速录师同步添加,这一点所谓的语音识别永远做不到。

通过分析,高下立判,优劣一目了然。

一点拙见,希望对想步入速录大家庭的你能有所帮助。