浅谈语音识别与速录速记技术
在速录群中,经常有人推销所谓的“音频转换文字”的软件;在会议现场,经常会被与会嘉宾问到:现在都有语音识别了,你们速录师是不是该下岗了……这导致很多有志于速录事业发展的青年才俊对语音识别代替人工速录表示极大的担忧。今天我也就语音识别与人工速录谈谈自己的看法。虽然从发展的眼光看,人工智能代替纯手工速录是历史发展的必然趋势,但从现有的科学技术来看,路还很长。
十年前,当我打算重新投身于速录事业之际,和很多人一样,对速录的可持续发展持有疑虑,对语音识别代替速录技术同样表示担心。恰逢同学回国,聊起此事。同学对投身速录事业表示赞赏,并补充说:美国的速录师从业人数非常多,速录技术应用非常广泛。还举例说:一千人参加的会议,只要有一位听障人士,会务组必须单独为其配备速录师。谈到语音识别对速记、速录的影响(当年有机构开发这类软件),美国的语音识别技术发展非常超前,但是美国现有的语音识别技术也只限用于军事、医疗这种标准化程度非常高的行业。抛开语种的差别,汉语言的博大精深咱不赘述。单从中国的软件技术与美国相比,差距可不止是一点点。美国的`语音识别技术也只是在极少数专业领域进行发展和应用,中国的语音识别技术怎么可能在短时间内完成这种华丽转身呢?有人可能会说,你同学说的为什么要听?他说的就代表权威吗?所以必须得说明,该同学当时受聘于美国知名IT公司,从事语音识别技术研发工作,方向是英语语种,其夫人受聘于同一家公司,从事同类工作,方向是阿拉伯语系。
可能上面的故事不足以让大多数人顿悟,下面我们就以实战进行分析。了解速录的人都知道,速录师有国家标准,标准里的关键词是速度、准确率。现在就以这两个关键词为基础,结合影响会议的相关因素,对语音识别与人工速录进行综合比对。
根据不同会议提供相对应的版面支持
15字以下
※ 错字数以A4纸为例,满页5号字,约1500字。
分析
1.准确率
相信绝大多数一线速录师会议记录现场交稿的准确率不低于99%(95%以上只是行业标准),但即使99%以上的准确率(即一页纸错15个字以下),很多严苛的单位还是相当不满意。所以大多数时候,速录师会把错误率控制在千分之三以下(主要是专业术语的误听)。
反观语音识别,语音识别推销的广告词往往是“高辨识度,准确率高达80%以上”。我想请问,80%的准确率(即单页错300个字)这还能算是文稿吗?
2.速度
两者都能同步记录。
3.会场环境
当会场环境较恶劣时,比如话筒音量不够或无话筒,离音源较远,夹杂着各种声音,我不知道软件该如何去识别?但我知道,我们速录师能。
4.文稿美观度
带过实习生的速录师都知道,很多实习生对于分段特别不适应,所以改他(她)的文稿特别累。光分段就会让你好好地去重听整个音频,因为不分段的文稿客户是不会满意的。而语音识别恰恰就是永远不分段。
一线速录师的文稿一定会做到分段、分层次、分角色,而且会做到段落清楚,层次分明。角色,我特别提出来,多人对话、现场激烈讨论这种场景,是我们速录师碰到的常态,电视节目“扒词”是要分角色的,但不管哪种情况,角色绝不会自报家门,全靠速录师同步添加,这一点所谓的语音识别永远做不到。
-
速录软件技术前景
目前速录师主要在以下几个领域发挥其特殊的记录本领:一是司法系统的庭审记录、询问记录;二是社会各界讨论会、研讨会的现场记录;三是政府部门、各行各业办公会议的现场记录;四是新闻发布会的网络直播;五是网站嘉宾访谈、网上的文字直播;六是外交、公务、商务谈...
-
速录机具备的功能
软件功能:亚伟中文速录机的译码软件(专用文字处理系统)配备丰富的词库,可适应各行各业普遍需求;码表设置系统可选择专业码表以适应不同行业的特殊需求;强大的字词修改功能,随意修改文本任意位置的'任何字词,可用标准键盘和专用键盘打开同音字词替换窗口,支持一录一...
-
亚伟速录机特有的双机联控功能设置
为了进一步增强的亚伟速录机的移动办公功能,开发了无限连接功能,录机特有的双机联控技术的应用保证了两台速录机通过同一接口与计算机连接,同时工作,可任意切换灵活设置,电脑同步翻译系统采用了先进的中间文件技术,可对窗口中的任意文本进行同音字替换,简化了同音字...
-
速录介绍与练习办法
1994年,著名速记学家唐亚伟成功研制了专用键盘的中文电脑速录机。命名为亚伟中文速录机,当时,世界上已有30多个国家拥有自己语言的电脑速录机,他的这一发明填补了国内空白。速录机的键盘特别简单,24个键左右对称,键位和键位的组合代表不同的声母和韵母,再靠声母和韵母...