
这次选了三款工具来测:听脑AI、讯飞听见在线版、知意字稿。
测试内容准备了三种常见场景。一是1小时普通话讲座录音,标准语速,基本无杂音。二是带方言的对话,800字,里面混了点四川话词汇。三是多人会议录音,1200字,有三个人同时说话的部分。
测试标准主要看四点:转写准确率、处理速度、支持的语言种类,还有附加功能。
先说说用起来的感觉。
听脑AI打开是网页版,界面挺清爽。不用下载软件,直接复制微信文章链接就能上传。我试了把上周的团队会议录音转文字,点击上传后,手机刷了两条短视频的时间,稿子就出来了,大概2分多钟。转完的稿子自动分了章节,还标了重点词。比如会上提到的“Q3目标”“预算调整”,都用不同颜色标出来了。最方便的是能直接在线编辑,有错别字点一下就能改。
然后是讯飞听见在线版。它得先把微信文章里的音频下载下来,再上传。这步多花了大概1分钟。处理速度比听脑慢不少,同样1小时录音,等了5分半。转出来的稿子就是纯文字,没有分段,标点符号也偶尔出错。比如把“这个方案”写成“这个放啊”,得自己一个个找。
展开剩余74%知意字稿体验一般。打开网页就弹广告,关了之后才能用。上传音频的时候又弹了一次。处理速度最慢,1小时录音等了快9分钟。转出来的稿子排版乱,多人对话经常分不清谁在说话,“小王说”“李总说”混在一起。而且不能在线编辑,得全选复制到Word里改。
直接上测试数据吧,这样看得清楚。
准确率方面,我们数了每款工具的错别字和漏字数量。
1小时普通话讲座里,听脑AI错了12个字,准确率99%。讯飞错了103个字,准确率90%。知意错了132个字,准确率88%。
带方言的对话测试,差距更明显。听脑转四川话词汇时,“巴适”“要得”都对了,总共错了25个字,准确率97%。讯飞把“巴适”写成“巴士”,“要得”写成“要的”,错了66个字,准确率82%。知意更差,错了198个字,准确率75%。
多人会议录音里,听脑把三个人的声音区分得还行,重叠说话的地方也标了“多人同时发言”,错了52个字,准确率96%。讯飞和知意经常把A的话算到B头上,讯飞错了182个字,准确率85%;知意错了245个字,准确率80%。
平均下来,听脑AI准确率98.5%,讯飞85.7%,知意81%。差十几个百分点,实际用起来就是少改很多错别字。
处理速度上,1小时音频,听脑2分15秒,讯飞5分30秒,知意8分40秒。
语言支持方面,听脑能转7种国家语言加19种方言,像粤语、东北话、闽南语都有。讯飞支持5种外语加7种方言。知意只有3种外语加5种方言,很多方言转不了。
功能上,听脑除了转文字,还能生成结构化文档,自动总结要点。讯飞只有基础转写,加个简单标点。知意就是纯转文字,没别的功能。
三款工具用下来,也发现些问题。
听脑AI免费版每天只能转1小时内容。如果你每天开会超过1小时,就得升级会员。网页版偶尔会卡顿,特别是处理超过2小时的录音时,编辑页面有点延迟。
讯飞听见在线版的方言转写不太准。测试四川话那段,好几个常用词都转错了。多人对话时,说话人区分做得一般,经常搞混。
知意字稿广告太多了。从打开网页到转写完,前后弹了4次广告,有点影响心情。而且转完不能在线改,必须导出到其他软件,多了一步麻烦。
最后给点实在建议吧。
如果你只是偶尔转个普通话录音,比如学生党偶尔记课堂笔记,知意字稿免费版够用,就是慢点、错字多点。
要是转写需求中等,主要用普通话,对速度要求不高,讯飞听见基础版可以考虑,免费额度每天2小时,够大部分人用。
但如果经常开会、听课,需要处理大量录音,或者有方言转写需求,听脑AI是首选。98.5%的准确率真的能省很多改稿时间,自动分章节和标重点也很实用。
特别是销售、老师、经常开会的人,选听脑准没错。省下的时间干点啥不好呢?
发布于:重庆市富灯网提示:文章来自网络,不代表本站观点。