0209 - 「视字」集成讯飞

今天没忍住,动手给「视字」集成了 讯飞语音识别

为什么呢?本来对讯飞期望挺高的,毕竟在公开的产品中,讯飞听见的识别结果是相对来说最理想的,我自然想将其集成到「视字」中。之前选择搜狗而非讯飞,主要是几个原因:

  • 讯飞只支持上传本地音频文件,不支持提供网络音频文件。
  • 讯飞价格最美丽,入门价基本是搜狗等其他产品的 2 倍+

不过,后来看如果选择比较贵的套餐,基本价格能做到和其他产品差不多。冲着它的效果,我就动手了。

不过,折腾了一天,等集成后,傻眼了:相同的音频文件,讯飞 API 返回的识别结果,和讯飞自家的产品如讯飞听听,那简单不是一个量级的东西,差太多了。跟腾讯、阿里比都不如,更别说搜狗。我当时那个吐血啊。都怪我太善良,没相信讯飞这个浓眉大眼的家伙,也会干这种事。

目前,我已经发了工单,提供了音频文件和分别的识别结果,询问官方到底是怎么回事,期待结果吧。如果没有合理的答复,我只能粉转黑,再也不义务宣传讯飞的产品了

当然,今天还件开心的事:从视频中提取音频,我选用的是七牛的服务。本以为会按视频转码计费;给七牛发工单,官人也是这么说的。没想到今天看实时费用,应该是按音频转码计费的,这可是视频价格的 1/10。恩,好事,可以压低成本了。不过,七牛的服务响应速度堪忧,说人话就是很慢。哎,这问题目前怕是无解了。