Jason

独立开发,自由职业


  • 分类

  • 友链

  • 关于

  • 搜索

0216 -「说字」小程序发布

发表于 2020-02-16 | 分类于 每天写一点

昨天提交,晚上过审,今天发布,欢迎一试:

「说字」小程序,有啥用呢?边说话、边识别文字,不是语音输入吗?不是有很多类似的产品了吗?恩,你说的对,都对。我就是想做这样的一个产品,至于有什么用,等做出来以后再说吧。如果没人用,就当是炫技吧。

还是有点不一样,「说字」考虑支持无限时长的录音和识别,且价格低甚至可能(看广告)免费识别,这可能就是点区别吧。

发布后,还是做了一些修改,比如历史记录显示日期,调整复制时的样式,等等。又重新提交了新版,还在审核。

和「视字」一样,「说字」都已经发布了,百度语音识别的申请还没结果,真是 服务商赶不上开发者的节奏…

另外,「视字」小程序还遇到了 吊诡 的问题:在 iPhone 真机上无法上传文件,而在 Android 真机和开发工具中,均可以正常运行。后来,鬼使神差 地开启「增加编译」选项,居然就成功了。哎,又是一个 鬼畜 事件,程序员的日常。

0215 - 提交「说字」小程序

发表于 2020-02-15 | 分类于 每天写一点

如昨天计划,今天完成一些琐碎的事,然后提前了「说字」小程序。

这次提交,主要是预备,主要是担心首次发布的审核时间会比较长;明天应该还是会再提交一个版本。

今天主要遇到这几个坑。

一个是在 Android 真机上,无法建立 wss 连接,在握手时出错。根据出错提示搜索,基本也找不到解决方案。后来,无意间看到 header 中指定了 origin。当初这样设置是为了在开发工具上建立 wss,注释掉后,竟然成功了,啧啧。

另一个是在 iPhone 真机上无法录音。同样,根据出错提示,也没什么收获。后来,鬼使神差地去升级微信,没想到升级后竟然成功了,啧啧。

开发过程不断踩坑,伴随着各种鬼畜。好在,通常最后的结果都不错。

在提交后,再次意外地搜索到,有个「微信同声传译」的小程序插件,可以极其简单地接入语音识别能力。啧啧,早知道这样,我还费那么大劲接入搜狗干嘛。不过,也不完全都是好事。比如我看下面的评论,也是有各种踩坑的。关键,它也有 60s 的限制,且不方便做语音分割以实现无限期识别。以及,有配额的限制。可惜的是,没找到它的源码,不知道它是用的什么服务。

0214 - 「说字」基本跑通

发表于 2020-02-14 | 分类于 每天写一点

今天基本跑通了「说字」的基本流程,包括注册小程序,设计 Logo,集成搜狗语音识别,超长时间自动重连、基本界面布局,等等。

不过说实话,就目前的识别效果,堪忧…比微信中的语音识别,要差一些。

明天计划实现剩余的大部分可见功能,包括界面提示信息,历史及编辑,等等。之后有兴趣再做音频文件云端保存、集成腾讯语音识别等等。

0213 - 「说字」小程序

发表于 2020-02-13 | 分类于 每天写一点

今天没忍住,准备接着「视字」,再搞一个「说字」小程序。

所谓「说字」,就是边说话、边识别文字,就和微信里的按住说话一样。说实话,这东西有什么商用价值呢?不是有很多类似的产品了吗?恩,是这样的,不过我还是没忍住不是。今天是周四,计划 3 天、也即周日前完成发布上线,下周一推广一天,完事。

首先,自然是技术可行性研究。

先看微信小程序接口方面,提供了边录音边提供音频数据的能力,基本可行。

然后就是研究提供实时语音识别的服务。先是看了搜狗,因为「视字」里就是用的搜狗,且搜狗的语音识别使用的是 WebSocket 技术,看起来很厉害的样子。实际测试下来,感觉不管我怎么修改参数,长时间的音频,只能返回第一次发送的数据。最后发现是数据分割出了问题。证明可行。
不过有个限制,一次最多一分钟,还不确定能不能通过多次请求了来实现长时间的识别。
另外还有个可能的问题,就是是否兼容微信录音产生的音频格式,有待验证。

然后看了讯飞的接口,恩,太贵了…

然后看了腾讯 AI 的语音识别,基本已经完成集成,目测中间结果、最终识别结果略优于搜狗,单次最长 90s,看起来是比较好的选择。不过,也有坑,就是腾讯 AI 服务器很频繁地出现 502 错误,应该是服务器资源不足。这对于实时性要求很高的即时翻译,是比较要命。而且,微信小程序对于网络请求的频率,估计也是有限制的。

另外,百度的语音识别需要申请。已经申请了,等待结果。

目前还没有非常适合的服务,明天再想想,再看看阿里云的情况。

0212 - 对自己没有帮助的信息,都是噪音

发表于 2020-02-12 | 分类于 每天写一点

最近疫情,很多人会关心很多信息。比如,湖北省的人事干部有什么变动,实际情况是不是比官方通报的更严重,等等。

其实,很多信息对自己并没有帮助。比如,不管疫情是不是比通报的更严重,能改变你目前的决策吗?不是该上班上班、该在家呆着呆着、该做防护做防护,什么都没变。那这些信息对你有什么用呢?就是噪音;最多像娱乐八卦一样,满足你的好奇心、打发时间而已。

1…302303304…626
Jason

Jason

记录一位独立开发者的精进之路,分享自由职业者的生存方式。

3129 日志
9 分类
5 标签
RSS
GitHub Twitter Weibo
Links
  • Toolinbox
© 2011 - 2025 Jason 浙ICP备16002197号