Jason

独立开发,自由职业


  • 分类

  • 友链

  • 关于

  • 搜索

1201 - 没有最终的胜利,也没有致命的打击

发表于 2017-12-01 | 分类于 每天写一点

没有最终的胜利,也没有致命的打击,需要有持续前进的勇气。

今天看《至暗时刻》,对电影最后一句印象很深(措词可能不完全对得上),与大家共勉。

有了 iText,你截图,腾讯、Google OCR 帮你识别文字

发表于 2017-11-30 | 分类于 每天写一点

比如,在看类似上面的扫描版 PDF 时,想要复制其中的文字,怎么办?手打?太累。试试我新开发的工具 iText 吧。

iText 是 macOS 平台的 OCR 工具,自带截图功能,选择屏幕任意区域,即可识别其中的文字,又爽又酷。

识别后的文字已经复制到系统剪贴板,直接粘贴即可。

配合 ⇧⌘1 快捷键,使用体验更佳。当然,你也可以选择图片文件,或者将图片拖拽至 iText 的菜单栏图标进行识别。

文字识别精准

你有没有这种印象:OCR 识别出来的文字有很多问题,还不如自己打字来得快。可见,识别的准确性非常重要,也是我非常在意的一点。

腾讯、Google 双引擎

首先,我排除了离线的识别库,因为离线注定了这些库的识别能力是死的,不会自己增强。接下来,在一票在线 OCR 服务中,我对比了百度、腾讯、微软、Google 等大厂的产品,最后选择了国内使用腾讯、国外使用 Google 的组合。判断依据是什么?少量测试 + 主观倾向,比如不测我就觉得 Google 比微软牛。

那么,到底识别准不准呢?这么说吧:

  • 对于一般的自然语言,比如书中的一段话、新闻稿,识别效果是惊人的准确,甚至可以达到 100%
  • 对于排版复杂、尤其有特殊字符的文字,比如程序代码、选择题,识别效果就不太理想,需要手动对识别后的结果进行修正
    • 比如,单纯地给一个竖线,机器是无法区分到底是小写的 l、还是大写的 I(顺便问一下,你看出二者的区别了吗?);与之相对,机器是需要根据上下文进行判断和优化的。而像程序代码这种非自然语言,机器目前是很难进行语义识别的

到底准不准?你不妨一试。

独创算法,进一步优化识别结果

OCR 服务还有一些欠缺,iText 针对性地做了这些优化:

  • 自动识别段落
  • 中文环境使用全角标点符号
  • 中文与英文字母、数字间增加空格
  • 删除中文字符间、英文字符与标点符号间的多余空格
  • 英文首字母大写

如果你发现识别不好的地方,欢迎把图发给我,我会相应地优化算法,毕竟算法是需要数据喂养的,先谢。

预览原图,方便校对

在目前 OCR 技术不能始终达到 100% 的情况下,预览原图、并进行修正,还是有必要的。在 iText 中,你可以这样:

  • 将识别后的窗口拖到图片附近
  • 调用 iText 识别结果的 双栏模式:左侧展示图片、右侧展示识别后的文字

这样,就可以很方便地对照原图进行手动优化识别后的文字。

下载与付费

其实,很多场景都会用到 iText,比如 识别快递单上的号码、图片中的联系人信息、需要登录才能复制的网页 等等,欢迎下载 iText 试试。

每月可免费识别 20 次,订阅 iText 高级版即可无限次识别。首发期间,高级版限时 6 折优惠:¥3/月、¥30/年。关于收费模式,我很是纠结了一番。如果你准备吐槽,请先看下这篇文章:再次纠结付费模式,这次是 iText

如果你觉得 iText 还不错,还请帮忙 在 App Store 评论;如果你觉得 iText 还可以改进,欢迎:

  • 在这里留言
  • 加入 Telegram 群
  • 微信扫码入群:

1129 - 上架却不能宣传,真难受

发表于 2017-11-29 | 分类于 每天写一点

今天 iText 成功上架 Mac App Store 了!

可是,却不能大规模宣传,因为宣传时要提到首发特价,而订阅模式改价格,只能到明天才能生效。所以,只能等明天才宣传,难受。


昨天在招行商城抢了双立人的锅,今天上午就收到了,效率真高啊。与之对比,在平安商场上用卷买东西,死活都提交不了订单。差距真是大啊。

1128 - 再次纠结付费模式,这次是 iText

发表于 2017-11-28 | 分类于 每天写一点

首先,iText 一定是款需要付费才能使用的产品:

  • 在线 OCR 服务是需要付费的,通常是按次收费
    • 注:腾讯 OCR 服务目前在内测期,免费;不过收费只是时间问题
  • 我需要为花费的时间买单,并支撑自己继续做独立开发者

接下来的问题,便是如何确定收费模式。有这几种可考虑:

  • 买断式
    • 也即,你付一次钱,就可终身使用
    • 考虑到 OCR 服务的按次收费,个人觉得这并不科学,至少不具可持续性
  • 流量包式
    • 比如,¥12 元买 250 次识别次数
    • 对用户而言,这种方式 对于低频使用的用户很友好,但对于高频使用的用户,可能不太划算
    • 另外,最关键的是,这种方式会给使用上 带来很大的心理压力。比如,我在截图时不小心区域没选对,结果白白浪费了一次识别次数,这会让我在每次截图时都会有不小的心理压力,生怕截错了。虽然,从理性的角度,一次真没多少钱。但没办法,这种心里上的事情是很难用理性压制的。
  • 包月式
    • 也即订阅式,即一个月出固定费用,即可不限次识别
    • 对用户而言,优缺点几乎和流量包式相反:对低频用户不友好、对高频用户友好
    • 最终,我选择的是这种模式:每月可免费识别 20 次,充分体验 iText 的功能;订阅高级版即可不限次识别

其实,这跟手机流量非常像:

  • 如果你用量很少,1 MB 流量 0.1 元的方式就很适合你
  • 如果你用是很大、或者就想用得爽,包月得到固定流量、甚至是不限量的套餐,更适合你
  • 不过,我还没见过付一次钱,就可终身不限量使用的套餐

1127 - 今天做了并不太喜欢的事:写文案

发表于 2017-11-27 | 分类于 每天写一点

虽说,好的产品自己会说话、简洁的程序不应该有说明书。可无奈,酒香也怕巷子深,大家在真正使用产品之前,总需要一些方式来了解到产品。而在目前的传播方式中,文案则是必须的了。

这里说的文案,包括:

  • 产品本身的说明书、教程
  • 发布在媒体上的文章
  • 发布在朋友圈等 SNS 上的信息
  • 以及其他所有对外爆光的东西
  • 除了中文,还有英文…

当然,除了文字,也包括配图、甚至是视频。而这两者,通常比文字更花时间。

比如,在做上面的图时,首先要明确表达什么、构思如何表达、确定涉及到的素材、录屏、制作 GIF,整个过程流程很多,非常耗时。且一旦需要修改,几乎是全部重来的成本。

苦闷的是,好像才写了不知道几分之一;每次发布前,一想到要写这些文案,心理压力好大啊…

1…461462463…626
Jason

Jason

记录一位独立开发者的精进之路,分享自由职业者的生存方式。

3129 日志
9 分类
5 标签
RSS
GitHub Twitter Weibo
Links
  • Toolinbox
© 2011 - 2025 Jason 浙ICP备16002197号