Jason

独立开发,自由职业


  • 分类

  • 友链

  • 关于

  • 搜索

1116 - 时不时跳出来思考

发表于 2017-11-16 | 分类于 每天写一点

今天搞了一天的段落识别。

其中,比较大的一部分时间用于多栏的自动识别。虽说最后也差不多实现了,但却增加了程序的复杂度,让其它一些原本很简单的问题,变得难以解决。

经过一番思考后,我还是删除了这部分代码,仅保留了普通段落的识别。

回过头来看,之前决定做多栏识别的决定并不正确。因为这明显优先级低,又需花费大量时间。毕竟,还有很多其他更基础、更重要的事要做。不过,好在及时制止了花更多时间。

时不时跳出来思考下。也许现在正在苦闷的事,根本就不需要在意。

1115 - 世道在变化,服务云端化

发表于 2017-11-15 | 分类于 每天写一点

突然感觉,我之前好像写过这个话题…

最近几天,工作中涉及到 PDF 解析、OCR 识别这 2 个话题。其实,都是有非常「久远」历史的话题。说久远,是相对于软件的发展速度,二者已经是存在了好多年的东西。而且,由于一直以为也都有这样的需求,对应的方案也在不断变化。

  • 没几年之前,二者的方案基本都是 SDK、离线库,卖高昂的售价,通常都是卖给大企业。
  • 后来,License 也变也了订阅式的。
  • 直至今日,又变成了云端服务化,按使用量收费。
  • 甚至,云端这个词都要过时了,慢慢套上了「深度学习」、「AI」这些闪耀的词汇。

随着这些形态的演示,站在台前引领风骚的主,也在不断变化。比如,之前一直被「百度更懂中文」「微软这个外企肯定更懂英文」这种思想紧紧套住。可今天一试腾讯的 OCR,发现某些图片的识别,中文比百度强、英文比微软强。

世道,真的在变化。总拿老观点看世界,会出丑的。

1114 - Klib 即将支持从「多看」导入标注

发表于 2017-11-14 | 分类于 每天写一点

之前,Klib 已经支持从刷了多看系统的 Kindle 中导入标注。这次更进一步,是直接从多看系统中导入。比如,你在 iPhone 的多看中所作的标注,Klib 也能直接导入。

预计该版本月底前上架。抢先体验:https://s.toolinbox.net/Klib/d/

1113 - 我花了一天,做了一款和「百度」比肩的 OCR 图片识字工具 iText

发表于 2017-11-13 | 分类于 每天写一点

这是我第 7 款 macOS 产品了:iText

iText 是一款 从图片中识别文字 的 OCR 工具。

  • 集成百度深度学习算法(所以可以和百度 PK😂),识别结果惊人的准确
  • 配合截图、拖拽、选择图片文件等方式,操作非常便利

通过截图识别

选择屏幕任意区域,立即识别其中的文字。

配合快捷键,截图更方便。默认快捷键为 ⇧⌘1;当然,你可以在 iText 偏好设置中修改。

通过拖拽识别

比如,你在网上看到了一张图片、或者本地有个图片文件,都可以拖拽至 iText 菜单栏图标进行识别。

通过选择图片文件识别

当然,你也可以在 iText 菜单中选择图片文件进行识别。

下载

你会发现,对于 看扫描版 PDF 文件、登录才能复制文字的网页、对方以手机截图的方式发电话号码、等场景,iText 快速识字的功能,很有用、也很好用。

目前,iText 已上架 Mac App Store,点此下载

1112 - 做自己喜欢的事,感觉真爽

发表于 2017-11-12 | 分类于 每天写一点

在大家都忙着双 11 的时候,我用了一天多的时候,做了一个小工具。虽然超级累,但还是很开心的。

作为一个独立的产品,要做的事还是很多的:

  • Logo、图标
  • 菜单栏图标基本程序
  • 截图
  • 网络服务对接
  • 拖拽
  • 界面
  • 日志
  • 剪贴板操作
  • 收集反馈
  • 试用机制
  • 检测更新
  • 本地化
  • 测试用例、测试
  • …

到底是什么小工具呢?先预告下:是一款可以和「百度」比肩的 OCR 截图识字工具。

1…464465466…626
Jason

Jason

记录一位独立开发者的精进之路,分享自由职业者的生存方式。

3129 日志
9 分类
5 标签
RSS
GitHub Twitter Weibo
Links
  • Toolinbox
© 2011 - 2025 Jason 浙ICP备16002197号