今天搞了一天的段落识别。
其中,比较大的一部分时间用于多栏的自动识别。虽说最后也差不多实现了,但却增加了程序的复杂度,让其它一些原本很简单的问题,变得难以解决。
经过一番思考后,我还是删除了这部分代码,仅保留了普通段落的识别。
回过头来看,之前决定做多栏识别的决定并不正确。因为这明显优先级低,又需花费大量时间。毕竟,还有很多其他更基础、更重要的事要做。不过,好在及时制止了花更多时间。
时不时跳出来思考下。也许现在正在苦闷的事,根本就不需要在意。
独立开发,自由职业
今天搞了一天的段落识别。
其中,比较大的一部分时间用于多栏的自动识别。虽说最后也差不多实现了,但却增加了程序的复杂度,让其它一些原本很简单的问题,变得难以解决。
经过一番思考后,我还是删除了这部分代码,仅保留了普通段落的识别。
回过头来看,之前决定做多栏识别的决定并不正确。因为这明显优先级低,又需花费大量时间。毕竟,还有很多其他更基础、更重要的事要做。不过,好在及时制止了花更多时间。
时不时跳出来思考下。也许现在正在苦闷的事,根本就不需要在意。
突然感觉,我之前好像写过这个话题…
最近几天,工作中涉及到 PDF 解析、OCR 识别这 2 个话题。其实,都是有非常「久远」历史的话题。说久远,是相对于软件的发展速度,二者已经是存在了好多年的东西。而且,由于一直以为也都有这样的需求,对应的方案也在不断变化。
随着这些形态的演示,站在台前引领风骚的主,也在不断变化。比如,之前一直被「百度更懂中文」「微软这个外企肯定更懂英文」这种思想紧紧套住。可今天一试腾讯的 OCR,发现某些图片的识别,中文比百度强、英文比微软强。
世道,真的在变化。总拿老观点看世界,会出丑的。
之前,Klib 已经支持从刷了多看系统的 Kindle 中导入标注。这次更进一步,是直接从多看系统中导入。比如,你在 iPhone 的多看中所作的标注,Klib 也能直接导入。
预计该版本月底前上架。抢先体验:https://s.toolinbox.net/Klib/d/
这是我第 7 款 macOS 产品了:iText
iText 是一款 从图片中识别文字 的 OCR 工具。
选择屏幕任意区域,立即识别其中的文字。
配合快捷键,截图更方便。默认快捷键为 ⇧⌘1
;当然,你可以在 iText 偏好设置中修改。
比如,你在网上看到了一张图片、或者本地有个图片文件,都可以拖拽至 iText 菜单栏图标进行识别。
当然,你也可以在 iText 菜单中选择图片文件进行识别。
你会发现,对于 看扫描版 PDF 文件、登录才能复制文字的网页、对方以手机截图的方式发电话号码、等场景,iText 快速识字的功能,很有用、也很好用。
目前,iText 已上架 Mac App Store,点此下载
在大家都忙着双 11 的时候,我用了一天多的时候,做了一个小工具。虽然超级累,但还是很开心的。
作为一个独立的产品,要做的事还是很多的:
到底是什么小工具呢?先预告下:是一款可以和「百度」比肩的 OCR 截图识字工具。