今天,找了一天如何优化 iText 识别文本的排版。其中,在 GitHub 上找到 2 个很有用的东西:
- 译文排版规则指北
- 这是稀土所翻译的文章排版的规则,比如「中英文之间需要增加空格」,方便自己知道,正确的排版应该是什么样。
- typeset
- 一个基于 Python 的开源项目,自动修正中文、英文、代码混合排版中的全半角、空格等问题。
这两个分享,一个告诉我应该做成什么样,一个告诉我该怎么做。特此感谢。
正是这样的分享,让我们可以不再重复花时间研究别人已经研究过的东西,更快地做出更好的东西。特此致敬。
我也会在合适的时候,开源自己的产品、或者产品中的模块,比如我之前开源的 IAPHelper