今天听到这个词,感觉有意思。
都说,失败是成功之母。可,如果任由失败接连发生,却不做什么,自然是不可能成功的。要做的,是在犯错后,对整个过程复盘,思考为什么;如果今后遇到同样的问题,怎么做会更好;等等。
做专业的失败者,才能在失败的基础上进步。
独立开发,自由职业
今天听到这个词,感觉有意思。
都说,失败是成功之母。可,如果任由失败接连发生,却不做什么,自然是不可能成功的。要做的,是在犯错后,对整个过程复盘,思考为什么;如果今后遇到同样的问题,怎么做会更好;等等。
做专业的失败者,才能在失败的基础上进步。
这两天在开发关键词排名监控应用,同时开发前端和后端,遇到一个严重的问题:后端 接口频繁变动,导致前端也要相应调整;同时,联调又要花费大量时间。
怎么避免这种情况呢?我想了想:
感叹后端也是大坑,其中很重要的一点是 高并发与有限资源的冲突。毕竟,服务器的性能和资源都有限,甚至不如个人电脑,却要承载很多人的使用,对程序的挑战很大。比如我这两天的工作,在量小时一切正确;可量大后,直接内存不够给崩了…
怎么说呢?继续苦练内功吧。
首先,爬虫是灰色的;其合理利用,取决于爬虫方的心态和能力,也取决于反爬虫的技术。爬虫用的好,可以成就 Google、百度这样的公司;用得不好,可能对别人的利益,造成严重的伤害。
不管怎样,爬虫极其广泛地存在。最近我也接触了一点,简单说说。
先说反爬虫方
保护自己的财产,怎么做都不为过(可能吧)。说一个例子,你在百度搜索页面所做的 任何操作,包括鼠标移动、页面滚动、点击、甚至什么都不做的等待时间,所有这些信息,都会 被百度收集(细思极恐)。其作用可能很多,很重要的一点,就是识别你是人而不是虫子。而你如果是上来就用工具发网络请求,实在太容易被识别了,封不封,也只是看百度心情了。
再来看看爬虫方
关键的一点,是怎么防止被屏蔽。比较简单的,包含控制访问的频率、模拟用户的 Cookie/Refer/Header;进一步的,模拟用户真实行为,等等。
其中很重要一个策略,就是用 大量 IP,频繁更换。怎么得到这许多 IP 呢?
技术方案的选择,首先要知道有哪些可能的方案,然后在成本等众多限制条件下,寻找最优的;也是件挺有意思的。
我们自然会依赖一些人或事。而当这种依赖不稳定、甚至对我们造成伤害时,如果我们无法反向影响或替换这种依赖,痛苦便无休止。
比较好的,就是我们 有多个支点,可以依赖多个不同的东西。这样,当其中一个支点破坏时,可以简单地丢弃之,生活或心情不至于受影响。
说明了还是自由度的问题。因为有多个可以依赖,所以变得没有依赖。
很自然的,做好事情后,我们都希望得到别人的肯定,甚至是称赞。就像小学生把字写好后,老师会表扬,TA 会很开心。
可,我们已经不是小学生了,不是吗?
人应该自我驱动;是自己内心的追求,驱动自己克服困难,做好事情。既然是自己的事,为什么要别人来表扬?
当然,我们不是机器人,别人的肯定,确实能提高自己的信心和成就感。可,关键是,别依赖,别像个小学生一样,巴巴地等着表扬,然后才继续做下面的事。