爬虫框架 Scrapy 轻松入门~
在入坑爬虫的学习中,第一个接触的爬虫框架就是 Scrapy 。在使用了相比于其他的框架而言,如 PySpider、Crawley 等,个人觉得 Scrapy 在使用上更简洁、体系上更完善。
这篇文章和《RocketMQ源码解析-开篇》隔了非常久,肥壕真是惭愧不已。一方面是忙于工作(摸鱼),另一方面...
2020最后一天,你还有什么想说的
Elasticsearch 作为主流的分布式搜索引擎,查询速度快,扩张性强,查询结果近实时。 也许有些小伙伴跟肥壕有同样的好奇,为什么查询结果是近实时的呢?
目前线上的百万数据需要同步到 Elasticsearch,那么如何能够安全又快速的实现大数据量的同步呢?
字符编码 ASCII、GB2312、GBK、Unicode、UTF8 这些你真的懂吗?