《用Python写网络爬虫》
ebook书名:用Python写网络爬虫
作者:[澳]理查德 劳森
出版社:人民邮电出版社
副标题:web scraping with python
出版年:2016年
页数:157
格式:ebook
ISBN:9787115431790
内容简介:
作为一种便捷地收集网上信息并从中抽取出可用信息的方式,网络爬虫技术变得越来越有用。使用Python这样的简单编程语言,你可以使用少量编程技能就可以爬取复杂的网站。 《用Python写网络爬虫》作为使用Python来爬取网络数据的杰出指南,讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外,本书还介绍了如何使用AJAX URL和Firebug扩展来爬取数据,以及有关爬取技术的更多真相,比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫,并对一些真实的网站进行了爬取。
作者简介:
Richard Lawson来自澳大利亚,毕业于墨尔本大学计算机科学专业。毕业后,他创办了一家专注于网络爬虫的公司,为超过50个国家的业务提供远程工作。他精通于世界语,可以使用汉语和韩语对话,并且积极投身于开源软件。他目前在牛津大学攻读研究生学位,并利用业余时间研发自主无人机。
-
《每个人的OKR》电子书免费下载
作者常年进行OKR相关绩效管理培训、辅导、咨询工作,研究开发适合中国企业创新绩效管理的方法。作为OKR教练员,作者近年来指导腾讯、字节跳动、京东、百度、小米、滴滴、伊利、联通、美的等上百家企业实施OKR落地。本书是作者在为一线大厂员工做OKR落地指导时...
01月01日[经营]
-
《新解鬼谷子》电子书免费下载
《新解鬼谷子》的解读版本众多。台湾易学大家刘君祖精研素有“智海”之称的《周易》四十年,从高远而深刻的视角解说谋略奇书《鬼谷子》,《易经》智慧与《鬼谷子》奇谋“撞色”,精彩无限,不同凡响:试探、摸清对手心理;利用对手的性格特点操纵其行为;应对...
01月01日[经营]
-
《学会成长 : 爆发式成长的25个思维模型》电子书免费下载
你的成长速度,决定了人生的高度。掌握成长的要领,才能掌握未来的人生。也许你是初入社会、对未来既憧憬又迷茫的大学毕业生;也许你已选好了人生的赛道,却遭遇了重重困境;也许你已奋斗多年,却依旧藉藉无名;也许你小有成就,却很难更上一层楼……其实,你...
01月01日[教育]
-
《死魂灵》电子书免费下载
《死魂灵》小说讲述了唯利是图的六品文官乞乞科夫买卖死农奴的故事。在俄语中,“农奴”和“灵魂”的字形与发音完全相同,这也包含了书名的双重意义,一方面指买卖死农奴这一贯穿全文的主线,另一方面也隐喻了小说主人公自己的灵魂,揭示了“他那讳莫如深的最...
01月01日[文学]
-
《元年春之祭 : 巫女主义杀人事件》电子书免费下载
“从初读《离骚》,到通读屈原的全部作品,结合种种资料的记载来分析,在我看来,屈原的身份并不仅仅是士大夫,同时也是参与楚国国家祭祀的巫女,而且是自幼身着男装直至暮年的巫女。”天汉元年,初次探访楚地云梦泽的长安豪族之女於陵葵,就以上述观点惊动了...
01月01日[流行]