《用Python写网络爬虫》
ebook书名:用Python写网络爬虫
作者:[澳]理查德 劳森
出版社:人民邮电出版社
副标题:web scraping with python
出版年:2016年
页数:157
格式:ebook
ISBN:9787115431790
内容简介:
作为一种便捷地收集网上信息并从中抽取出可用信息的方式,网络爬虫技术变得越来越有用。使用Python这样的简单编程语言,你可以使用少量编程技能就可以爬取复杂的网站。 《用Python写网络爬虫》作为使用Python来爬取网络数据的杰出指南,讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外,本书还介绍了如何使用AJAX URL和Firebug扩展来爬取数据,以及有关爬取技术的更多真相,比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫,并对一些真实的网站进行了爬取。
作者简介:
Richard Lawson来自澳大利亚,毕业于墨尔本大学计算机科学专业。毕业后,他创办了一家专注于网络爬虫的公司,为超过50个国家的业务提供远程工作。他精通于世界语,可以使用汉语和韩语对话,并且积极投身于开源软件。他目前在牛津大学攻读研究生学位,并利用业余时间研发自主无人机。
-
《超能力侦探事务所2》电子书免费下载
《超能力侦探事务所2》幻影城,一座侦探之城。各家神探大显神通,为民除害,也暗自比拼。唯独一桩十年前的案子至今无人破解,其幕后黑手依旧让侦探们闻风丧胆。他们就是“神秘组织”。超能力侦探事务所也要尽一份力!虽然侦探们拥有的都是些没什么用的超能力...
01月01日[流行]
-
《S/Z》电子书免费下载
《S/Z》是一本标志性的理论著作,它既是罗兰·巴特文学思想的一次发展,也是所谓的结构主义向后结构主义转变的一个里程碑。而这所谓的标志性的里程碑,就是罗兰·巴特从过去那种单纯地运用符号学和结构主义叙事学的相关语言及文学理论,把文学作品当作一个完...
01月01日[文学]
-
《中国式饭局人脉学》电子书免费下载
作者以宏观的视角诠释了“饭局社交”中的组织和派系,分析了阴谋和利益,同时,又从微观的层面人手,详细地阐释了怎样在不同的饭局中采取不同的交际方法--与陌生人,与老板,与同事,与下属,与客户,与哥们儿……无不涵盖其中。...
01月01日[生活]
-
《亚洲的去魔化:18世纪的欧洲与亚洲帝国》电子书免费下载
《亚洲的去魔化》呈现的正是在18世纪这段知识系统大变动的历史时期,欧洲人与亚洲知识、亚洲印象纠缠的过程。欧洲在这个世纪深入认识亚洲,原本神秘奇幻的国度现在成了清晰的客体,这种知识上的去魔化令欧洲获得了一种至今依然挥之不去的优越与自大感。奥斯特...
01月01日[文化]
-
《亲爱的三毛》电子书免费下载
在这个日渐快速的时代里,我张望街头,每每看见一张张冷漠麻木、没有表情的面容匆匆行过。我总是警惕自己,不要因为长时间生活在这般的大环境里,不知不觉也变成了那其中的一个。他们使我黯然到不太敢照影子。也许,透过书信呼应的方式,加上声音,我们人和人...
01月01日[文学]