《用Python写网络爬虫》
ebook书名:用Python写网络爬虫
作者:[澳]理查德 劳森
出版社:人民邮电出版社
副标题:web scraping with python
出版年:2016年
页数:157
格式:ebook
ISBN:9787115431790
内容简介:
作为一种便捷地收集网上信息并从中抽取出可用信息的方式,网络爬虫技术变得越来越有用。使用Python这样的简单编程语言,你可以使用少量编程技能就可以爬取复杂的网站。 《用Python写网络爬虫》作为使用Python来爬取网络数据的杰出指南,讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外,本书还介绍了如何使用AJAX URL和Firebug扩展来爬取数据,以及有关爬取技术的更多真相,比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫,并对一些真实的网站进行了爬取。
作者简介:
Richard Lawson来自澳大利亚,毕业于墨尔本大学计算机科学专业。毕业后,他创办了一家专注于网络爬虫的公司,为超过50个国家的业务提供远程工作。他精通于世界语,可以使用汉语和韩语对话,并且积极投身于开源软件。他目前在牛津大学攻读研究生学位,并利用业余时间研发自主无人机。
-
《50人的二十年》电子书免费下载
撰写本书的中国经济50人论坛成员,是具有国内水准、享有较高社会声誉,并且致力于中国经济问题研究的一批经济学家。他们中的许多人都以不同的方式走过了中国改革开放40年的历程,有些人还从政策的建言者成了政策的制定者和实践者。该书的文章既有理性的思考,...
01月01日[经营]
-
《维多利亚女王》电子书免费下载
本书分为24个章节,用关键的24天巧妙地勾勒了维多利亚女王的一生。出生、加冕、婚礼、第一个孩子的出生、丧夫、登基六十周年钻禧庆典,与此同时,在历史的坐标轴上,对应着辉格党政府的垮台、对印度的殖民统治、克里米亚战争……在维多利亚女王的人生日历上,...
01月01日[文化]
-
《反焦虑思维》电子书免费下载
经常觉得压力山大,发愁事情永远没完没了?想事情总是先想到消极的一面,每天负能量满满?一遇大场面,就习惯性焦虑、失眠、不安?凡事思虑过重,想太多,愁太甚,永远处在焦虑状态?在这本具有可操作性的书中,两位心理学博士基于30多年的执业经验,为我们提...
01月01日[生活]
-
《黑石的起点,我的顶点》电子书免费下载
黑石集团创始人彼得·彼得森以睿智、老练的文笔描述了他非凡的生命故事,他是一个真正的“巨人”:他是投资银行家、政治家、美联储官员、慈善家、反对财政赤字的公众人士,他更是“全球私募之王”黑石集团的创始人,管理过4340亿美元的资产。...
01月01日[经营]
-
《看得见的手》电子书免费下载
《看得见的手》本书作者小艾尔弗雷德·D.钱德勒教授是美国著名的企业史学家,任教于美国哈佛大学、约翰·霍普金斯大学、麻省理工学院等校,著有经济和企业史书籍多种,如《策略与结构:美国工业企业史中的组成部分》(1962年)、《皮尔·杜邦和现代公司的创建...
01月01日[经营]