ISBN/价格: | 978-7-03-060637-2:CNY142.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 基于Python的Web大数据爬取实战指南/.夏换,杨秀璋,于小民编著 |
出版发行项: | 北京:,科学出版社:,2019.03 |
载体形态项: | 274页:;+24cm |
丛编项: | 大数据科学研究丛书 |
提要文摘: | 本书主要是基于Python的Web大数据爬取实战指南,选题内容包括基础知识和通过Python爬取Web网页数据两大部分。下图是PythonWeb数据采集的结构图,主要包括三个部分:网络传播技术、信息提取技术和数据存储技术。网络传播通常是使用HTTP进行,常用的传播方式包括HTML、XML、Json、Ajax和纯文本等;信息提取技术主要可以通过Python语言、R语言、Java语言等进行获取,其中主要包括的技术包括:正则表达式、XPath技术、Selenium、BeautifulSoup等;数据存储技术主要是存储爬取的数据信息,主要包括SQL数据库、纯文本格式等。 |
题名主题: | 软件工具-程序设计 |
中图分类: | TP311.561 |
个人名称等同: | 夏换 编著 |
个人名称等同: | 杨秀璋 编著 |
个人名称等同: | 于小民 编著 |
记录来源: | CN BAL 20191108 |