ISBN/价格: | 978-7-115-42047-3:CNY49.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 干净的数据/.(美)斯夸尔著/.任政委译 |
出版发行项: | 北京:,人民邮电出版社:,2016.05 |
载体形态项: | 188页:;+24cm |
丛编项: | 图灵程序设计丛书 |
提要文摘: | 本书主要内容包括:在数据科学领域数据清理工作的重要作用,文件格式、数据类型、解码的基本概念,表单的关键特性,组织和处理数据的文本编辑器,各种格式的数据转换方法,解析和清理网页上的HTML文件的三种不同策略,深入了解PDF文件并掌握从中拖出数据的方法,检测和清除RDBMS中的坏数据的解决方案,使用书中介绍的方法清理来自Twitter和Stack Overflow的数据。 |
题名主题: | 数据处理 |
中图分类: | TP274 |
个人名称等同: | 斯夸尔 (美) 著 |
个人名称次要: | 任政委 译 |
记录来源: | CN BAL 20161010 |