| ISBN/价格: | 978-7-302-64536-8:CNY118.00 |
| 作品语种: | chi eng |
| 出版国别: | CN 110000 |
| 题名责任者项: | Python和PySpark数据分析/.(加)乔纳森·里乌著/.殷海英译 |
| 出版发行项: | 北京:,清华大学出版社:,2023 |
| 载体形态项: | 402页:;+图:;+24cm |
| 丛编项: | 数据科学与大数据技术 |
| 相关题名附注: | 版权页题英文题名:Data analysis with Python and PySpark |
| 提要文摘: | Spark数据处理引擎是一个惊人的分析工厂:输入原始数据,输出洞察。PySpark用基于Python的API封装了Spark的核心引擎。它有助于简化Spark陡峭的学习曲线,并使这个强大的工具可供任何在Python数据生态系统中工作的人使用。《Python和PySpark数据分析》帮助你使用PySpark解决数据科学的日常挑战。你将学习如何跨多台机器扩展处理能力,同时从任何来源(无论是Hadoop集群、云数据存储还是本地数据文件)获取数据。一旦掌握了基础知识,就可以通过构建机器学习管道,并配合Python、pandas和PySpark代码,探索PySpark的全面多功能特性。 |
| 并列题名: | Data analysis with Python and PySpark eng |
| 题名主题: | 软件工具 程序设计 |
|---|
| 题名主题: | 数据处理 |
| 中图分类: | TP311.561 |
| 个人名称等同: | 里乌 (加) (Rioux, Jonathan) 著 |
| 个人名称次要: | 殷海英 译 |
| 记录来源: | CN 91MARC 20231220 |