
Python网络爬虫:从入门到精通
教材教辅研究生/本科/专科教材11.2万字
更新时间:2023-10-25 19:34:57 最新章节:参考文献
书籍简介
本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
吕云翔主编
- 会员本书结合了Python3.6的新特性,完全为零基础的初学者量身定做。书中例举大量实例,介绍了Python的基本语法、编码规范和一些编程思想。本书第1~8章为Python语言基础,主要介绍Python的基本用法;第9章为一个实战,帮助读者理解前8章的知识;第10~17章为Python的进阶使用,包含面向对象编程、函数式编程入门、文件读写、异常处理、模块和包几个部分;第18章为第2个实战,帮助读者融高教教材8.4万字
最新上架
同类书籍最近更新
- 会员本书主要介绍了管理的概念与性质、管理理论的演进、计划、决策、战略管理、组织、领导、激励、沟通、控制,以及管理伦理与社会责任等内容,注重基本原理、基本知识在本土化案例中的应用。本书广泛采用案例导入、小提示、管理实践、思考与讨论、视野拓展等形式向读者展示文字或视频案例、理论解读、管理实践经验等辅助性学习内容,帮助读者学习管理学基本原理和基本知识;以二维码的方式拓展阅读空间和内容,增加本书的“厚度”;章高教教材27.1万字
- 会员本书为学习Linux系统管理的参考书,全书共9章,内容涵盖Linux系统管理所需的所有知识点,讲解了Linux日常管理操作的方方面面,由浅入深,内容全面,案例丰富,实战性强。本书依次讲解了Linux的高级文件系统管理,包括磁盘配额、LVM(逻辑卷管理)和RAID(磁盘阵列)的部署;Shell的基础知识,包括Bash操作环境的构建、输入/输出重定向、管道符、变量的设置和使用;Shell编程的正则表达高教教材17.8万字