技术文章 - IT学院

22

12月

[python爬虫]Requests-BeautifulSoup-Re库方案--Requests库介绍

【根据北京理工大学嵩天老师“Python网络爬虫与信息提取”慕课课程编写文章中部分图片来自老师PPT 慕课链接：https://www.icourse163.org/learn/BIT-1001870001?tid=1002236011#/learn/announce】一、

22

12月

Python

利用 Python 插件 xlwings 读写 Excel

Python 通过 xlwings 读取 Excel 数据去年底公司让我做设备管理，多次委婉拒绝，最终还是做了。其实我比较喜欢技术。做管理后发现现场没有停机率统计，而原始数据有，每次要自己在Excel中填写数据，感觉特麻烦了，就写了这个自动化操作Excel的程序，以前要半天的工作量，用Python

22

12月

Python

python基础一

python基础一一，Python介绍 1，python的出生与应用　　python的创始人为吉多·范罗苏姆（Guido van Rossum）。1989年的圣诞节期间，吉多·范罗苏姆（中文名字：龟叔）为了在阿姆斯特丹打发时间，决心开发一个新的脚本解释程序，作为ABC语言的一种继承。

22

12月

Python

Python转页爬取某铝业网站上的数据

天行健，君子以自强不息；地势坤，君子以厚德载物！好了废话不多说，正式进入主题，前段时间应朋友的请求，爬取了某铝业网站上的数据。刚开始呢，还是挺不愿意的（主要是自己没有完整的爬取过网上的数据哎，即是不自信），但是在兄弟伙的面前不能丢脸卅，硬起头皮都要上，于是乎答应了他，好吧~~~~ 我们的爬取目标

22

12月

Python

面向对象进阶

一,.接口类　　1. 继承有两种用途　　　　1>：继承基类的方法，并且做出自己的改变或者扩展（代码重用）　　2>：声明某个子类兼容于某基类，定义一个接口类Interface，接口类中定义了一些接口　　　名（就是函数名）且并未实现接口的功能，子类继承接口类，并且实现接口中

22

12月

Python

python学习笔记

变量变量是为了存储和程序运算过程中的一些中间结果方便以后调用（变量命名规则） 1. 要具有描述性2.变量名只能_和数字，字母组成3.不以中文为命名4.不能以数字开头5.保留字符不能被使用常量常量名全部大写代表是常量实验作业#print("hello,world") #x=41#y=

22

12月

Python

朴素贝叶斯算法——实现新闻分类（Sklearn实现）

1、朴素贝叶斯实现新闻分类的步骤（1）提供文本文件，即数据集下载（2）准备数据将数据集划分为训练集和测试集；使用jieba模块进行分词，词频统计，停用词过滤，文本特征提取，将文本数据向量化停用词文本stopwords_cn.txt下载 j

22

12月

Python

Django rest framework 限制访问频率(源码分析)

基于 http://www.cnblogs.com/ctztake/p/8419059.html 当用发出请求时首先执行dispatch函数，当执行当第二部时： #2.处理版本信息处理认证信息处理权限信息对用户的访问频率进行限制 self.initi

22

12月

Python

Python 中关于Random的使用方法

Random 在 Python 中的使用方法： 1.random.random(): 会随机生成0-1之间的小数例如： 2.random.uniform(min,max): 会随机生成 min - max 之间的小数，其中min 和 max 的位置可以互换而不会报错： 3.random

22

12月

Python

Python：Selenium 1：浏览器驱动

　　Selenium是一个用于测试网站的自动化测试工具，爬虫中也经常用到，支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器，同时也支持phantomJS无界面浏览器。　　自WebDriver 3.0 之后，Selenium不再提供默认的浏览器支持。换言之，不再默认地支持

22

12月

Python

Python学习笔记：math模块和random模块

math模块　　math模块用于数学意义上的一些计算，常用的方法有： math.pi：PI的值（3.141592653589793）。 math.floor(x)：返回一个小于等于x的最大整数（浮点类型），x可以是整数，也可以是小数，比如math.floor(1.001)返回1.0。 math.c

22

12月

Python

【leetcode 简单】第十二题报数

报数序列是指一个整数序列，按照其中的整数的顺序进行报数，得到下一个数。其前五项如下： 1. 1 2. 11 3. 21 4. 1211 5. 111221 1 被读作 "one 1" ("一个一") , 即 11。11 被读作 "two 1s" ("两

22

12月

Python

21天打造分布式爬虫-房天下全国658城市房源（十一）

项目：爬取房天下网站全国所有城市的新房和二手房信息网站url分析 1.获取所有城市url http://www.fang.com/SoufunFamily.htm 例如：http://cq.fang.com/

22

12月

Python

Celery基本使用

Celery 什么是Celery? Celery是一种简单/高效/灵活的即插即用的分布式任务队列. Celery应用场景? 需要异步处理的任务,发邮件/发短信/上传等耗时的操作.最终到达提升用户体验的目的. Celery的模式 Celery主要是由Broker(中间人)和Worker(任务处理者)组

22

12月

Python