【说站】python数据模块类如何定义
2024-12-14
41
python数据模块类如何定义
说明
1、定义数据模块类,名为DataLoader。
2、类中有核心变量data用于保存爬行数据,以及两个相关界面grab_data(爬取数据)和save_data(保存数据到当地)。
实例
grab_data() 的核心代码
def grab_data(self): # 获取入口链接 entries = self.get_entry() # 遍历入口链接,解析得到文章链接 links = self.parse4links(entries) # 遍历文章链接,解析得到文章内容 datas = self.parse4datas(links) # 将相关数据写入变量 data self.data = pd.DataFrame(datas)
save_data() 的核心代码
def save_data(self): # 将变量 data 写入 csv 文件 self.data.to_csv(self.data_path, index = None)
我们已经爬取并保存好数据 data,数据以 DataFrame 形式存储,保存在 csv 文件,格式如下:
|---------------------------------------------------| | id | link | cont | title | |---------------------------------------------------| | page id | page link | page content | page title | |---------------------------------------------------| | ...... | ...... | ...... | ...... | |---------------------------------------------------|
以上就是python数据模块类定义的方法,希望对大家有所帮助。更多Python学习指路:python基础教程
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。
更新于:1个月前赞一波!4
相关文章
- 【说站】python自定义日志如何实现
- 【说站】python有哪些注释的种类
- 【说站】python中__new__的重写
- 【说站】python如何解决初始化执行次数
- 【说站】python错误类型捕获的方法
- 【说站】python数据结构堆的介绍
- 【说站】python参数调用的注意点
- 【说站】python Pandas读取数据文件的优点
- 【说站】python中in和is的区分
- 【说站】python异常中常见关键字
- 【说站】mysql有哪些数据操作
- 【说站】python os.path.join()函数的使用
- 【说站】python如何使用skimage包提取图像
- 【说站】python confusion_matrix()是什么
- 【说站】python中os.path.join()函数是什么
- 【说站】python中有哪些比较操作
- 【说站】php中Swoole的模块介绍
- 【说站】python字符串的用法总结
- 【说站】python列表数据如何增加和删除
- 【说站】python解释器的多种使用
文章评论
评论问答