关键词搜索

源码搜索 ×
×

Python爬虫实战,wordcloud模块,简单分析Chrome浏览器浏览记录

发布2021-08-31浏览410次

详情内容

前言

利用Python简单分析一下Chrome浏览器的网页浏览记录,我们一起愉快的学习吧。

开发工具

Python版本:3.6.4

相关模块:

pyecharts模块;

wordcloud模块;

以及一些Python自带的模块。

DB.Browser版本:3.11.0

环境搭建

关于python:

安装python教程并添加到环境变量,pip安装需要的相关模块即可。

关于DB.Browser:

下载地址:

https://github.com/sqlitebrowser/sqlitebrowser/releases

建议下载免安装版本的(相关文件中也提供了免安装版本)。

原理简介

Chrome浏览器的网页浏览历史记录一般保存在:

C:\Users<USERNAME>\AppData\Local\Google\Chrome\UserData\Default\history

利用DB.Browser打开它,发现与历史浏览记录相关的表有urlsvisits

打开观察一下表的结构:

了解了表的结构之后,我们就可以愉快地写代码提取历史浏览记录了:

将获取到的数据进行简单的可视化,结果如下:

相关技术文章

点击QQ咨询
开通会员
返回顶部
×
微信扫码支付
微信扫码支付
确定支付下载
请使用微信描二维码支付
×

提示信息

×

选择支付方式

  • 微信支付
  • 支付宝付款
确定支付下载