关键词搜索

源码搜索 ×
×

python带你采集评论数据,看看这个内容为啥吸引他(她)

发布2022-07-04浏览533次

详情内容

前言

大家早好、午好、晚好吖~


本篇代码提供者: 青灯教育-自游老师


环境使用:

  • Python 3.8
  • Pycharm

代码

网址删了一部分,我把删了的东西放评论区,大家自行添加一下哦~

# 导入模块
import pprint
import re
import requests
import csv
import pandas as pd

    
    # f = open('评论.csv', mode='a', encoding='utf-8', newline='')
    # csv_writer = csv.DictWriter(f, fieldnames=[
    #     '用户',
    #     '地区',
    #     '评论',
    #     '日期',
    # ])
    # csv_writer.writeheader()
    
    
    url = 'https://m..cn/comments/hotflow?id=4784937075214225&mid=4784937075214225&max_id_type=0'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
    }
    response = requests.get(url=url, headers=headers)
    
    lis = []
    for index in response.json()['data']['data']:
        content = ''.join(re.findall('[\u4e00-\u9fa5]+', index['text']))
        dit = {
            '用户': index['user']['screen_name'],
            '地区': index['source'].replace('来自', ''),
            '评论': content,
            '日期': index['created_at']
        }
        lis.append(dit)
        # csv_writer.writerow(dit)
        print(dit)
    源码、解答、教程、资料有需要可以口裙:832157862
    pd_data = pd.DataFrame(lis)
    pd_data.to_excel('评论.xlsx')
    
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32

    尾语

    好了,我的这篇文章写到这里就结束啦!

    有更多建议或问题可以评论区或私信我哦!一起加油努力叭(ง •_•)ง

    喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

    相关技术文章

    点击QQ咨询
    开通会员
    返回顶部
    ×
    微信扫码支付
    微信扫码支付
    确定支付下载
    请使用微信描二维码支付
    ×

    提示信息

    ×

    选择支付方式

    • 微信支付
    • 支付宝付款
    确定支付下载