从文本中抓取数据答案

【问题标题】：Scraping the data out of the text从文本中抓取数据
【发布时间】：2021-03-29 11:53:54
【问题描述】：

我正在为 Steam 社区市场开发价格检查器应用程序。我使用以下代码从网站中提取了源代码，其中包括截至今天为止的所有销售。能否请您帮我获取“[[]]”符号之间的数据？

import requests
sites = [
    "https://steamcommunity.com/market/listings/730/AK-47%20%7C%20Redline%20%28Field-Tested%29"
]
for url in sites:
    r = requests.get(url)
    page_source = r.text
    page_source = page_source.split('\n')
    print("\nURL:", url) 
    
    for row in page_source[:]:
        print(row)

【问题讨论】：

你能澄清一下你在寻找什么吗？你希望你的代码输出什么，它目前在做什么？
在源代码中有一个python列表，表明自2014年以来已经进行了销售。我想获取数据并尝试找到该商品的平均价格。

标签： python-3.x web-scraping text steamworks-api steambot

【解决方案1】：

我使用正则表达式提取数据

import requests
import re
import json

sites = [
    "https://steamcommunity.com/market/listings/730/AK-47%20%7C%20Redline%20%28Field-Tested%29"
]
for url in sites:
    r = requests.get(url)
    page_source = r.text
    # print(page_source)
    results = re.search(r'var line1=\[.*\]',page_source).group()
    print(results[10:])

【讨论】：