【问题标题】:Scraping the data out of the text从文本中抓取数据
【发布时间】:2021-03-29 11:53:54
【问题描述】:

我正在为 Steam 社区市场开发价格检查器应用程序。我使用以下代码从网站中提取了源代码,其中包括截至今天为止的所有销售。能否请您帮我获取“[[]]”符号之间的数据?

import requests
sites = [
    "https://steamcommunity.com/market/listings/730/AK-47%20%7C%20Redline%20%28Field-Tested%29"
]
for url in sites:
    r = requests.get(url)
    page_source = r.text
    page_source = page_source.split('\n')
    print("\nURL:", url) 
    
    for row in page_source[:]:
        print(row)

【问题讨论】:

  • 你能澄清一下你在寻找什么吗?你希望你的代码输出什么,它目前在做什么?
  • 在源代码中有一个python列表,表明自2014年以来已经进行了销售。我想获取数据并尝试找到该商品的平均价格。

标签: python-3.x web-scraping text steamworks-api steambot


【解决方案1】:

我使用正则表达式提取数据

import requests
import re
import json

sites = [
    "https://steamcommunity.com/market/listings/730/AK-47%20%7C%20Redline%20%28Field-Tested%29"
]
for url in sites:
    r = requests.get(url)
    page_source = r.text
    # print(page_source)
    results = re.search(r'var line1=\[.*\]',page_source).group()
    print(results[10:])

【讨论】:

    猜你喜欢
    • 2021-03-18
    • 2020-06-16
    • 2012-10-30
    • 1970-01-01
    • 2023-04-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多