【问题标题】:Export data excel to google sheets with Python使用 Python 将数据 Excel 导出到谷歌表格
【发布时间】:2021-05-02 19:36:46
【问题描述】:

通过一个迭代, 我需要将位于两行 excel 列('G7'、'G8')中的两个数据导出到两列谷歌表格。我该怎么做?

import gspread
from gspread_dataframe import get_as_dataframe, set_with_dataframe
from oauth2client.service_account import ServiceAccountCredentials
import pyperclip
import pyautogui as p
import rpa as r
import pandas as pd
import tabula
import openpyxl

r.init()
r.url('https://www.meudetran.ms.gov.br/veiculo.php#')
p.sleep(2)
janela = p.getActiveWindow()
janela.maximize()
p.sleep(2)

scope = ['https://spreadsheets.google.com/feeds']
credentials = ServiceAccountCredentials.from_json_keyfile_name('credentials.json', scope)
gc = gspread.authorize(credentials)
wks = gc.open_by_key('1AGYhinoPiE9xUABnrNEfVGjLf5s_bAJGjpz9hatfIQU')
worksheet = wks.get_worksheet(0)
dados = get_as_dataframe(worksheet)
df = pd.DataFrame.from_records(dados, columns=["Placa", "Renavam"])
set_with_dataframe(worksheet, df)
df2 = get_as_dataframe(worksheet)

for row in df2.itertuples():
    df = tabula.read_pdf(text, pages=1)[1]
    df.to_excel('dados.xlsx')
    wb = openpyxl.load_workbook('dados.xlsx')
    sheet = wb.active
    venc = sheet['G8'].value
    valor = sheet['G7'].value
    worksheet.update(row[3], venc)

最后一行不会更新谷歌表格的第 3 列

【问题讨论】:

  • 脚本中的df = tabula.read_pdf(text, pages=1)[1] 是什么?
  • 我正在将 web pdf 转换为 xlsx 中的表格。要获取数据并将其提供给 googlesheet,在活动元组中
  • 感谢您的回复。您想要从 PDF 数据转换的 XLSX 数据中的第一个选项卡中的单元格“G7”和“G8”中检索值。我的理解正确吗?如果我的理解是正确的,你想把检索到的“G7”和“G8”的值放到谷歌电子表格的哪里?似乎在您的脚本中,仅使用了“G8”的值。所以我无法理解你目标的细节。对此我深表歉意。
  • 就是这样。我需要将“G8”中的这些数据导入谷歌表格的“C2”单元格。但是,我需要根据元组中读取的行自动完成此操作。在这种情况下,我可以使用 worksheet.update ('C2', venc),但在所有元组中,我会更新谷歌表格中的同一个单元格。在下一个元组中,需要输入 Google 'C3' 单元格,然后是 'C4' ....
  • 感谢您的回复。我不得不为我糟糕的英语水平道歉。不幸的是,从您的回复中,我仍然无法理解您的目标。例如,您想在每次运行脚本时将值附加到电子表格中的“C”列?例如,在第一次运行时,您希望将检索到的“G7”和“G8”值放入电子表格的单元格“C2”和“C3”中。并且,在第二次运行时,您希望将检索到的“G7”和“G8”值放入电子表格的单元格“C4”和“C5”中。你想做这个循环。我的理解正确吗?

标签: python google-sheets google-sheets-api gspread


【解决方案1】:

我相信你的目标和你目前的情况如下。

  • 您希望从 PDF 数据转换的 XLSX 数据的第一个选项卡中的单元格“G7”和“G8”中检索值。
    • 你已经做到了。
  • 您希望在每次脚本运行时将值附加到电子表格中的“C”和“D”列。
    • 例如,在第一次运行时,您希望将检索到的“G7”和“G8”值放入电子表格的“C2”和“D2”单元格中。并且,在第二次运行时,您希望将检索到的“G7”和“G8”值放入电子表格的单元格“C3”和“D3”。您想执行此循环。
  • 您已经能够使用 Sheets API 为 Google 电子表格获取和输入值。

修改点:

  • 在您的脚本中,从电子表格检索到的值将转换为数据框。我认为在您的情况下,这可能不是必需的。
  • 在此修改中,我想提出以下流程。
    1. 从 PDF 数据转换的 XLSX 数据中检索“G7”和“G8”中的值。
    2. 从“C”和“D”列中检索值并检索“C”和“D”列的最后一行。
    3. 将检索到的值附加到 Google 电子表格中的“C”和“D”列。

当以上几点反映到你的脚本中时,它变成如下。

修改脚本:

在这个修改后的脚本中,我在你的脚本中修改了gc = gspread.authorize(credentials)下面。

gc = gspread.authorize(credentials)
wks = gc.open_by_key('###') # Please set your Spreadsheet ID.
worksheet = wks.get_worksheet(0)

# 1. Retrieve the values from "G7" and "G8" from the XLSX data converted from PDF data.
df = tabula.read_pdf(text, pages=1)[1]
df.to_excel('dados.xlsx')
wb = openpyxl.load_workbook('dados.xlsx')
sheet = wb.active
venc = sheet['G8'].value
valor = sheet['G7'].value

# 2. Retrieve the values from the column "C" and retrieve the last row of the columns "C" and "D".
lastRow = max([len(worksheet.col_values(3)), len(worksheet.col_values(4))])

# 3. Append the retrieved values to the columns "C" and "D" in Google Spreadsheet.
worksheet.update('C' + str(lastRow + 1), [[valor, venc]])
  • 在这个修改后的脚本中,它假设df = tabula.read_pdf(text, pages=1)[1] 工作正常。请注意这一点。
  • 通过上述修改,检索到的值valor, venc 每次运行都会附加到“C”和“D”列。

参考资料:

【讨论】:

  • 完美运行。我只需要做一些调整,但就是这样。朋友,非常感谢您的帮助,我已经尝试了几天的解决方案。
  • @Lino Costa 感谢您的回复和测试。我很高兴你的问题得到了解决。也谢谢你。
猜你喜欢
  • 1970-01-01
  • 2018-11-15
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-12-09
  • 2023-01-04
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多