Como importar dados para o Google colab do Google Drive?

votos
2

Eu tenho alguns arquivos de dados carregados no meu disco google. Eu quero importar esses arquivos em google colab.

O método API REST e método PyDrive mostram como criar um novo arquivo e enviá-lo na unidade e colab. Usando isso, eu sou incapaz de descobrir como ler os arquivos de dados já está presente no meu disco no meu código python.

Eu sou um novato total para isso. Alguém pode me ajudar?

Publicado 08/02/2018 em 23:58
fonte usuário
Em outras línguas...                            


2 respostas

votos
1

!) Defina seus dados estejam disponíveis publicamente, em seguida, para planilhas públicos:

from StringIO import StringIO  # got moved to io in python3.

import requests
r = requests.get('https://docs.google.com/spreadsheet/ccc? 
key=0Ak1ecr7i0wotdGJmTURJRnZLYlV3M2daNTRubTdwTXc&output=csv')
data = r.content

In [10]: df = pd.read_csv(StringIO(data), index_col=0,parse_dates= 
['Quradate'])

In [11]: df.head()

Mais aqui: Obtendo CSV planilha do Google em uma trama de dados de Pandas

Se tipo de dados privados do mesmo, mas você vai ter que fazer alguma ginástica auth ...

Respondeu 09/02/2018 em 01:39
fonte usuário

votos
6

(Atualização de 15 abril de 2018: O gspread é frequentemente a ser actualizado, de modo a garantir o fluxo de trabalho estável I especificar a versão)

Para arquivo de planilha, a idéia básica é usar pacotes gspread e pandas para ler planilhas no Drive e convertê-los para pandas formato de trama de dados.

No notebook Colab:

#install packages
!pip install gspread==2.1.1
!pip install gspread-dataframe==2.1.0
!pip install pandas==0.22.0


#import packages and authorize connection to Google account:
import pandas as pd
import gspread
from gspread_dataframe import get_as_dataframe, set_with_dataframe
from google.colab import auth
auth.authenticate_user()  # verify your account to read files which you have access to. Make sure you have permission to read the file!
from oauth2client.client import GoogleCredentials
gc = gspread.authorize(GoogleCredentials.get_application_default()) 

Então eu sei 3 maneiras de ler planilhas do Google.

Pelo nome do arquivo:

spreadsheet = gc.open("goal.csv") # Open file using its name. Use this if the file is already anywhere in your drive
sheet =  spreadsheet.get_worksheet(0)  # 0 means the first sheet in the file
df2 = pd.DataFrame(sheet.get_all_records())
df2.head()

Por URL:

 spreadsheet = gc.open_by_url('https://docs.google.com/spreadsheets/d/1LCCzsUTqBEq5pemRNA9EGy62aaeIgye4XxwReYg1Pe4/edit#gid=509368585') # use this when you have the complete url (the edit#gid means permission)
    sheet =  spreadsheet.get_worksheet(0)  # 0 means the first sheet in the file
    df2 = pd.DataFrame(sheet.get_all_records())
    df2.head()

Pela chave arquivo / ID:

spreadsheet = gc.open_by_key('1vpukIbGZfK1IhCLFalBI3JT3aobySanJysv0k5A4oMg') # use this when you have the key (the string in the url following spreadsheet/d/)
sheet =  spreadsheet.get_worksheet(0)  # 0 means the first sheet in the file
df2 = pd.DataFrame(sheet.get_all_records())
df2.head()

Eu compartilhei o código acima em um caderno Colab: https://drive.google.com/file/d/1cvur-jpIpoEN3vAO8Fd_yVAT5Qgbr4GV/view?usp=sharing

Fonte: https://github.com/burnash/gspread

Respondeu 21/03/2018 em 00:14
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more