Usando .to_numpy () para copiar colunas específicas a partir de uma linha de trama de dados para outro pandas

votos
0

Eu tenho uma trama de dados como este:

     UniqueID  CST  WEIGHT  VOLUME  PRODUCTIVITY
0  413-20012    3     123      12          1113
1  413-45365    1     889      75          6748
2  413-21165    8     554      13          4536
3  413-24354    1     387      35          7649
4  413-34658    2     121      88          2468
5  413-36889    4     105      76          3336
6  413-23457    5     355      42          7894
7  413-30089    5     146      10          9112
8  413-41158    5     453      91          4545
9  413-51015    9     654      66          2232

E eu tenho um dicionário de pai: mapeamentos filho para o UniqueID de:

parent_child_dict = {
    '413-51015': '413-41158',
    '413-21165': '413-23457',
    '413-45365': '413-41158',
    '413-20012': '413-23457'
}

O que eu preciso fazer é percorrer a trama de dados, e substituir o peso, volume e valores produtividade da 'criança' linha UniqueID com os valores do 'pai' linha UniqueID, onde resultando trama de dados ficaria assim:

     UniqueID  CST  WEIGHT  VOLUME  PRODUCTIVITY
0  413-20012    3     355      42          7894
1  413-45365    1     453      91          4545
2  413-21165    8     355      42          7894
3  413-24354    1     387      35          7649
4  413-34658    2     121      88          2468
5  413-36889    4     105      76          3336
6  413-23457    5     355      42          7894
7  413-30089    5     146      10          9112
8  413-41158    5     453      91          4545
9  413-51015    9     453      91          4545

Eu experimentei com várias soluções possíveis, e os problemas que estou tendo é limitar a cópia de forma tal que o os valores da CST da linha 'criança' UniqueID e são preservados, mas os outros valores são copiados.

O mais próximo que eu comecei é um loop através do dicionário em que cada par é alimentado a este:

df.loc[df['UniqueID'] == '413-51015'] = df.loc[df['UniqueID'] == '413-41158'].to_numpy()

Isso parece muito bem substituir todos os valores de uma linha para outra.

Qualquer ajuda sobre as exceções ou uma melhor solução global seria extremamente útil. Obrigado.

Publicado 19/03/2020 em 22:01
fonte usuário
Em outras línguas...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more