Dicionário: Como listar todos os caminhos chave que contém um determinado valor?

votos
2

Vamos dizer que eu tenho um dicionário da forma:

d={'geo': {'bgcolor': 'white','lakecolor': 'white','caxis': {'gridcolor': 'white', 'linecolor': 'white',}},
    'title': {'x': 0.05},
    'yaxis': {'automargin': True,'linecolor': 'white','ticks': '','zerolinecolor': 'white','zerolinewidth': 2}
  }

Como você pode trabalhar o seu caminho através de que dict e fazer uma lista de cada caminho da chave completa que contém o valor 'white'? Usando uma função definida por jfs usuário no pós procurar um valor em python dicionário aninhado permite verificar se há ou não 'white'ocorre pelo menos uma vez e também retorna o caminho:

# in:
def getpath(nested_dict, value, prepath=()):
    for k, v in nested_dict.items():
        path = prepath + (k,)
        if v == value: # found value
            return path
        elif hasattr(v, 'items'): # v is a dict
            p = getpath(v, value, path) # recursive call
            if p is not None:
                return p
getpath(d,'white')

# out:
('geo', 'bgcolor')

Mas 'branco' ocorre em outros lugares também, como em:

1. d['geo']['lakecolor']

2: d['geo']['caxis']['gridcolor']

3: d['yaxis']['linecolor']

Como posso ter certeza de que a função localiza todos os caminhos?

Eu tentei aplicar a função acima até que ele retorne noneao eliminar caminhos encontrados um por um, mas que rapidamente se transformou em uma bagunça feia.

Obrigado por todas as sugestões!

Publicado 02/12/2019 em 23:54
fonte usuário
Em outras línguas...                            


3 respostas

votos
1

Retornando é o que torna o resultado incompleto. Em vez de retornar, use uma lista separada para rastrear seus caminhos. Eu estou usando a lista cur_listaqui, e devolvê-lo no final do loop:

d = {
  'geo': {'bgcolor': 'white',
         'caxis': {'gridcolor': 'white', 'linecolor': 'white'},
         'lakecolor': 'white'},
  'title': {'x': 0.05},
  'yaxis': {'automargin': True,
           'linecolor': 'white',
           'ticks': '',
           'zerolinecolor': 'white',
           'zerolinewidth': 2}
}

cur_list = []

def getpath(nested_dict, value, prepath=()):
    for k, v in nested_dict.items():
        path = prepath + (k,)
        if v == value: # found value
            cur_list.append(path)
        elif isinstance(v, dict): # v is a dict
            p = getpath(v, value, path, cur_list) # recursive call
            if p is not None:
                cur_list.append(p)

getpath(d,'white')
print(cur_list)


# RESULT:
# [('geo', 'bgcolor'), ('geo', 'caxis', 'gridcolor'), ('geo', 'caxis', 'linecolor'), ('geo', 'lakecolor'), ('yaxis', 'linecolor'), ('yaxis', 'zerolinecolor')]
Respondeu 03/12/2019 em 00:00
fonte usuário

votos
1

apenas transformar sua função para que ele retorna um liste não fazer returnquando algo for encontrado. Basta adicionar a / ampliar a lista

def getpath(nested_dict, value, prepath=()):
    p = []
    for k, v in nested_dict.items():
        path = prepath + (k,)
        if v == value: # found value
            p.append(path)
        elif hasattr(v, 'items'): # v is a dict
            p += getpath(v, value, path) # recursive call
    return p

com os seus dados de entrada, isto produz (ordem pode variar de acordo com as versões Python onde os dicionários são não-ordenada):

[('yaxis', 'linecolor'), ('yaxis', 'zerolinecolor'), ('geo', 'lakecolor'), 
('geo', 'caxis', 'linecolor'), ('geo', 'caxis', 'gridcolor'), ('geo', 'bgcolor')]
Respondeu 03/12/2019 em 00:00
fonte usuário

votos
5

Este é um caso de uso perfeito para escrever um gerador:

def find_paths(haystack, needle):
    if haystack == needle:
        yield ()
    if not isinstance(haystack, dict):
        return
    for key, val in haystack.items():
        for subpath in find_paths(val, needle):
            yield (key, *subpath)

Você pode usá-lo da seguinte forma:

d = {
    'geo': {'bgcolor': 'white','lakecolor': 'white','caxis': {'gridcolor': 'white', 'linecolor': 'white',}},
    'title': {'x': 0.05},
    'yaxis': {'automargin': True,'linecolor': 'white','ticks': '','zerolinecolor': 'white','zerolinewidth': 2}
}

# you can iterate over the paths directly...
for path in find_paths(d, 'white'):
    print('found at path: ', path)

# ...or you can collect them into a list:
paths = list(find_paths(d, 'white'))
print('found at paths: ' + repr(paths))

A abordagem gerador tem a vantagem de que ele não precisa criar um objeto para manter todos os caminhos na memória de uma só vez; eles podem ser processados ​​um a um e imediatamente descartado. Neste caso, as economias de memória seria bastante modesto, mas em outros, pode ser significativo. Além disso, se uma iteração loop sobre um gerador é encerrado mais cedo, o gerador não vai continuar procurando mais caminhos que seriam posteriormente descartados de qualquer maneira.

Respondeu 03/12/2019 em 00:18
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more