Auto-codificador para reduzir o tamanho de dados de entrada

votos
2

Atualmente, eu quero usar o autoencoder para reduzir o tamanho dos dados de entrada, a fim de utilizar os dados reduzidos por mais redes neurais. Minha tarefa é fazer um vídeo e, em seguida, dar as imagens do vídeo ao autoencoder. Quando eu uso apenas algumas imagens como entrada, o autoencoder funciona bem, mas quando eu quero ter uma sequência de imagens, isso não acontece.

Imagine tomar vídeo de uma bola em movimento. Temos, por exemplo, 200 imagens. Se eu usar autoencoder de 200 imagens do erro é grande, mas se eu usar apenas para 5 imagens, o erro de reconstrução é pequeno e aceitável. Parece que autoencoder não aprende a sequência ou movimento temporal da bola de circulação. Eu também tenta denotando autoencoder empilhados mas os resultados não são bons.

Será que qualquer um sabe qual é o problema ou é possível usar o autoencoder para esta tarefa?

Publicado 04/12/2013 em 11:17
fonte usuário
Em outras línguas...                            


1 respostas

votos
0

Autoencoders / Variational Autoencoders não aprender sobre as sequências, ele aprende a "mapear" os dados de entrada para um espaço latente que tem menos dimensões. Por exemplo, se a imagem é 64x64x3que você pode mapear isso para um 32 dimtensor / matriz.

Para aprender uma seqüência de imagens, você precisa conectar a saída da parte codificador autoencoder a um RNN (LSTM / GRU), que poderia aprender sobre a seqüência dos quadros codificados (quadros consecutivos no espaço latente). Depois disso, a saída do RNN poderia ligar para a parte descodificador do autoencoder para que você possa ver os quadros reconstruídos.

Aqui você pode encontrar um projeto GitHub que tenta codificar os quadros de vídeo e, em seguida, prever as sequências

Respondeu 08/11/2018 em 07:27
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more