Testando a classificação sentimento Keras com model.predict

votos
2

Eu tenho treinado o imdb_lstm.py no meu PC. Agora eu quero testar a rede treinada por introduzir algum texto de minha autoria. Como eu faço isso? Obrigado!

Publicado 05/11/2015 em 01:30
fonte usuário
Em outras línguas...                            


2 respostas

votos
1

Isso pode ajudar. http://keras.io/models/

Aqui é um uso de amostra. Como usar keras para XOR

Provavelmente, você tem que converter ur corpus em ndarray primeira e jogá-lo para o seu model.predict

Pelo que parece tão distante da entrada model.predict do modelo de formação deve ser de 100 palavras corpus que representam um índice de cada palavra no dicionário. Então, se você quer treinar com ur corpus, você tem que converter ur corpus de acordo com aqueles dicionário e ver se o resultado é 0 ou 1

Respondeu 06/11/2015 em 02:24
fonte usuário

votos
6

Então, o que você basicamente precisa fazer é a seguinte:

  1. Tokenizar sequnces: converter a string em palavras (características): Por exemplo: "Olá meu nome é Georgio" para [ "Olá", "meu", "nome", "é", "Georgio"].
  2. Em seguida, você deseja remover palavras de parada (confira Google pelo que parar as palavras são).
  3. Esta etapa é opcional, pode levar a resultados defeituosos, mas acho que vale a pena tentar. Stem suas palavras (características), de que maneira você vai reduzir o número de recursos que irá levar a uma corrida mais rápida. Novamente, isso é opcional e pode levar a algumas falhas, por exemplo: se você conter a palavra 'estacionamento' você começa 'parque', que tem um significado diferente.
  4. Próximo passo é criar um dicionário (confira Google para isso). Cada palavra recebe um número único e a partir deste ponto, vamos utilizar este número só.
  5. Computadores entendem apenas números por isso precisamos de falar em sua língua. Vamos dar o dicionário do estágio 4 e substitua cada palavra em nossa corpus com o seu número correspondente.
  6. Agora precisamos dividir nosso conjunto de dois grupos de dados: treinamento e teste conjuntos. One (formação) vai treinar o nosso modelo NN eo segundo (o teste) vai ajudar-nos a descobrir o quão boa é a nossa NN. Você pode usar a função de validação cruzada Keras'.
  7. A próxima coisa é definir o que é o número máximo de recursos a nossa NN pode começar como uma entrada. Keras chamar este parâmetro - 'maxlen'. Mas você realmente não tem que fazer isso manualmente, Keras pode fazer isso automaticamente apenas procurando a frase mais longa que você tem em seu corpo.
  8. Em seguida, vamos dizer que Keras descobriu que a sentença mais longa em sua corpus tem 20 palavras (características) e uma das suas frases é o exemplo na primeira etapa, que seu comprimento é de 5 (se vamos remover palavras de parada ele vai ser mais curto), em tal caso, vamos precisar adicionar zeros, 15 zeros na verdade. Isso é chamado de seqüência de almofada, fazemos isso para que cada seqüência de entrada será no mesmo comprimento.
Respondeu 08/12/2015 em 09:40
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more