Qual é o tamanho mínimo conjunto de treinamento necessário para a tarefa de classificação sentimento em textos curtos

votos
1

Eu estou tentando treinar um modelo LSTM para a tarefa de classificação de sentimento em textos curtos, como produtos opiniões e tweets.

Estou à procura de um conjunto de treinamento que rotula positivo / negativo / neutro, existe tal coisa (gratuito para pesquisa) lá fora, que é realmente baseado em tags humanos e não na inicia ou emoticons? Iv'e encontrou apenas pequenos conjuntos de treinamento que me levaram a resultados pobres. Iv'e tentou aumentar o tamanho da minha rede e camadas empilhadas, mas nenhuma melhoria.

Qual é o tamanho mínimo para tal um conjunto de treinamento, a fim de começar a obter resultados razoáveis ​​(F1> 0,8).

Publicado 30/03/2016 em 07:34
fonte usuário
Em outras línguas...                            


1 respostas

votos
0

Você realmente só precisa fazer uma lista de 100 ou mais, cada um, de adjetivos negativos e positivos.

Veja:
http://na2english.wikispaces.com/file/view/ADJECTIVES%20TO%20DESCRIBE%20FILMS.pdf/400672720/ADJECTIVES%20TO%20DESCRIBE%20FILMS.pdf

http://arxiv.org/ftp/arxiv/papers /1011/1011.4623.pdf

Obviamente citá-los, se você usá-los, mas a linguagem é livre, para que você possa usá-los para o seu trabalho.

Provavelmente mais importante do que o tamanho do banco de dados que você construir estará escolhendo palavras que visam a sua aplicação específica para uma maior eficácia.

Você está apontando este projeto em uma utilização comercial específica ou como um esforço de pesquisa mais generalizada?

Respondeu 30/03/2016 em 07:43
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more