Perguntas com a tag [reinforcement-learning]

Publicado 10/02/2009 em 19:09
usuário kaybenleroll
votos
24
respostas
9
visitas
5k
Boas implementações de reforço de aprendizagem?
Publicado 11/04/2009 em 15:32
usuário bdd
votos
1
respostas
1
visitas
950
funções de generalização para Q-Learning
Publicado 09/10/2009 em 08:02
usuário devoured elysium
Publicado 25/10/2009 em 07:17
usuário RCIX
votos
1
respostas
1
visitas
840
Melhorar Q-aprendizagem
Publicado 13/11/2009 em 16:43
usuário devoured elysium
Publicado 23/11/2009 em 13:19
usuário devoured elysium
votos
1
respostas
1
visitas
154
QLearning e episódios sem fim
Publicado 02/12/2009 em 22:53
usuário devoured elysium
votos
4
respostas
3
visitas
2k
recompensas negativas em QLearning
Publicado 03/12/2009 em 23:54
usuário devoured elysium
votos
6
respostas
3
visitas
5k
parâmetros alfa e gama em QLearning
Publicado 06/12/2009 em 06:37
usuário devoured elysium
votos
8
respostas
3
visitas
4k
aprendizado por reforço em C #
Publicado 27/04/2010 em 17:41
usuário Betamoo
votos
1
respostas
1
visitas
887
Reforço aprendizagem com redes neurais
Publicado 01/05/2010 em 08:56
usuário Betamoo
votos
2
respostas
2
visitas
427
aprendizado por reforço E POMDP
Publicado 01/05/2010 em 15:04
usuário Betamoo
votos
3
respostas
2
visitas
859
projeto brinquedo aprendizado por reforço
Publicado 16/05/2010 em 23:12
usuário Betamoo
Publicado 27/09/2010 em 02:10
usuário Cerin
votos
1
respostas
1
visitas
162
Implementando HexQ Algorithm
Publicado 01/10/2010 em 14:09
usuário Cerin
Publicado 19/10/2010 em 20:12
usuário PeanutButterJelly
Publicado 23/11/2010 em 13:26
usuário sascha
Publicado 30/01/2011 em 19:59
usuário caw
Publicado 15/02/2011 em 21:26
usuário Carlo V. Dango
Publicado 25/02/2011 em 00:12
usuário E Shindler
votos
9
respostas
2
visitas
648
Reforço Aprendendo com acções variáveis
Publicado 07/03/2011 em 03:34
usuário Cerin
Publicado 24/03/2011 em 23:18
usuário pmwalk
votos
5
respostas
1
visitas
2k
algoritmo Sarsa
Publicado 22/05/2011 em 01:36
usuário Neutralise
Publicado 30/06/2011 em 22:47
usuário zergylord
Publicado 06/07/2011 em 20:58
usuário Ælex
Publicado 14/07/2011 em 19:00
usuário zergylord
Publicado 17/07/2011 em 18:01
usuário Cerin
Publicado 27/07/2011 em 16:46
usuário Ælex
votos
7
respostas
4
visitas
928
São redes neurais realmente abandonware?
Publicado 02/08/2011 em 09:48
usuário tunnuz
Publicado 17/08/2011 em 18:54
usuário zergylord
votos
3
respostas
1
visitas
1k
XOR teste Hebbiana / rede neural exemplo
Publicado 04/09/2011 em 05:19
usuário A Person
votos
3
respostas
1
visitas
3k
Aprendizagem por Reforço Projetos Iniciante
Publicado 14/09/2011 em 13:56
usuário trenki
Publicado 21/09/2011 em 20:39
usuário Laleila
Publicado 11/11/2011 em 07:21
usuário arkate
votos
15
respostas
1
visitas
6k
Biblioteca de reforço de aprendizagem C ++
Publicado 06/01/2012 em 11:22
usuário trenki
Publicado 08/01/2012 em 06:13
usuário Vadiklk
Publicado 10/01/2012 em 07:41
usuário Vadiklk
votos
1
respostas
2
visitas
1k
Recompensas em Q-aprendizagem e na TD (lambda)
Publicado 10/01/2012 em 12:19
usuário Vadiklk
votos
3
respostas
3
visitas
696
Como usar árvores MinMax com Q-Learning?
Publicado 10/01/2012 em 12:23
usuário Vadiklk
Publicado 11/01/2012 em 22:24
usuário stackOverlord
Publicado 24/01/2012 em 13:01
usuário Cerin
Publicado 25/01/2012 em 19:28
usuário BumbleShrimp
Publicado 22/05/2012 em 04:20
usuário Site
Publicado 23/05/2012 em 13:27
usuário Kendall Frey
votos
2
respostas
2
visitas
681
dilema discretização
Publicado 29/05/2012 em 03:22
usuário Rustam Issabekov
Publicado 31/05/2012 em 02:31
usuário zergylord
Publicado 17/06/2012 em 14:34
usuário user846400
Publicado 04/07/2012 em 10:11
usuário Piniu
votos
1
respostas
0
visitas
167
otimização dupla com aprendizado por reforço
Publicado 19/07/2012 em 10:35
usuário user846400
Publicado 27/07/2012 em 17:21
usuário zergylord
Publicado 27/07/2012 em 22:47
usuário Davoud Taghawi-Nejad




Publicado 07/08/2012 em 11:47
usuário user846400
votos
2
respostas
1
visitas
1k
atualização valor Q-learning
Publicado 08/08/2012 em 13:44
usuário user846400
votos
2
respostas
1
visitas
995
PyBrain Reinforcement Learning - Labirinto e Graph
Publicado 16/08/2012 em 01:47
usuário gbc921
Publicado 19/08/2012 em 13:47
usuário user824624
Publicado 20/08/2012 em 00:18
usuário user824624
Publicado 13/09/2012 em 15:56
usuário Arin Aivazian
Publicado 28/10/2012 em 22:20
usuário edelweiss
Publicado 30/10/2012 em 21:11
usuário devoured elysium
Publicado 12/11/2012 em 10:00
usuário user846400
Publicado 19/11/2012 em 11:42
usuário TheWhiteLlama
Publicado 18/12/2012 em 05:47
usuário user1912130
Publicado 20/12/2012 em 20:58
usuário user1406177
Publicado 30/01/2013 em 22:40
usuário zergylord
votos
1
respostas
1
visitas
790
Formação Redes Neurais com saída linear grande
Publicado 28/03/2013 em 20:50
usuário user1406177
votos
3
respostas
1
visitas
752
algoritmo Sarsa para problemas média de recompensa
Publicado 29/03/2013 em 00:56
usuário user2223057
Publicado 04/05/2013 em 10:43
usuário GKruger
Publicado 16/05/2013 em 05:47
usuário user2388629
votos
2
respostas
2
visitas
673
Qlearning - Membros que definem e recompensas
Publicado 11/06/2013 em 16:00
usuário mrjasmin
Publicado 27/06/2013 em 05:32
usuário zergylord
votos
5
respostas
4
visitas
1k
simulação bandido n-armada em R
Publicado 29/07/2013 em 20:04
usuário Fernando
votos
1
respostas
2
visitas
130
Aprendizagem reforço sem Estado sucessor
Publicado 10/09/2013 em 12:26
usuário Michael Anslow
Publicado 15/10/2013 em 07:53
usuário Gullydwarf
Publicado 19/10/2013 em 19:23
usuário photosynthesis
votos
2
respostas
1
visitas
282
Como aplicar reforço de aprendizagem?
Publicado 12/11/2013 em 18:40
usuário kafke hyrule
votos
1
respostas
2
visitas
880
Q-aprendizado (múltiplos objetivos)
Publicado 14/11/2013 em 20:37
usuário user2994193
votos
2
respostas
0
visitas
516
Encog: Modelo / ator-Critic Reinforcement Learning
Publicado 19/11/2013 em 21:03
usuário Josh T
Publicado 21/12/2013 em 16:37
usuário user1638859
Publicado 15/01/2014 em 10:32
usuário Marzy
Publicado 16/02/2014 em 21:17
usuário tolgap
votos
1
respostas
1
visitas
2k
Q Aprendizagem Algoritmo Issue
Publicado 20/03/2014 em 13:11
usuário serg553
votos
1
respostas
1
visitas
245
Q-Learning: Você pode andar para trás?
Publicado 22/03/2014 em 00:17
usuário Doronz
Publicado 28/03/2014 em 19:53
usuário Simon
Publicado 02/04/2014 em 07:13
usuário OccamsMan
votos
13
respostas
2
visitas
12k
epsilon óptimo valor (ε-ávido)
Publicado 02/04/2014 em 07:39
usuário OccamsMan
votos
1
respostas
2
visitas
85
resolvendo 4 quebra-cabeça com árvore
Publicado 08/04/2014 em 10:20
usuário user3508182
votos
2
respostas
1
visitas
1k
convergência com a política óptima Q-Learning
Publicado 15/04/2014 em 07:50
usuário okkhoy
Publicado 19/04/2014 em 15:03
usuário user3149593
votos
2
respostas
1
visitas
1k
Redes Neurais e Aprendizagem Diferença Temporal
Publicado 23/04/2014 em 04:07
usuário ethnhll
Publicado 02/05/2014 em 06:08
usuário user3312235
Publicado 03/05/2014 em 05:41
usuário amauboussin
Publicado 07/05/2014 em 17:44
usuário Alvin
votos
-2
respostas
1
visitas
540
Melhor / módulo mais fácil para AI Aprendizagem?
Publicado 08/05/2014 em 00:18
usuário f.rodrigues
Publicado 09/05/2014 em 06:36
usuário Tjorriemorrie
Publicado 21/05/2014 em 05:41
usuário Tjorriemorrie
votos
0
respostas
1
visitas
231
NER NLTK: Aprendizagem Contínua
Publicado 24/06/2014 em 15:55
usuário mousecoder
votos
1
respostas
1
visitas
213
dinâmica de saída Pybrain Reinforcement Learning
Publicado 22/09/2014 em 01:34
usuário ben olsen
votos
1
respostas
1
visitas
76
simulação Matlab para funções de valor
Publicado 22/10/2014 em 07:51
usuário Heidi Cen
Publicado 25/10/2014 em 02:39
usuário Bugs Bunny
Publicado 28/10/2014 em 02:28
usuário Cerin
Publicado 19/11/2014 em 01:04
usuário centuri0n




Publicado 21/11/2014 em 08:24
usuário Omid
votos
1
respostas
0
visitas
142
Reforço aprendizagem em NetLogo
Publicado 25/11/2014 em 18:19
usuário Lindley
Publicado 04/12/2014 em 09:44
usuário dariush
votos
0
respostas
1
visitas
242
Q computação aprendizagem: afirma desconhecido
Publicado 06/12/2014 em 04:24
usuário Maximus S
votos
7
respostas
1
visitas
677
Perguntas sobre Q-Learning usando Redes Neurais
Publicado 07/12/2014 em 06:27
usuário Hamza Yerlikaya
Publicado 30/12/2014 em 16:57
usuário AlexConfused
votos
9
respostas
2
visitas
2k
Q algoritmo de aprendizagem para Tic Tac Toe
Publicado 19/01/2015 em 07:47
usuário bzkrtmurat
Publicado 22/01/2015 em 04:57
usuário Norrec
Publicado 09/02/2015 em 08:00
usuário hans-t
Publicado 09/02/2015 em 11:49
usuário hans-t
Publicado 11/02/2015 em 13:09
usuário Alex Gao
votos
1
respostas
1
visitas
74
QLearning uso em uma simulação repetitivo
Publicado 05/03/2015 em 09:00
usuário Saad Ben
Publicado 24/03/2015 em 08:26
usuário user4502591
Publicado 30/03/2015 em 23:21
usuário Karl Morrison
Publicado 31/03/2015 em 19:08
usuário Karl Morrison
votos
2
respostas
1
visitas
1k
implementação aprendendo Q-
Publicado 09/04/2015 em 10:30
usuário user2981093
votos
0
respostas
2
visitas
245
Q Aprendizagem Grade Cenário Mundial
Publicado 11/04/2015 em 04:26
usuário trivikram srinivas
Publicado 27/04/2015 em 18:25
usuário MrD
votos
1
respostas
1
visitas
719
Execução sarsa, utilizando o gradiente Discent
Publicado 30/04/2015 em 20:48
usuário MrD
Publicado 13/05/2015 em 13:49
usuário ramin zohouri
Publicado 14/06/2015 em 10:12
usuário mhbashari
Publicado 03/07/2015 em 13:00
usuário Ryan Hope
Publicado 05/07/2015 em 03:54
usuário Pokopik
Publicado 18/07/2015 em 17:42
usuário okh
Publicado 18/08/2015 em 20:03
usuário JAKJ
votos
1
respostas
0
visitas
121
Neural actualização pesos da rede sem alvo
Publicado 25/08/2015 em 11:12
usuário Hugh
Publicado 25/08/2015 em 19:10
usuário user3764449
votos
0
respostas
1
visitas
45
Qlearning e indexação de recompensa
Publicado 25/08/2015 em 23:32
usuário Snurka Bill
votos
2
respostas
2
visitas
371
codificação de bordo no do Tesauro TD-Gammon
Publicado 06/09/2015 em 19:57
usuário neurotronix
Publicado 28/09/2015 em 13:10
usuário ChiefsCreation
votos
2
respostas
3
visitas
5k
Q-Learning vs. sarsa com select Greedy
Publicado 29/09/2015 em 13:13
usuário Mouscellaneous
Publicado 08/10/2015 em 08:31
usuário igotca
Publicado 14/10/2015 em 09:18
usuário p-robot
Publicado 06/11/2015 em 16:51
usuário Christian
Publicado 09/11/2015 em 17:52
usuário S.A.Parkhid
Publicado 15/11/2015 em 21:40
usuário user47098
Publicado 28/11/2015 em 21:56
usuário Mocialov Boris
Publicado 09/12/2015 em 12:17
usuário StationaryTraveller
votos
1
respostas
0
visitas
75
Utilitários de estados em Reinforcement Learning
Publicado 10/12/2015 em 09:25
usuário fidelroha
votos
2
respostas
1
visitas
629
Rede de profunda Neural combinado com qlearning
Publicado 12/12/2015 em 21:00
usuário ORobotics
votos
6
respostas
1
visitas
242
processo descision Markov Model in Java
Publicado 18/12/2015 em 19:32
usuário bigcodeszzer
votos
7
respostas
2
visitas
4k
Aprender Python Rede Neural Reforço
Publicado 23/12/2015 em 22:09
usuário SARose
Publicado 30/12/2015 em 17:56
usuário Jonathon Byrd
Publicado 01/01/2016 em 00:59
usuário SSR
Publicado 05/01/2016 em 09:01
usuário Luke
Publicado 05/01/2016 em 15:32
usuário Aron
Publicado 21/01/2016 em 14:34
usuário Skeppet
Publicado 01/02/2016 em 20:07
usuário Aydin Mohseni
Publicado 14/02/2016 em 04:30
usuário asdf
Publicado 18/02/2016 em 11:14
usuário tamir007




Publicado 23/02/2016 em 04:14
usuário Zhenhua HAN
votos
4
respostas
3
visitas
1k
aprendizagem TD vs aprendizagem Q
Publicado 26/02/2016 em 09:29
usuário Ricky
Publicado 29/02/2016 em 21:01
usuário user1582024
Publicado 16/03/2016 em 14:32
usuário user1107703
votos
0
respostas
1
visitas
324
Q-learning com aproximação função linear
Publicado 22/03/2016 em 14:40
usuário Genesist
votos
0
respostas
2
visitas
415
Q Aprendizagem coeficientes de transbordamento
Publicado 28/03/2016 em 13:14
usuário user104981
Publicado 01/04/2016 em 19:09
usuário Mouscellaneous
Publicado 07/04/2016 em 08:56
usuário wannabe_nerd
Publicado 13/04/2016 em 20:54
usuário MrRed
Publicado 15/04/2016 em 12:49
usuário wannabe_nerd
Publicado 23/04/2016 em 14:30
usuário Samalot
Publicado 24/04/2016 em 11:14
usuário Samalot
votos
3
respostas
1
visitas
307
Grade representação Mundial para uma rede neural
Publicado 25/04/2016 em 19:20
usuário Galen
Publicado 30/04/2016 em 14:43
usuário Andnp
votos
0
respostas
1
visitas
133
De tempo contínuo MDP finito-horizon
Publicado 03/05/2016 em 00:23
usuário Falk
Publicado 04/05/2016 em 08:18
usuário wannabe_nerd
Publicado 08/05/2016 em 10:40
usuário Sudhanshu Mittal
Publicado 12/05/2016 em 14:07
usuário Anurag Priyadarshi
Publicado 21/05/2016 em 03:08
usuário user3179622
Publicado 22/05/2016 em 01:43
usuário Arslán
votos
1
respostas
1
visitas
685
selecção ação com softmax?
Publicado 23/05/2016 em 21:14
usuário Vato
votos
0
respostas
1
visitas
151
AI Player não é um bom desempenho? porque?
Publicado 24/05/2016 em 08:29
usuário Lamda
votos
0
respostas
1
visitas
80
Porque é que a Markov estado do ambiente?
Publicado 26/05/2016 em 09:33
usuário Abhishek Bhatia
Publicado 27/05/2016 em 19:19
usuário Frank He
votos
3
respostas
2
visitas
1k
valores Q-Learning ficar muito alto
Publicado 30/05/2016 em 10:24
usuário Fardin
Publicado 05/06/2016 em 04:25
usuário Dan Tang
Publicado 08/06/2016 em 18:12
usuário fabrizioM
votos
0
respostas
1
visitas
61
valor Q para o estado absorvente
Publicado 13/06/2016 em 06:16
usuário Abhishek Bhatia
votos
1
respostas
1
visitas
240
Como implementar a função valor de estado?
Publicado 14/06/2016 em 03:27
usuário joe
Publicado 19/06/2016 em 09:40
usuário Firman
Publicado 20/06/2016 em 11:28
usuário haribomensch
votos
3
respostas
1
visitas
7k
O que model.predict () e model.fit () fazer?
Publicado 22/06/2016 em 14:55
usuário Soham
Publicado 22/06/2016 em 15:00
usuário Christopher Klaus
Publicado 24/06/2016 em 07:54
usuário seequ
votos
0
respostas
1
visitas
59
aprendizado por reforço: Rede Neural
Publicado 01/07/2016 em 14:43
usuário Sridhar Thiagarajan
Publicado 06/07/2016 em 15:03
usuário Prabir
Publicado 06/07/2016 em 22:54
usuário mazecreator
Publicado 11/07/2016 em 05:10
usuário xendi
Publicado 18/07/2016 em 10:01
usuário wannabe_nerd
Publicado 25/07/2016 em 07:18
usuário Juho Sung
Publicado 31/07/2016 em 21:05
usuário mazecreator
votos
3
respostas
3
visitas
4k
Programação Reinforcement Learning Vs Dinâmico
Publicado 17/08/2016 em 04:16
usuário D_Wills
Publicado 24/08/2016 em 16:34
usuário Prabir
votos
1
respostas
1
visitas
118
Como desfazer a ação em OpenAI Gym?
Publicado 25/08/2016 em 13:02
usuário LYH
Publicado 31/08/2016 em 09:35
usuário Prashant Pandey
votos
1
respostas
1
visitas
150
Pode Q-learning algoritmo tornar overtrained?
Publicado 04/09/2016 em 11:34
usuário Sahand Rezaei
Publicado 06/09/2016 em 00:43
usuário Input Python
votos
4
respostas
2
visitas
1k
Observações significado - OpenAI Gym
Publicado 06/09/2016 em 04:43
usuário redstone
Publicado 06/09/2016 em 13:30
usuário mazecreator

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more