Aprendizagem por reforço

ebook Dominando a tomada de decisão inteligente para máquinas autônomas · Ciência Da Robótica [Portuguese]

By Fouad Sabry

cover image of Aprendizagem por reforço

Sign up to save your library

With an OverDrive account, you can save your favorite libraries for at-a-glance information about availability. Find out more about OverDrive accounts.

   Not today

Find this title in Libby, the library reading app by OverDrive.

Download Libby on the App Store Download Libby on Google Play

Search for a digital library with this title

Title found at these libraries:

Library Name Distance
Loading...

No campo em rápida evolução da robótica, o aprendizado por reforço se destaca como um dos métodos mais promissores para a construção de sistemas autônomos. Este livro, Reinforcement Learning, fornece uma exploração aprofundada dessa técnica poderosa, guiando os leitores por seus princípios fundamentais até seus últimos avanços. Perfeito para profissionais, estudantes de pós-graduação e entusiastas, este livro oferece uma abordagem detalhada, porém acessível, para entender o aprendizado por reforço no contexto da robótica.

Visão geral resumida dos capítulos:

1: Aprendizado por reforço: apresenta o conceito central do aprendizado por reforço, enfatizando seu papel em sistemas autônomos

2: Processo de decisão de Markov: explica a estrutura matemática para tomada de decisão sob incerteza, uma base fundamental para o aprendizado por reforço

3: Aprendizado por diferença temporal: explora métodos para aprender com a experiência sem precisar de um modelo do ambiente

4: Equação de Bellman: discute o relacionamento recursivo crítico que fundamenta muitos algoritmos de aprendizado por reforço

5: Qlearning: concentra-se em um algoritmo de aprendizado por reforço offpolicy que aprende ações ideais sem um modelo do ambiente

6: Multiarmed bandit: Abrange um problema de aprendizado por reforço mais simples que modela a tomada de decisões em ambientes incertos

7: Processo de decisão de Markov parcialmente observável: Expande os processos de decisão de Markov tradicionais incorporando estados ocultos

8: Índice de Gittins: Apresenta uma estratégia para equilibrar exploração e exploração em problemas de multiarmed bandit

9: Estado–ação–recompensa–estado–ação: Investiga os padrões temporais no aprendizado por reforço que informam estratégias de tomada de decisões

10: Função de protovalor: Explora métodos para aproximar funções de valor, auxiliando na eficiência do aprendizado

11: Construção automática de função de base: Foca em métodos automáticos para construir recursos para melhorar a eficiência do aprendizado

12: Teoria dos jogos de Meanfield: Discute uma estrutura para modelar interações em sistemas multiagentes em larga escala

13: Pathfinding multiagente: Apresenta algoritmos para coordenar vários agentes para atingir seus destinos de forma eficiente

14: Modelfree (aprendizagem por reforço): Discute métodos que não dependem de um modelo do ambiente para aprendizagem

15: Aprendizagem por reforço profunda: Combina aprendizagem profunda e aprendizagem por reforço para lidar com ambientes complexos e de alta dimensão

16: Aprendizagem por reforço multiagente: Foca em estratégias para aprendizagem em ambientes com múltiplos agentes interagindo

17: Selfplay: Explora o conceito de agentes aprendendo por meio da competição consigo mesmos, um componente crítico de estratégias de aprendizagem avançadas

18: Otimização de política proximal: Apresenta um algoritmo para otimizar políticas em aprendizagem por reforço com estabilidade e desempenho aprimorados

19: Explorationexploitation dilemma: Discute o desafio fundamental de equilibrar a exploração de novas estratégias com a exploração de estratégias conhecidas

20: Aprendizagem por reforço a partir de feedback humano: Examina métodos para melhorar a aprendizagem por reforço usando entrada humana

21: Aprendizagem por imitação: Foca em técnicas em que os agentes aprendem imitando as ações de especialistas humanos

Reinforcement Learning não é apenas um guia técnico, mas um recurso essencial para entender como sistemas autônomos podem se adaptar e tomar decisões em uma ampla gama de ambientes. Seja...

Aprendizagem por reforço