Logo PECE. Pular para página inicial
 

Ementa da Disciplina

CódigoIAD-011
DisciplinaAprendizado por Reforço
Objetivo

Aprendizado por reforço é uma área importante de aprendizado de máquina onde um agente aprende como se comportar em um ambiente realizando ações e verificando os seus resultados. A idéia por trás do aprendizado por reforço é um agente aprender por meio da sua interação com o ambiente recebendo recompensas por suas ações. Esse modo de aprendizado é utilizado quando não se tem uma resposta desejada, apenas se sabe se a resposta é boa ou não. Essa disciplina apresenta o conceito do aprendizado por reforço, como o método de recompensa funciona, as três formas básicas de aprendizado por reforço e aplicação de aprendizado por reforço com redes neurais "deep-learning".

Público_Alvo

Empresários, executivos, engenheiros, tecnólogos e outros profissionais de nível superior.

Ementa

Introdução ao aprendizado por reforço. Suas três formas de abordagem: baseado em valor, baseado em modelo e baseado em política.
Processos de decisão de Markov.
Planejamento por programação dinâmica.
Predição livre de modelo.
Controle livre de modelo.
Aproximação de função de valor.
Métodos de gradiente de políticas.
Integração de aprendizado e planejamento.
Exploração e extração.
Aprendizado por reforço usando redes neurais "deep-learning".
Estudo de caso: jogos clássicos.
Realização de atividades práticas de programação durante as aulas.

Bibliografia

Sutton, R. and Barto, A., Reinforcement Learning: An Introduction, 2a edição, 2018.
Lapan, M., Deep Reinforcement Learning Hands-On, Packt, 2018.
Ramsundar, B. and Zadeh, R. B., TensorFlow for Deep Learning: From Linear Regression to Reinforcement Learning, O'Reilly, 2018.

Duração (h)30
Título Escolha
Imagem do selo de Garantia de Qualidade POLI
Centro de Apoio ao Aluno: atendimento@pecepoli.com.br
Telefone: (11) 2998-0000 Fax: (11)2998-0054
Segunda a sexta-feira das 9h00 às 21h00.
Logo da USP - link externo ©Copyright 2010 PECE - Todos direitos reservados. Logo da Escola Politécnica - link externo