TENHO INTERESSE - MBA
MBA-USP – Data Science and Analytics

Pacman


Dúvidas?
Para maiores informações, por favor, entrar em contato com a nossa Central de Apoio ao Aluno:
Atendimento online : de segunda-feira à sexta-feira, das 08h30 às 20h00.
E-mail: atendimento@pecepoli.com.br

MBA-USP – Data Science and Analytics

Colocar texto de descrição curta

• Campus
PECE/POLI/USP
• Carga Horária
543h
• Duração
24 meses
• 3ª e 5ª feiras
19h30 - 22h30

Conteúdo

Estrutura curricular

METODOLOGIA DE APRENDIZAGEM
(Programas de Estudos)

Este Curso é planejado para ser desenvolvido em sala de aula/laboratório com atividades presenciais, e em atividades não-presenciais, colaborativas, extraclasse para que os seus participantes possam adquirir capacitação suficiente ao lidar com grandes volumes de dados e informações, e suas inerentes explosões combinatórias, dentro dos domínios de conhecimento da nova e emergente Ciência e Analises de Dados (Data Science and Data Analitcs). Todas as disciplinas são feitas utilizando o método Sillabus.
A metodologia é baseada em solução de problemas, IPBL-Interdisciplinary Problem Based Learning.

Também trabalharemos, em paralelo com o compromisso “AOL” Assurance of Leaening da AACSB – Association for Advance Collegiate Schools of Business.

As disciplinas se desenvolverão por meio de aulas, conceitos fundamentais, apresentação de casos reais, exercícios de aplicação individuais; e, em grupo. Os alunos deverão entregar exercícios aplicando os conceitos apresentados.

No início da disciplina, os alunos deverão formar grupos e escolher uma empresa ou problema para construir um plano de inovação aplicando os conceitos e ferramentas como value stream mapping, customer journey e value proposition. Os grupos deverão identificar problemas reais que configuram oportunidades de inovação, formular hipóteses para sua resolução.

Capstone Projects

São projetos interdisciplinares semestrais como objetivo de incentivar os alunos a apresentarem, em curto espaço de tempo, de forma consolidada, e em diferentes domínios do conhecimento, aquisições de aprendizados desenvolvimento de habilidades de investigação desenvolvimento de aplicações de produtos finais e criações de solução conclusivas e agregadoras de valor há produtos inovadores ou existentes.

Cada aluno deve trazer o seu Lap -Top.

Assista ao vídeo.

Duração

A carga horária conjunta das duas atividades será de 543 horas aula, composta por 483 horas de disciplinas e 60 horas de atribuídas à monografia. A duração total prevista do curso é de dois anos (24 meses).

Ementas das Disciplinas

Introdução a Banco de Dados (BD), Conceitos de BD e histórico, Modelos de BD, BD Modelo.

Relacional, SQL básico, NoSQL.

Linguagem R.

Data Types, Subsetting, Vectorization, Reading and Writing Data, Control Structures, Functions,   

(lapply, apply, tapply), Debugging, Charts (base graphics, lattice), Machine Learning packages for R,   

Linguagem Python, Language basics, IPython / Anaconda, NumPy, ScyPy, pandas, scikit-learn,   

matplotlib.


Matemática/Cálculo.

Teoria dos conjuntos.

Números reais.

Funções reais.

Polinômios.

logaritmos.

exponenciais e funções trigonométricas.

Gráficos de funções.

Derivadas. Introdução a Integrais.

Máximos e mínimos de funções contínuas.

Álgebra Linear.

Espaços vitoriais.

combinações lineares.

Produto interno e produto vetorial.

Dependência linear.

Matrizes.

determinantes.

Equações de retas e planos.

Transformações lineares e bases.

Ortogonalidade.

Autovalores e autovetores.

Introdução à Lógica Proposicional.

Revisão de Análise Combinatória.

Python.

Configuração de ambiente de trabalho para programação (instalação dos programas usados e como trabalhar em IDE - Integrated Development Environment).

Tipos de variáveis.

Sintaxe básica.

Operadores e estruturas de decisão.

Funções mais comuns.

Manipulação de dados (pandas, numpy e scipy).

Interação do Python com a web.

Interação com bancos de dados SQL.

Visualização. 

"R"

Tipos de objetos.

Sintaxe básicas.

Estruturas de decisão.

Funções estatísticas mais comuns.

Visualização de dados.


Introdução.

histórico e importância.

Fatores humanos e percepção.

Princípios de design de informação visual.

Conceitos de Computação Gráfica e Imagem.

Formas de visualização, para: Dados tabulares.

multidimensionais e estatísticos.

Hierarquias e árvores.

Grafos e redes.

Textos e documentos.

Dados georreferenciados e temporais.

Explicações.

animações e causalidade.

Técnicas de visualização interativas, para: Visão geral e detalhe.

Projeções de alta dimensão.

ícones.

Navegação e zoom.

Seleção e Brushing.

Linking.

Manipulação.

Mapeamento de legenda e estilos.

Avaliação da visualização.

Laboratórios práticos.

Visualização espacial de dados utilizando Google.

Maps e ArcGIS Online.

Criação de produtos de dados (data products) utilizando Tableau Desktop e Server.

Criação de produtos de dados utilizando R and Shiny.

Introdução a Aprendizado de Máquinas e Reconhecimento de Padrões.

Teoria de probabilidade.

Teoria da decisão.

Distribuições de Probabilidade.

Variáveis binárias e multinomiais.

Distribuições Gaussianas.

Família das distribuições exponenciais.

Modelos Lineares para Regressão,

Modelos lineares de funções básicas.

Regressão Bayesiano linear.

Modelos Lineares para Classificação.

Funções discriminantes.

Modelos generativos probabilísticos.

Modelos discriminativos probabilísticos.

Máquinas de Sparse Kernel.

Vector Machines (SVM).

Relevance Vector Machines (RVM).

Gráficos.

Redes Bayesianas.

Markov Random Fields (MRF).

Inferência em modelos gráficos.

Inferência Aproximada.

Métodos Monte Carlo.

Métodos Variacionais.

Variáveis Latentes Contínuos.

Análise dos componentes principais (PCA), PCA probabilísticos.

Modelos de Dados Sequenciais.

Utilização integrada do conteúdo apresentado nas disciplinas do Curso.

Entrega de incrementos funcionais relativos ao 1º semestre.

Customização do conteúdo de um produto a ser entregue pelos alunos ao término do semestre.

Conhecer o ciclo de vida dos dados.

as funções necessárias e as métricas fundamentais.

Principais funções nas equipes de Analytics.

Definir um plano que permita conhecer os mecanismos mais efetivos para utilizar a informação e tomar decisões de negócio, diante de diferentes problemáticas. Ciclo de vida dos dados e fluxo de trabalho em Data Analytics.

Funções e habilidades necessárias em uma equipe de Data Analytics.

Cultura de dados.

qualidade dos dados.

tipos de dados.

Digital Analytics.

introdução.

aplicabilidade.

frameworks e habilidades necessárias.

Google Analytics: Apresentação das funcionalidades básicas da ferramenta.

Business Metrics: KPI x KSI. Necessidades de informação das partes envolvidas interna e externamente.

Estatística: Definições estatísticas básicas.

Tipos de variáveis.

População.

Amostra.

Parâmetro.

Estimativa.

Matriz de dados.

Índices.

Escalas e indicadores estatísticos.

Atribuição de pontos em escalas.

Validade de índices.

Principais indicadores estatísticos..

Indicadores eleitorais.

Educacionais, sócio-demográficos.

Tipologias.

Produção de questionários e definição de amostras;

O que é um survey.

Tipos de surveys.

Estrutura do questionário.

Pré-teste.

Produção de questionário de opinião pública.

Pesquisa quantitativa em fontes primárias meios digitais.

Medidas de tendência central e variabilidade.

Médias, mediana, moda; Medidas de posição.

Coeficiente de variação.

Medidas de assimetria ou curtose.

Coeficientes de correlação.

Coeficientes de determinação.

Coeficientes de alienação.

Conceito de probabilidade.

Intervalo de confiança.

Hipóteses estatísticas.

Nível de significância.

Provas de independência.

Análise de variância.

Comparações múltiplas.


Definição da decisão e tipos de decisão.

Análise de cenários.

Atores da decisão.

Vozes dos acionistas.

Funcionários e outros.

Tautologia.

Contradição e contingência.

Condições de decisão e tipos de problemas.

Técnicas e modelos para tomada de decisão.

Relações intergrupais.

Interorganizacionais e interculturais Escolha entre conflito e cooperação Métodos de cooperação intergrupal.

Cooperação intergrupal entre culturas internacionais e regionais.

Silogismo.

Argumento.

Validade de um argumento (através da tabela-verdade).    

Otimização não linear.

Redes neurais.

Otimização e incerteza.

Rogramação linear.

Simulação de Monte Carlo.

Análise de desempenho comparado (DEA).

Redes neurais.

Sistemas dinâmicos.

Otimização não linear.

Comparação de métodos evolutivos x algoritmos de início múltiplo.

Bootstrapping.

Aplicações: lançamento de novos produtos.

Evolução de market-share.

Gestão de incerteza.

Otimização.

Método neutro em relação ao risco.

Fórmula de Black-Scholes.

Precificação por simulação de Monte Carlo.

Precificação pelo método binomial.

Opção de organização de cenários futuros.

Utilização integrada do conteúdo apresentado nas disciplinas do curso, no segundo semestre.

Entrega de incrementos funcionais, a cada período.

Produção e customização do conteúdo de um produto a ser entregue pelos alunos ao término do semestre.

Armazenamento de large-scale collections.

Teoria e prática na recuperação de informações em ambiente de Big Data.

Extração de dados.

Sua transformação e seu carregamento de data warehouses.

Métodos tradicionais de recuperação de informação.

Gerenciamento de banco de dados.

Gerenciamento de dados complexos.

Dados multimídia.

Dados geográficos.

Dados temporais.

Computação paralela massiva usando MapReduce/Hadoop.

Obtendo e "limpando" dados.

Arquitetura de Data warehouse.

Arquitetura de Cloud computing.

Inserção de dados.    

Introdução ao Big Data.

Componentes de Big Data.

Introdução ao Hadoop.

Aplicações de Hadoop e HDFS.

Framework Hadoop MapReduce.

Componentes do Hadoop.

Introdução ao Spark.

Bases de dados distribuídas resilientes.

Programação de Aplicações em Spark.

Configuração.

Monitoramento e Ajustes em Ambientes Spark.


Gestão de mídias sociais.

O analista de mídias sociais.

Planejamento das mídias sociais.

Netnografia e o comportamento do consumidor nas mídias sociais.

Monitoramento das mídias sociais.

Planejamento e gestão de web marketing.

Gestão de conteúdo.

Arquitetura da informação para mídias sociais.

Inovação e Empreendedorismo digital.

Análise de métricas.

Otimização de sites.

SEO (Search Engine Optimization).

Google Analytics.Facebook marketing.

Segurança da informação.

Privacidade na rede.

comportamental.

Como utilizar/minerar as Redes Sociais.

Algoritmos e Prática de Análise de Redes Sociais.

Extração de dados de redes sociais em tempo real utilizando APIs como Twitter, Facebook and LinkedIn.

Análise de Sentimentos.

Detecção de Comunidades.

Análise de Vínculos/Grafos (Link/Graph Analysis).

PageRank.

Hubs and Authorities.

SPARQL and Relational Algebra for Graph Query.

Visualização de grafos de redes sociais - Gephy.

Introdução à Inteligência Artificial (IA).

Conceitos.

Evolução histórica.

Aplicações e perspectivas.

Métodos de busca:

Busca cega.

Busca heurística.

Busca competitiva.

Representação do conhecimento.

Formalismos de representação do conhecimento.

Sistemas baseados em conhecimento.

Paradigmas de programação: Lógico. Funcional. Aprendizado supervisionado.

Aprendizado não-supervisionado.

Aplicações de IA.

Processamento de linguagens naturais.

Jogos.

Robótica.

Mineração de Dados.

Problemas.

dados.

Ferramentas.

Overfitting.

Complexidade.

Treinamento.

Validação de dados de teste.

Problemas de classificação.

Fronteiras de decisão.

Métodos de vizinhos mais próximos.

Probabilidade e classificação 6.

Naïve Bayes.

Distribuições.

Classificadores lineares.

Redução de Dimensionalidade.

PCA e LDA.

Algoritmos evolucionários.

Redes neurais.

Métodos de ensemble: bagging e boosting Validação e comparação de algoritmos.

Validaçãoao cruzada.

Testes de Wilcoxon e Friedman.

Correçãoao de Bonferroni-Dunn.

Aprendizado não supervisionado.

clustering, k-médias.

Representações textuais e modelos multinomiais.

Clustering e espaçoos latentes.

Dimenção VC.

Minimização do risco.

Métodos de classificação baseados em margens.

Support Vector Machines para uma, duas ou mais classes.

Utilização integrada do conteúdo apresentado nas disciplinas do curso, no segundo semestre.

Entrega de incrementos funcionais, a cada período.

Produção e customização do conteúdo de um produto a ser entregue pelos alunos ao término do semestre.

Governança, Risco e Compliance Estruturas e Modelos de Governança Padrões e Regulamentações (ISO 38500, ISO 15504, ISO27001, ISO 27002, ISO 27014, COBIT 5, BACEN 4.658 e PCI-DSS) Estrutura e papéis de uma área de Cibersegurança Ferramentas de apoio à Governança Natureza Bimodal da Gestão dos Negócios e da TI Sourcing de Serviços de Segurança da Informação OPBOK - Outsourcing Professional Body of Knowledge RFP - Processo, Estrutura, Seleção, Negociação e Contratação de Serviços SI. Marcos regulatórios no Brasil e no mundo. Investigação dos Crimes eletrônicos no ambiente corporativo (interceptação de dados, ata notarial, ransomware e concorrência desleal) Responsabilidades civil, criminal e trabalhista Regulamentos Internos em Cibersegurança Privacidade e Proteção de Dados (GDPR e LDPD) Direito em Inteligência Artificial e IoT. Uso de Inteligencia Artificial aplicada a segurança, Regulamentação das Moedas eletrônicas e blockchain.

Critério Geral de Aprovação e obtenção de certificado USP

Para ser considerado aprovado no Curso “MBA-USP – Data Science and Analytics”, e ter direito ao respectivo Certificado de Conclusão, o participante deverá satisfazer todos os seguintes requisitos:

  • ter frequência igual ou superior a 75% (setenta e cinco por cento) em cada uma das disciplinas e atividades;
  • obter nota final igual ou superior a 7,0 (sete) em cada uma das disciplinas. A avaliação em cada disciplina será feita de acordo com o critério previamente estabelecido em cada uma delas, envolvendo provas, trabalhos, etc.;
  • ter se inscrito e realizado na atividade Monografia devendo obter nota final igual ou superior a 7,0 (sete), em avaliação realizada por banca examinadora.
Oferecimento e realização das disciplinas

As disciplinas serão oferecidas nos ciclos do PECE, a critério deste.

Para cada hora de aula são necessárias uma a três horas de dedicação individual do aluno.

ATENÇÃO! - O Programa de Educação Continuada da Escola Politécnica da Universidade de São Paulo (PECE/EPUSP) reserva-se o direito de não realizar este curso, ou modificar sua data.

Nos últimos anos, vêm se observando que a quantidade de dados gerados diariamente por sistemas computadorizados tem aumentado, de forma exponencial, ocasionando novos problemas relacionados com processamento e manutenção de grandes volumes de dados e suas respectivas análises heurísticas. Grande parte desses dados não se encontram organizados em bancos de dados e advém de mídias sociais, e-mails, blogs, websites, dispositivos móveis, entre outras fontes. Outro fator preocupante tem sido o incremento de acessos indevidos e fraudes em transações computadorizadas, principalmente, envolvendo sistemas de controle de acesso onde atividades fraudulentas vêm representando custos adicionais anuais que, em muitas atividades, podem chegar até a bilhões de dólares. A partir do advento da Internet e do desenvolvimento incremental das Tecnologias da Informação (TI), as atividades fraudulentas passaram também a crescer e se diversificar de maneira mais acentuada nos últimos anos e em quase todas as áreas de conhecimento. Nesse contexto, surgem também muitos desafios e questões ainda não resolvidas, destacando-se, entre outras: Como se lidar com grandes volumes de dados? Como armazenar esses grandes volumes de dados de forma tal que se consiga, rapidamente, obter informações úteis para tomadas de decisão? Como se trabalhar com diversidades de dados?. Big Data (Grandes Volumes de Dados) é um termo recentemente criado para referenciar grandes quantidades de dados gerados periodicamente. Data Science (Ciência de Dados) representa uma nova Ciência recentemente referenciada para possibilitar o estudo, a investigação e a análise de grandes conjuntos de dados organizados ou não, estruturados ou não, com o objetivo de identificar padrões, perfis e agrupamentos (clusterings) de dados para propiciar tomadas de decisão cada vez mais ágeis e rápidas e aplicar resultados de análises em ações que impactam diretamente na eficiência de negócios em empresas e/ou instituições privadas ou públicas. Grandes volumes de dados necessitam ser devidamente analisados e interpretados. Em muitos casos, resultados dessas análises necessitam ser imediatamente utilizados para prevenir acessos indevidos e evitar fraudes e riscos. Dentro desse contexto, torna-se relevante e justificável a concepção e o desenvolvimento de um Programa de Especialização em Data Science Este Projeto tem por objetivo propiciar um conjunto mínimo, necessário e suficiente de conhecimentos e capacitações especializadas e interdisciplinares, visando melhor preparar e aperfeiçoar profissionais para trabalhar com o novo, emergente e desafiador domínio de conhecimento de Big Data. Acredita-se que novas Pesquisas e Desenvolvimentos (P&D) advindos deste Programa poderão ser também utilizados em diversas áreas do setor Industrial e de Serviços brasileiros. Acessos indevidos e fraudes envolvendo, por exemplo, cartões de acesso ou de crédito podem ocasionar prejuízos significativos tanto para empresas privadas ou públicas, como para pessoas físicas ou jurídicas como, por exemplo, cancelamentos de contratos e até mesmo desfalques incalculáveis para empresas e instituições envolvidas.

Objetivo

Por envolver atividades acadêmicas de conteúdo inovador, utilizando métodos ágeis e suas boas práticas, bem como diversas tecnologias que representam o “estado da arte, o estado da prática e o estado da técnica, pretende-se habilitar o participante a lidar com Pesquisa e Desenvolvimento em Ciência de Dados (Data Science), Estatística e Matemática envolvendo áreas de: Bancos de Dados (Data Base); Grandes Volumes de Dados (Big Data); Mineração de Dados (Data Mining); Análise de Dados (Data Analytics); Aprendizado de Máquina (Machine Learning); Aprendizado Profundo (Deep Learning); Reconhecimento de Padrões (Pattern Recognition); Computação em Nuvem (Cloud Computing); Protocolos de Cadeias de Blocos (Blockchains); Redes de Informação (Information Networks); Redes Sociais (Social Networks); Segurança de Dados (Data Security); Segurança Cibernética (Cyber Security); Métodos Ágeis (Agile Methods); entre outras Tecnologias de Inteligência Artificial (Artificial Intelligence), Tecnologias da Informação (Information Technologies), Tecnologias Fundamentais e Avançadas de Estatística.

Público alvo

Profissionais que desejem transformar dados em informação e conhecimento estratégico. Executivos, gestores, analistas, especialistas e consultores que atuem em setores de informação intensiva.

Local & horário realização do curso

As aulas serão realizadas na Escola Politécnica da Universidade de São Paulo, às terças e quintas-feiras, das 19:30 às 22:30.

É possível que as primeiras disciplinas sejam realizadas na modalidade a distância, forma síncrona, enquanto perdurarem as restrições de acesso ao espaço físico da USP – Universidade de São Paulo, devido a pandemia Nova COVID-19.

ATENÇÃO! - O Programa de Educação Continuada da Escola Politécnica da Universidade de São Paulo (PECE/EPUSP) reserva-se o direito de não realizar este curso, ou modificar sua data.

Coordenado pelo Prof. Dr. Giorgio Francesco Cesare de Tomi, o curso reúne, em seu corpo docente, professores da Escola Politécnica e especialistas convidados, entre eles:

• Almir Meira Alves
• Antonio Geraldo da Rocha Vidal
• Antonio Rafael Namur Muscat
• Carla Bonato Marcolin
• Cesar Alexandre de Souza
• Daniel Reed Bergmann
• Denise Aparecida Botter
• Edison Spina
• Evandro Marcos Saidel Ribeiro
• Fábio Silva Lopes
• Giancarlo da Silva Rego Pereira
• Giorgio Francesco Cesare de Tomi
• Leandro Augusto da Silva
• Marcel Jacques Simonette
• Rodrigo Franco Gonçalves

ATENÇÃO! - O Programa de Educação Continuada da Escola Politécnica da Universidade de São Paulo (PECE/EPUSP) reserva-se o direito de não realizar este curso, ou modificar sua data.

Certificação USP


Para que o aluno conquiste o certificado do curso de MBA-USP – Data Science and Analytics, emitido oficialmente pela Universidade de São Paulo, deverá ser aprovado em todas as disciplinas exigidas pelo programa do curso, com nota mínima de 7,0 e presença acima ou igual a 75%, assim como a aprovação da sua monografia pela banca examinadora.

Certificado USP

Processo de inscrição

Para realizar a inscrição e participar do Processo Seletivo o candidato deverá proceder da seguinte forma:

PRÉ-REQUISITOS

Espera-se dos candidatos, sólida formação superior, conhecimentos básicos de inglês e experiência profissional.

PAGAMENTO

Efetue o pagamento da taxa de inscrição no valor de R$ 150,00 (Cento e cinquenta reais), por meio de boleto bancário, enviado automaticamente para o e-mail cadastrado.

SELEÇÃO

A seleção será feita com base nas informações fornecidas pelo interessado na “Ficha de Inscrição”. Caso o interessado seja aprovado, receberá e-mail do Centro de Apoio ao Aluno, com instruções para efetivar sua matrícula.

Só será possível participar do processo seletivo, após a confirmação do pagamento da taxa de inscrição.

ATENÇÃO! - O Programa de Educação Continuada da Escola Politécnica da Universidade de São Paulo - PECE/EPUSP reserva-se o direito de não realizar este curso, ou modificar sua data.

Estrutura
de qualidade

Histórias de Sucesso

Torne-se um líder produtivo no mercado.

Logo PECE - Escola Politécnica da USP

PROMOÇÃO "INDIQUE UM ALUNO"


Para incentivo ao estudo e desenvolvimento das atividades de extensão, bem como criar uma oportunidade de benefício e estímulo para os nossos alunos, a Coordenação informa que está vigente a Promoção para bonificação de 1 (uma) mensalidade ao aluno, para cada indicação de candidato que realize matricula em nova edição do referido MBA.

O benefício da bonificação segue às seguintes condições:

  1. O aluno deverá solicitar ao candidato que coloque, expressamente, o seu nome completo, como indicante, no campo “Pesquisa - Outros” na Ficha de Inscrição;
  2. O crédito de bonificação ocorrerá no prazo de 30 (trinta) dias após a efetivação da matrícula do candidato indicado;
  3. Não serão computadas as matrículas canceladas em que o valor da primeira mensalidade tenha sido devolvido pela FUSP ao aluno indicado;
  4. A quantidade de mensalidades abonadas será limitada ao número de mensalidades pendentes do aluno indicante, e não será possível a criação, ou repasse, de nenhum tipo de crédito por indicação superior a esse limite.

Logo PECE - Escola Politécnica da USP

PROMOÇÃO "20%"


Para incentivo ao estudo e desenvolvimento das atividades de extensão, bem como criar uma oportunidade de benefício e estímulo para os nossos alunos, a Coordenação informa que está vigente a Promoção 20% para concessão de desconto, máximo, de 20% (vinte por cento) sobre o valor do curso, não cumulativo com esta ou outras promoções, para aluno e candidato por ele indicado, que se matriculem na mesma turma do curso.

O benefício segue às seguintes condições:

  1. O aluno deverá solicitar ao candidato que coloque, expressamente, o seu nome completo, como indicante, no campo “Pesquisa - Outros” na Ficha de Inscrição;
  2. A concessão do benefício de desconto de 20% ocorrerá no prazo de 30 (trinta) dias após a efetivação das matrículas de ambos os alunos, indicante e indicado;
  3. No ato da matrícula, ambos pagarão a primeira parcela do curso no valor nominal sem desconto. O valor correspondente ao desconto dessa primeira parcela será compensado na segunda parcela mensal;
  4. O benefício da Promoção 20% não se efetivará para nenhum dos beneficiários, se o valor da primeira parcela tenha sido devolvido pela FUSP a quaisquer destes beneficiários por cancelamento de matrícula.