Procurar
Curso
09 Mar
| 10:00 am

Modelos Estatísticos com R para as Ciências Biológicas

Informação Geral

Público alvo: Estudantes de mestrado, doutoramento, investigadores.
Horário: Das 10h às 14h e das 15h às 17h
Número mínimo de inscrições: 5
Número máximo de inscrições: 25
Idioma: Inglês
Formato: Online
Pré-requisitos: Conhecimento básico da linguagem R
Os participantes do curso receberão um certificado de frequência.

Inscrições

Taxa de inscrição:

Membros do CIIMAR-LA/U.Porto (anexar comprovativo): 150€
Participantes externos: 300€

Como inscrever-se:

Inscrições: após o anúncio, até preencher as 25 vagas disponíveis.

Registo e pagamento através do link.

Descrição do curso

A primeira sessão do curso é um lembrete da regressão linear e da análise de variância, as duas técnicas estatísticas que constituem a base das estruturas mais importantes dos modelos estatísticos. Estes modelos estatísticos (GLM, GLZ e GAM) serão o conteúdo das próximas quatro sessões.
O GLM (Modelo Linear Geral) será estudado na segunda e terceira sessões. Devido à sua robustez e relativa simplicidade, este é o modelo estatístico mais utilizado. Por este motivo, no curso, dedicámos mais tempo ao GLM do que aos outros frameworks de modelação (GLZ, GAM). Através de exemplos práticos, serão explicados os seguintes tópicos: I) Pressupostos do GLM, como testá-los e como resolver problemas quando alguns desses pressupostos não são cumpridos (transformação de dados para não normalidade, ajuste alternativo por mínimos quadrados generalizados para heterocedasticidade de variância e autocorrelação residual); II) contraste de hipóteses para os efeitos principais e testes post-hoc para os efeitos simples; III) visualização das previsões do modelo.
No GLM será explicada com particular detalhe a inclusão de fatores aleatórios (modelos simples de efeitos mistos, delineamentos hierárquicos e delineamentos de declives aleatórios).
Os GLZ (Generalized Linear Models) são uma extensão do GLM para distribuições de erro que podem ser diferentes das gaussianas. Serão apresentados três exemplos práticos para diferentes distribuições (Poisson binomial e binomial negativa, para dados sobredispersos) e um exemplo simples incluindo fatores aleatórios.
O GAM é uma estrutura de modelo estatístico que pode incorporar quaisquer características de GLM e GLZ. Além disso, e considerando restrições adicionais, podem incorporar funções suavizadas (não lineares, mas não paramétricas) para descrever a relação entre a variável resposta e uma ou várias variáveis preditoras. Esta estrutura de modelo estatístico tem vindo a ganhar popularidade em diferentes campos da ciência devido ao aumento do poder computacional nos últimos 20 anos.
Recomenda-se para este curso um nível básico na linguagem R, para além de alguma familiaridade com técnicas estatísticas básicas (regressão, contraste de hipóteses, ANOVA).
O curso está aberto a todos os níveis, desde estudantes de licenciatura a investigadores seniores. É considerado a “segunda parte” de um outro curso regularmente ministrado no CIIMAR, intitulado Estatística Introdutória para Ciências Biológicas.

Objetivos do curso

– Compreender os princípios dos frameworks de modelos estatísticos para os aplicar de acordo com as características dos dados.
– Testar os pressupostos do modelo com gráficos de contraste de hipóteses e de diagnóstico, e aprender a resolver problemas associados a este processo (transformação de dados, técnicas de ajuste alternativas, distribuições alternativas de erros, utilização de ajustes não lineares ou não paramétricos).
– Compreender a diferença entre fatores aleatórios e fixos e as possíveis formas de incorporar fatores aleatórios no projeto do modelo.
– Aprender sobre os diferentes contrastes de hipóteses que podem ser realizados num modelo estatístico (análise de variância e análise de desvio para os efeitos principais, Tukey, Dunnett, diferenças menos significativas, etc. para o post-hoc).
– Aprender os métodos mais comuns para selecionar o melhor modelo de entre uma série de ajustes candidatos aos mesmos dados.

Programa do curso

Consulte o programa do curso aqui.

Formador

Aldo Barreiro Felpeto é investigador no Centro Interdisciplinar de Investigação Marinha e Ambiental (CIIMAR) da Universidade do Porto (Porto, Portugal). A sua carreira de investigação tem-se centrado na ecologia do plâncton. Defendeu a sua tese de doutoramento em 2007 no Departamento de Ecologia da Universidade de Vigo (Vigo, Espanha) sobre as interações entre o zooplâncton e as espécies fitoplanctónicas tóxicas da costa atlântica noroeste espanhola, do sul do Mar Báltico e da costa sul do Tirreno. Entre 2008 e 2010, realizou um pós-doutoramento no Departamento de Ecologia e Biologia Evolutiva da Universidade de Cornell (Ithaca, Nova Iorque, EUA). Desde 2011, é investigador no CIIMAR.
Desenvolveu uma sólida formação em estatística e modelação dinâmica com software R, tendo frequentado 10 cursos entre 2006 e 2018 e, desde 2013, organizado 14 edições de cursos sobre diferentes aspetos da estatística e programação com R, principalmente no CIIMAR, mas também na Universidade de Vigo (Espanha) e na Universidade de Magallanes (Chile). É coautor de dois livros sobre estatística e programação: Tratamiento de Datos (Ed. Díaz de Santos, Madrid, 2006) e Tratamiento de Datos con R, SPSS y ESTATISTICA (Ed. Díaz de Santos, Madrid, 2010).
Devido à sua experiência em estatística e programação, desenvolveu colaborações em diferentes áreas da ecologia, mas também das ciências ambientais e da biologia molecular. Publicou 60 artigos, com um índice h de 28 e um índice i10 de 48.