O SAEB é uma prova aplicada de modo censitário aos estudantes brasileiros do quinto e do nono ano do Ensino Fundamental e, também dos alunos do terceiro ano do Ensino Médio.
A prova é aplicada a cada dois anos. Os dados mais recentes são da prova de 2017. Nesta prova os alunos respondem a questões de Língua Portuguesa e de Matemática, a correção é feita utilizando a Teoria de Resposta ao Item (TRI). Juntamente com as provas os estudantes respondem a um questionário socio-econômico. Também professores e diretores de escolas respondem a um longo questionário, ao todo são 8 arquivos de dados que compõem os microdados do SAEB.
Para baixar os dados veja o site do INEP http://inep.gov.br/microdados Os microdados do SAEB vem com os arquivos com dados separados por ano de matrícula do aluno. Vamos utilizar os dados dos alunos do nono ano de Ensino Fundamental: TS_ALUNO_9EF de 2017. O arquivo é
do tipo csv e separado por “,”. O nosso objetivo é apresentar o Pandas em um exemplo concreto.
Atualize no seu Jupyter Notebook o caminho para os dados no seu caso. Vamos usar os seguintes pacotes do Python:
pandas é o pacote para Estatística.
numpy é o pacote para Matemática.
matlibplot é o pacote para plotar gráficos.
Clique aqui para visualizar o pdf do Jupyter Notebook com as minhas explorações.