A Amostra Mestra é um conjunto de unidades de áreas que são selecionadas para atender a diversas pesquisas do Sistema Integrado de Pesquisas Domiciliares do IBGE (SIPD). Essas unidades são consideradas unidades primárias de amostragem (UPAs) no planejamento amostral de cada uma das pesquisas que utilizam a Amostra Mestra, como a PNS. O plano amostral consiste na estratificação das UPAs e seleção destas unidades com probabilidade proporcional ao tamanho, dado pelo número de domicílios particulares permanentes (DPPs).
O cadastro para seleção da Amostra Mestra foi um arquivo contendo informações provenientes do Censo Demográfico 2010 sobre os setores censitários da abrangência geográfica, cujos limites são definidos na Base Operacional Geográfica de 2010, totalizando 316574 setores. Foi definida como UPA um setor ou um conjunto de setores com no mínimo 60 DPPs, à exceção de poucas unidades, por não ter sido possível agregar setores em alguns municípios.
A estratificação das UPAs obedece a quatro diferentes critérios: administrativo, contemplando a divisão da UF em capital, resto da Região Metropolitana (RM) ou Região Integrada de Desenvolvimento Econômico (RIDE), e resto da UF; geográfico, que subdivide as capitais e outros municípios de grande porte em mais estratos; de situação que envolve a categorização rural/urbano; e o estatístico com o objetivo de melhorar a precisão das estimativas.
Como integrante do SIPD, o desenho amostral da PNS seguiu, em parte, o desenho amostral da Amostra Mestra, especialmente no que diz respeito à estratificação das UPAs.
A amostra da PNS é por conglomerados em três estágios de seleção:
A PNS integrará o SIPD, o que possibilitará relacionar as informações coletadas com outras pesquisas, tais como a PNAD e a Pesquisa de Orçamentos Familiares (POF) em níveis distintos de agregação geográfica.
Para calcular o tamanho de amostra da PNS necessário para a estimação de parâmetros de interesse em níveis diferentes de desagregação geográfica, foram considerados os seguintes aspectos:
Para estimação de uma proporção p, com erro ε, confiança de 95% (z=1, 96), e efeito de plano de amostragem (EPA), o tamanho de amostra mínimo é dado por:
Na Tabela 1, apresentam-se os valores do tamanho de amostra mínimo necessário para estimar diferentes proporções, com 95% de confiança, a partir de estimativas de indicadores de interesse e do EPA, estimado, para cada variável de interesse, pelos dados do Suplemento Saúde da PNAD.
Na Tabela 2, apresentam-se os tamanhos da amostra selecionada por indicador de interesse. O tamanho total da amostra é de 79875 domicílios, e sob a suposição de uma taxa de não resposta de 20%, espera-se uma amostra de 63900 domicílios ou entrevistas individuais.
Serão consideradas perdas: domicílio fechado ou vazio; recusa dos moradores em atender o entrevistador; não conseguir entrevistar o informante, após 3 ou mais tentativas, mesmo com agendamento das visitas.
Os tamanhos de amostra esperados por Grande Região variaram de 10035 (Região Centro-Oeste) a 24610 na Região Nordeste, com número esperado de domicílios com entrevista realizada de 8028 e 19688, respectivamente (Tabela 2). Em cada desagregação geográfica de divulgação de indicadores, o tamanho de amostra será de, pelo menos, 900 domicílios.
Os tamanhos de amostra apresentados na tabela 2 são suficientes para a estimação da maioria dos indicadores de interesse por UF, com a precisão desejada. Alguns parâmetros poderão ser estimados em níveis menores de desagregação geográfica (capital, resto da região metropolitana, resto da UF).
Os tamanhos de amostra por Grande Região são, igualmente, suficientes para detectar diferenças: de 2% entre proporções da ordem de 5% a 10%; de 3% entre proporções de 10% a 30%; e de 5% entre proporções de 30% a 50%, considerando-se o nível de significância de 5% e poder do teste de 80%.
Os exames laboratoriais serão feitos em uma subamostra de 25% dos setores censitários selecionados no plano de amostragem. Para facilitar a logística da coleta de material biológico, os setores censitários foram selecionados com probabilidade inversamente proporcional à dificuldade de coleta.
Para o estabelecimento da dificuldade de coleta por meio de parâmetro numérico, foram identificados todos os municípios com 80 mil habitantes ou mais em todas as Unidades da Federação (UF).
Em cada UF, foram calculadas as distâncias entre todos os municípios com menos de 80 mil habitantes selecionados na amostra e os municípios de grande porte populacional (80000 ou mais habitantes) daquela UF, por meio das coordenadas geográficas dos centroides dos municípios.
A distância mínima foi adotada como o parâmetro numérico que mensura a dificuldade de acesso.
A seleção da subamostra de 25% dos setores censitários foi realizada pelo IBGE, com probabilidade proporcional ao tamanho, sendo este medido pelo inverso da distância mínima entre um município de pequeno porte e um município de grande porte (80 mil habitantes ou mais) da mesma UF, obedecendo à estratificação da amostra da PNS.