Pular para o conteúdo
Fonoaudióloga Ana Nascimento - Desenvolvimento Infantil em Jaraguá do Sul
🗓️

Desenvolvimento da fala

Marcos do Desenvolvimento da Fala por Idade — Guia Completo

Dra. Ana Lígia Nascimento · Fonoaudióloga · CRFa 3-11244
Publicado em 14 de maio de 2026 · Atualizado em 04 de julho de 2026

Guia completo dos marcos da fala de 0 a 6 anos, sinais de alerta por faixa etária e quando procurar avaliação fonoaudiológica.

Dra. Ana Nascimento · CRFa 3-11244·14 mai 2026· Atualizado em 04 de julho de 2026·16 min de leitura
TL;DR

Resposta rápida

  • A fala se desenvolve em janelas, não em pontos exatos: cada criança tem o seu ritmo, dentro de uma faixa esperada.
  • Os marcos abaixo seguem as recomendações da Sociedade Brasileira de Pediatria (SBP), da ASHA e do CDC — todas com consenso amplo.
  • As trocas de sons seguem uma ordem previsível: o "rr" de "carro" é um dos últimos a chegar, esperado até os 6 anos.
  • Sinal universal de alerta em qualquer idade: regressão (perder o que já fazia).
  • Diante de dúvida, uma avaliação fonoaudiológica é o caminho mais curto para clareza.

Os marcos mais citados são: 10 a 20 palavras aos 18 meses, 50 palavras e as primeiras combinações de duas palavras aos 2 anos, e a família entendendo pelo menos 75% do que a criança fala aos 3 anos — regressão (perder o que já tinha) é sinal de alerta em qualquer idade. Esses números são bússola, não cronômetro: cada criança tem o seu ritmo dentro da faixa esperada, e o que mais importa é a trajetória, não um dia exato no calendário. Abaixo, o guia completo por faixa etária, do nascimento aos 6 anos, a partir das principais referências (SBP, ASHA, CDC).

Antes de começar, uma distinção importante: fala e linguagem não são a mesma coisa. Fala é a produção motora dos sons. Linguagem é o sistema — vocabulário, gramática, compreensão e intenção. Este guia foca na fala, mas inclui marcos de linguagem onde eles ajudam a interpretar o desenvolvimento global — separando, quando útil, o que a criança entende (linguagem receptiva) do que ela produz (linguagem expressiva).

0 a 6 meses — os primeiros sons

Nessa fase, o bebê ainda não fala — mas já está construindo a base que sustentará toda a fala posterior.

O que esperar:

  • Reage a sons altos com sobressalto, mudança de expressão ou interrupção da atividade
  • Acalma-se ao ouvir a voz dos cuidadores
  • Produz arrulhos, vocalizações vocálicas ("aaa", "uuu") por volta dos 2–3 meses
  • Sorri socialmente a partir dos 2 meses
  • Começa a balbuciar (sons consonantais) por volta dos 4–6 meses

Sinais de alerta:

  • Não reage a sons no ambiente (importante descartar perda auditiva)
  • Ausência de sorriso social aos 3 meses
  • Não emite nenhum som vocálico aos 4 meses

A SBP recomenda que a triagem auditiva neonatal (Teste da Orelhinha) seja realizada em todo recém-nascido até o primeiro mês de vida, e que toda criança seja reavaliada caso surjam dúvidas posteriores.

6 a 12 meses — o balbucio se organiza

A partir dos 6 meses entra em cena o balbucio reduplicado ("bababa", "mamama", "dadada"), que evolui ao longo do semestre até as primeiras tentativas de palavra.

O que esperar:

  • Balbucio variado e reduplicado ("baba", "dada", "mama")
  • Responde ao próprio nome (a partir dos 7–9 meses)
  • Imita sons e expressões faciais
  • Aos 9–12 meses: aparece o apontar protodeclarativo (apontar para mostrar interesse, não só para pedir)
  • Primeira palavra reconhecível pode surgir entre os 10 e 14 meses

Sinais de alerta:

  • Ausência de balbucio aos 9 meses
  • Não responde ao próprio nome aos 12 meses (após descartar perda auditiva)
  • Ausência de gestos comunicativos (apontar, tchau, dar) aos 12 meses
  • Ausência de contato visual em situações de interação

A ausência combinada de balbucio, apontar e contato visual aos 12 meses é um dos marcadores precoces de transtornos do neurodesenvolvimento — incluindo TEA — e merece avaliação especializada, conforme orienta a Sociedade Brasileira de Pediatria.

1 a 2 anos — a explosão de palavras

Essa é a faixa de maior aceleração no vocabulário. A criança sai de poucas palavras e chega aos 2 anos com 50 ou mais, combinando duas em frases simples.

O que esperar:

  • 12 a 18 meses: 10 a 20 palavras, ainda foneticamente imprecisas
  • 18 a 24 meses: vocabulário de 50 ou mais palavras
  • Início das combinações de duas palavras ("quer água", "papai veio") por volta dos 18–24 meses
  • Entre 12 e 18 meses, é comum surgir o jargão expressivo — sequências de sons com entonação de frase, mas sem palavras reais, como se a criança "falasse" fluentemente sem dizer nada reconhecível; é sinal positivo de intenção comunicativa, na mesma linha do apontar protodeclarativo (apontar por volta dos 12 meses para compartilhar interesse, não só para pedir) que já apareceu no fim do primeiro ano
  • Compreensão sempre à frente da expressão: a criança entende mais do que produz
  • Inteligibilidade para a família: cerca de 50% aos 2 anos
  • Aponta para partes do corpo, segue ordens simples ("pega a bola")

Sinais de alerta:

  • Aos 18 meses: vocabulário menor que 10 palavras
  • Aos 24 meses: ausência de combinação de duas palavras, ou vocabulário menor que 50 palavras
  • Aos 24 meses: ausência de imitação de palavras
  • Regressão — perder palavras já adquiridas — em qualquer momento

A literatura sobre late talkers (falantes tardios) — crianças entre 18 e 30 meses com vocabulário expressivo abaixo do esperado — sugere que parte delas evolui espontaneamente, mas uma proporção significativa mantém dificuldades. Por isso a ASHA recomenda que crianças com sinais aos 24 meses sejam avaliadas, mesmo que a conduta inicial seja de monitoramento.

2 a 3 anos — frases curtas e muitas trocas

Aos 2–3 anos a criança constrói frases de 2 a 4 palavras, faz perguntas e amplia o vocabulário rapidamente — mas a inteligibilidade ainda é parcial para estranhos, e trocas de sons fazem parte do quadro normal.

O que esperar:

  • Frases de 2 a 4 palavras
  • Vocabulário expressivo de 200 a 1000 palavras ao longo da faixa
  • Começa a fazer perguntas com "o quê?" e "cadê?"
  • Compreende ordens com 2 a 3 passos
  • Inteligibilidade: ~75% para a família, ~50% para estranhos
  • Trocas e omissões de sons são esperadas — "papato" por sapato, "cadu" por carro

Sinais de alerta:

  • Aos 3 anos: não formula frases de 3 palavras
  • Aos 3 anos: a família entende menos de 75% do que a criança fala
  • Não responde a perguntas simples
  • Ecolalia imediata e persistente como única forma de comunicação
  • Regressão de vocabulário ou de uso comunicativo

3 a 4 anos — fluência e gramática crescem

Aos 3–4 anos a criança já constrói histórias curtas, usa frases mais longas e domina a maioria dos sons mais simples do português.

O que esperar:

  • Frases de 4 a 6 palavras
  • Faz perguntas com "por que?"
  • Conta pequenas histórias sobre o dia
  • Compreende conceitos como "em cima", "embaixo", "dentro"
  • Inteligibilidade: a família entende praticamente tudo; estranhos entendem ~75–80%
  • Sons como /r/ tepe (de "caro"), /l/, /lh/ podem ainda apresentar trocas

Sinais de alerta:

  • Estranhos não entendem a maior parte do que a criança fala
  • Não constrói frases completas
  • Não compreende perguntas simples
  • Fala "telegráfica" persistente, sem conectivos
  • Disfluências (gagueiras) com tensão, esforço ou bloqueios — diferente da disfluência fisiológica desta faixa

4 a 5 anos — sistema quase completo

Aos 4–5 anos a criança já tem um sistema linguístico funcionalmente completo. O que ainda pode estar em ajuste são os sons mais complexos.

O que esperar:

  • Frases longas, com conjunções ("e", "porque", "mas")
  • Conta histórias com começo, meio e fim
  • Usa plurais, tempos verbais (passado, futuro)
  • Inteligibilidade: ~100% para a família, ~90% para estranhos
  • Sons como /r/ vibrante ("rr" de carro), /nh/, /lh/ e encontros consonantais ("prato", "blusa") ainda podem estar em aquisição

Sinais de alerta:

  • Inteligibilidade abaixo de 75% para estranhos aos 4 anos
  • Trocas de sons em padrões atípicos (não previstos no desenvolvimento típico)
  • Vocabulário reduzido para a idade
  • Dificuldade em manter um diálogo com idas e vindas
  • Gagueira com tensão, fugas e esquivas

5 a 6 anos — fala consolidada

Aos 5–6 anos, o sistema fonológico está praticamente completo. A criança fala com fluência, clareza e capacidade narrativa razoável.

O que esperar:

  • Inteligibilidade próxima de 100% para qualquer ouvinte
  • Domínio dos sons do português, inclusive /r/ vibrante e encontros consonantais (em consolidação até os 6 anos)
  • Narrativas estruturadas
  • Capacidade metalinguística inicial (pensa sobre a língua: rimas, sons iniciais)
  • Inicia consciência fonológica — pré-requisito da alfabetização

Sinais de alerta:

  • Trocas de sons que já deveriam estar consolidados
  • Dificuldade em manter narrativa coerente
  • Dificuldade em rimar, identificar sílabas, brincar com sons
  • Gagueira persistente — qualquer gagueira que dure mais de 6 a 12 meses merece avaliação

A ordem de aquisição dos sons no português brasileiro

Nem todos os sons chegam ao mesmo tempo — e há uma ordem previsível, mapeada por pesquisadores brasileiros (com destaque para Lamprecht, Mota e Bonilha). Conhecê-la ajuda a entender por que certas trocas ainda são esperadas em cada idade:

  • Até ~2 anos (primeiros fonemas): p, b, m, n, t, d, k, g, f, v — as consoantes mais "fáceis" motoramente, produzidas com os lábios ou na frente da boca.
  • 2 a 3 anos (intermediários): s, z, ch (ʃ), j (ʒ) — as fricativas chegam nessa fase.
  • 3 a 5 anos (tardios): l, lh (ʎ) e o tepe r (o "r" fraco de "caro").
  • 4 a 6 anos (mais tardios): a vibrante rr (o "rr" de "carro") e os encontros consonantais com líquidas ("prato", "blusa", "flauta").

É por isso que "cadu" por "carro" ainda é esperado aos 4 anos: o som vibrante é um dos últimos a ser dominado.

Inteligibilidade por idade: a fórmula prática

Uma heurística clínica consagrada — atribuída a Coplan & Gleason e reformulada por Flipsen — resume bem o quanto a fala deve ser compreendida por estranhos (que não conhecem o contexto):

  • 1 ano: ~25% inteligível
  • 2 anos: ~50% inteligível
  • 3 anos: ~75% inteligível
  • 4 anos: ~100% inteligível

São guias, não diagnósticos — e a família sempre entende mais do que estranhos. Mas se aos 3 anos estranhos entendem menos da metade do que a criança fala, vale avaliar.

Trocas esperadas vs. trocas que merecem atenção

Nem toda troca de som é sinal de problema. O que diferencia uma fase normal de um alerta é a idade em que a troca persiste e o padrão que ela segue.

Ainda esperadas até certa idade:

  • "Cadu" por carro → até 4–5 anos
  • "Papato" por sapato → até 3–4 anos
  • "Pato" por "prato" (omissão de encontro consonantal) → até 5–6 anos

Merecem atenção:

  • Omissão de sílabas inteiras após os 3 anos ("'to" por "sapato")
  • Ausência de consoantes no final das palavras após os 3 anos
  • A mesma palavra dita de formas muito diferentes em momentos distintos — a inconsistência fonológica, um dos marcadores mais importantes do transtorno fonológico
  • Trocas em sentido atípico: trocar sons "posteriores" por "anteriores" é comum (k → t: "tama" por "cama"); o contrário é raro

"É fase" ou é transtorno fonológico?

Há uma distinção que a avaliação fonoaudiológica faz com precisão:

Atraso fonológico: a criança segue o padrão típico de aquisição, mas em ritmo mais lento que o esperado para a idade. O caminho é o mesmo; a velocidade é menor.

Transtorno fonológico: a criança apresenta padrões atípicos — substituições inconsistentes, processos que não ocorrem no desenvolvimento típico, ou persistência de processos que já deveriam ter desaparecido.

A diferença importa porque o tratamento é diferente — e só a avaliação determina qual é qual.

"A fala é uma das tarefas motoras mais complexas que o cérebro humano realiza. É natural que leve tempo. Só não pode levar tempo demais."

Ritmo individual ou atraso de verdade?

"Mas ouvi que menino fala mais tarde." É um mito com um grão de verdade: há variação entre crianças, e meninos tendem a começar um pouco depois — mas dentro da mesma faixa esperada, não meses depois.

Ritmo individual é real quando a variação é pequena, a criança avança progressivamente e os marcos de comunicação social estão presentes (olhar, apontar, imitar). Atraso que pede avaliação é quando vários marcos estão ausentes ao mesmo tempo, quando o progresso parou, ou quando houve regressão. Essa distinção não se faz por observação isolada — se faz com avaliação.

Sinais universais — qualquer idade

Independentemente da faixa etária, alguns sinais pedem avaliação imediata:

  • Regressão da fala ou da linguagem — perder o que já tinha
  • Ausência de resposta a sons ambientais, após triagem auditiva
  • Pouco contato visual combinado com pouca fala
  • Você, pai ou mãe, sente que algo não está certo — a intuição parental é dado clínico relevante

Quando procurar avaliação

A resposta curta: diante da dúvida persistente, sim.

A avaliação fonoaudiológica não rotula nem compromete a nada. Ela dá clareza. Em muitos casos, a família sai com a confirmação de que está tudo dentro do esperado. Em outros, sai com um plano — e os primeiros anos são a janela em que a intervenção rende mais.

A SBP, a SBFa e a ASHA convergem em um ponto: na dúvida, avaliar é melhor do que esperar. O custo de avaliar e estar tudo bem é uma consulta. O custo de esperar e perder a janela é maior.

Se você está vendo algum dos sinais descritos aqui, agende uma avaliação fonoaudiológica — uma conversa esclarece muita coisa.

FAQ

Perguntas frequentes

A referência aos 24 meses é de 50 palavras ou mais e combinações de duas palavras. Vinte palavras pode estar abaixo do esperado, mas o cenário completo importa: o quanto ele entende, se aponta, se interage, se imita. Uma avaliação fonoaudiológica define se é variação típica ou se vale intervir.

Não. A literatura é consistente: crianças bilíngues podem ter vocabulário menor em cada idioma individualmente nos primeiros anos, mas o vocabulário total é comparável ao de monolíngues. Bilinguismo não causa atraso de fala nem de linguagem.

Não necessariamente. Em crianças pequenas, é comum que se expressem mais com familiares conhecidos. Se essa diferença for marcante, persistir após os 5 anos e impactar a escola, pode haver um quadro chamado mutismo seletivo, que merece avaliação.

Depende do quadro. Se aos 24 meses a criança já apresenta sinais claros (poucas palavras, ausência de combinação, regressão), esperar mais um ano significa perder meses de janela de intervenção. A SBP recomenda avaliação diante de sinais persistentes, em qualquer idade.

O fonoaudiólogo é o profissional habilitado para avaliar fala e linguagem (resolução do Conselho Federal de Fonoaudiologia — CFFa). Em muitos casos, o trabalho é multiprofissional: pediatra, otorrinolaringologista (para audição), neuropediatra e psicólogo podem complementar conforme o quadro.

Não necessariamente. O r vibrante — o "rr" de carro — está entre os últimos fonemas a se firmar no português, com aquisição esperada até os 6 anos. Vale monitorar; se persistir além dos 5 anos junto de outras trocas, uma avaliação é indicada.

Prefira modelar, não corrigir. Em vez de "não é cadu, é carro", diga naturalmente "é, o carro está na garagem". A modelagem ensina pela exposição repetida ao som correto; a correção direta tende a reprimir a comunicação.

Sim. A Caderneta da Criança, publicada pelo Ministério da Saúde com a Sociedade Brasileira de Pediatria, traz marcos de desenvolvimento por faixa etária — inclusive de linguagem e comunicação. Ela deve ser preenchida e acompanhada nas consultas de puericultura.

Referências científicas

  1. Sociedade Brasileira de Pediatria. Manual de Orientação — Acompanhamento do Desenvolvimento Infantil. sbp.com.br
  2. American Speech-Language-Hearing Association. Speech and Language Developmental Milestones. asha.org
  3. CDC — Centers for Disease Control and Prevention. Important Milestones: Your Child by Year. cdc.gov
  4. Conselho Federal de Fonoaudiologia (CFFa). Atuação do Fonoaudiólogo nas áreas de Linguagem e Audição. fonoaudiologia.org.br
  5. Hage, S. R. V. (2019). Avaliação fundamentada do desenvolvimento da linguagem infantil. Pró-Fono. scielo.br
  6. Lamprecht, R. R. et al. Aquisição Fonológica do Português: perfil de desenvolvimento e subsídios para terapia. Porto Alegre: Artmed, 2004. researchgate.net
  7. Bonilha, F. F. G. et al. Aquisição segmental do Português Brasileiro: onset simples, complexo e coda. CoDAS, 2019. scielo.br
  8. Flipsen Jr., P. Measuring the intelligibility of conversational speech in children. Clinical Linguistics & Phonetics, 2006. pubmed.ncbi.nlm.nih.gov
  9. Wertzner, H. F. et al. Gravidade do distúrbio fonológico: julgamento perceptivo e porcentagem de consoantes corretas. Pró-Fono, 2007. scielo.br
  10. Ministério da Saúde (Brasil) / Sociedade Brasileira de Pediatria. Caderneta da Criança — Marcos de Desenvolvimento. gov.br/saude

Os primeiros anos não voltam.

Agende uma avaliação — uma conversa já resolve a dúvida.

📍 R. João Marcatto, 260 · Sala 401 · Ed. Tower Center — Centro, Jaraguá do Sul/SC

Fono Ana Lígia by COLD BREW © 2026.
Todos os direitos reservados.

Cookies de análise

Usamos cookies de análise (Google Analytics) para entender como o site é usado e melhorá-lo. Sua escolha vale para as próximas visitas e pode ser alterada na Política de Privacidade.