Saiba o que é e como calcular a distribuição de frequência

A organização das informações é uma parte fundamental na aplicação de estatística e ciência de dados. Seja para analisar tendências, tomar decisões ou comparar escalas, ter os dados em uma ordem lógica facilita a captação. Além de dados estáticos, há a possibilidade de aplicar a modelagem de dados por meio de distribuição de frequência. 

Assim, na distribuição de frequência, os dados obtidos são relacionados por meio de quantidades em comparação com um todo. Essa aplicação existe para contabilizar e contextualizar uma variável (ou intervalo) no todo.

Para realizar o cálculo de distribuição de frequência, é importante saber quais dados são necessários, que variáveis entram na conta e os elementos básicos de uma tabela de distribuição de frequência. Confira!

O que é distribuição de frequência?

Para compreender a distribuição de frequência, o primeiro passo é entender a importância de medir frequência em análise de dados. Além de auxiliar a entender tendências, os gráficos e tabelas de frequência podem ser organizados para mostrar dados diversos.

Desse modo, a frequência significa o número de vezes em que o elemento aparece em uma amostra. Sendo assim, na amostra “G, T, S, J, T, L, Y, P, S, T”, a frequência de T é 3, a de S é 2 e a de G, J, L, Y e P é 1. 

Apesar de simples, essa mesma lógica pode ser aplicada para diferentes contextos de estatística. A frequência também existe em formato dinâmico, ou seja, ao invés de medir a quantidade de vezes em que um elemento aparece, a distribuição leva em consideração intervalos que sejam relevantes para análise de dados. 

Por exemplo, imaginemos que objetivo é encontrar quantos números entre 1 e 10 ou entre 11 e 20 existem na amostra. Tanto o número 14 quanto o número 18 contam no segundo intervalo. Então, se cada um deles aparecer duas vezes, isso aumenta a frequência daquela classe. 

Paralelamente, se o número 8 aparecer uma única vez e o número 7 aparecer cinco vezes, a classe entre 1 a 10 terá maior peso. Nesse sentido, então vale a pena analisar qual a melhor forma de usar a tabela de distribuição de frequência para entender seus dados.

Como funciona na prática?

Essa aplicação pode ser usada para datas, para opiniões, para dados demográficos e muitas outras questões que são úteis para fins de pesquisa. 

Por exemplo, um caso em que o professor precisa analisar a produtividade dos alunos. A ideia é utilizar a distribuição de frequência para entender quantos atingiram a nota nove, quantos atingiram a nota sete e quantos estão abaixo da média. 

Dessa forma, ele poderá ter uma visão analítica do progresso dos alunos ao longo do tempo. Para fins de censo, a distribuição de frequência também tem sua utilidade. É o caso, por exemplo, de contabilizar quantas pessoas recebem acima ou abaixo de X mensalmente. 

Além disso, a distribuição de frequência também pode ser útil no processo industrial. Isso é, com a testagem e o prototipagem sendo recorrentes nessa área, é importante ter um registro das variáveis e de qual a taxa de sucesso dependendo da alteração. 

Os dados são fundamentais para o gerenciamento de projetos, uma parte muito importante da gestão e organização industrial. Nesse caso, colocá-los em uma tabela de distribuição de frequência ajuda a entender quais alterações foram válidas e quantificar os benefícios delas. 

Se, por exemplo, ao alterar uma peça, a frequência de testes positivos foi de 90%, ela teve contribuição maior do que a anterior. O mesmo pode ser dito sobre a escolha de materiais ou até mesmo de processos de fabricação. Ao testar a frequência de sucesso, é mais fácil entender os caminhos que levam a ele.

Leia também: Guia sobre Power BI: saiba o que é, como funciona, para que serve e mais!

Que elementos fazem parte de uma tabela de frequência?

Para organizar uma tabela de distribuição de frequência e sua representação gráfica, é importante entender quais são os elementos fundamentais para essa análise. Em primeiro lugar, ao visualizar os dados, é preciso escolher qual será a variável em foco. 

Nesse caso é possível escolher tanto uma variável estática quanto um intervalo de dados, levando em consideração a amplitude dos dados coletados. 

Por exemplo, ao analisar o alfabeto em número de vezes em que cada letra aparece em uma amostra a variável será cada letra em si. O número máximo total é o número de letras na amostra. 

Sendo assim, você deve classificar cada letra de acordo com o número de vezes em que ela aparece naquele texto e inseri-las de forma gráfica para então demonstrar a diferença entre cada uma delas. Confira a seguir: 

Amostra: concentrar

frequência absolutafrequência relativa
c20,2
o10,1
n20,2
e10,1
t10,1
r20,2
a10,1

Também é possível usar elementos quantitativos em distribuição de frequência. Para analisar um grupo de alunos por rendimento, por exemplo, a variável é a nota acima ou abaixo da média.

sala asala bfrequência absolutafrequência relativa
aprovados1218300,72
reprovados66120,28
total1824421

Ou seja, analisar as informações pelas lentes da frequência pode trazer ferramentas importantes para a atuação profissional em diversas áreas e contextos.

Tipos de gráficos para distribuição de frequência

Além das tabelas, é possível usar elementos gráficos para explorar os resultados da distribuição de frequência. No caso da amostra “concentrar”, por exemplo, um gráfico seria:

Também é possível demonstrar a frequência por meio de gráficos em barras:

Como calcular a distribuição de frequência?

fi = iN

Para entender a frequência relativa de um elemento, é importante levar em consideração a amostra obtida. Ainda que o cálculo seja feito seguindo a fórmula acima, ou seja, a frequência relativa é o número de vezes em que o elemento aparece/tamanho da amostra, existem alguns cuidados necessários.

Em primeiro lugar, é importante escolher bem a variável que será testada. Isso porque ao incluir muitas informações, o gráfico pode não mostrar as tendências e ficar sobrecarregado.

Também é importante entender se os dados são qualitativos ou quantitativos. No caso dos qualitativos, a categorização não tem uma ordem de grandeza, mas sim a adequação à categoria. 

Ou seja, se uma amostra contém 30 pessoas em que 3 se chamam João, a categoria “João” tem 0,1 de frequência relativa e a categoria “Outro nome” tem 0,9 de frequência relativa.

Mas nos dados quantitativos, existem outras variáveis. A ideia aqui é analisar informações numéricas, com ordem de grandeza clara. Os dados quantitativos discretos são aqueles em que é possível enumerar de acordo com um máximo finito. 

Então, se em um grupo de pessoas há quem tenha um, dois ou três irmãos, uma pesquisa indicará qual dessas quantidades tem maior frequência.

Já os dados quantitativos contínuos são medidos em uma escala contínua e contemplam infinitos valores possíveis. Renda familiar, número de habitantes por cidade, altura das pessoas de um grupo, etc.

Dados extraídos: exemplos e aplicabilidade

Com todas as possibilidades que a análise de dados oferece, existem diferentes recursos que se beneficiam dela. As tabelas de frequência são úteis para censos, estudos de caso, prototipagem, laboratórios, instituições de ensino e muito mais. Veja alguns exemplos:

1. Testes de produtos

Uma aplicação prática da análise de dados é a testagem de novos produtos. Se os especialistas de uma indústria querem testar a taxa de sucesso de diferentes protótipos para entender com qual seguir em frente, a distribuição de frequência é uma boa saída. 

Com o protótipo B escolhido, agora os especialistas partem para a pesquisa de opiniões. Em um grupo focal de dez pessoas, pediram que dessem notas de 1 a 5 para o produto em potencial. 

Nesse caso, conclui-se que a frequência relativa da nota 4 é 0,4. 

2. Dados demográficos

Uma utilização comum desse tipo de dado é em pesquisas demográficas. Uma variável a ser analisada, por exemplo, é a idade de um grupo de pessoas. Assim:

Renda per capita

Gráficos de distribuição de renda são um bom exemplo de dados quantitativos contínuos. Não existem apenas números inteiros nesse intervalo e a ordem de grandeza é relevante para a classificação. 

Por isso, ao visualizar um gráfico com essas informações, o cientista de dados pode deduzir questões relevantes para aquele grupo.

Fonte: FGV

3. Datas de aniversário

Imagine que uma empresa queira montar um gráfico que mostre a prevalência de aniversariantes por mês. Para isso, é importante determinar os intervalos de dados (meses) e incluir na tabela a quantidade de aniversariantes.

Nesse contexto, o total da amostra é de 190 pessoas na empresa. Assim, a frequência de aniversariantes em abril é 11 em 190, ou 0,05.

4. Tempo

Nesse exemplo, podemos imaginar que um técnico de laboratório quer testar a quantidade de tempo necessário para um experimento. 

Como forma de controle, ele testa o tempo normal, de dez minutos, três vezes. Testa oito minutos três vezes e doze minutos três vezes.

Nessa análise, a frequência de sucesso foi de 0,55 e a de falha foi de 0,45. Entre os testes de doze minutos, a frequência relativa de sucesso foi de 0,3.

Leia também: Processamento de dados: o que é, tipos e como se tornar um especialista

Qual a importância da distribuição de frequência?

O estudo de estatística tem grandes vantagens para diferentes setores. No setor educacional, por exemplo, é possível analisar tendências de acordo com o rendimento de alunos, tipo de aluno matriculado, qual a principal motivação para a busca de cada curso, entre outras informações. 

Na educação

Esses dados são usados, por exemplo, no Censo da Educação Superior, realizado anualmente pelo Inep e publicado de forma aberta para a população brasileira. 

Nesse documento o Inep sintetiza e exemplifica as principais modalidades de ensino, perfis de alunos, perfis de docentes, perfis socioeducativos de cada região brasileira e muito mais informações que servem como norteadoras para diretrizes educacionais. 

Na indústria

O mesmo também ocorre nas indústrias. Com campanhas de marketing e estratégias de inovação em mãos, os especialistas empresariais muitas vezes precisam tomar decisões de forma rápida e efetiva

E os dados são uma peça chave para chegar a essas conclusões. Ter uma boa organização de dados facilita o trabalho desses profissionais, já que as tabelas, principalmente quando contam com a frequência relativa, permitem uma visualização mais rápida das informações e facilitam a extração de conhecimento. 

Lidar com dados puros exige mais formulação, já a frequência relativa é um dado indicador que faz com que pessoas de diferentes áreas possam visualizar de forma efetiva o impacto de cada decisão. 

É uma estratégia usada em dashboard excel, por exemplo, que funciona como uma indexação de um banco de dados em forma de uma página gráfica que exemplifica cada parte do processo sendo analisado. 

Em uma empresa, a primeira página é um guia rápido de acesso às informações como rendimentos de projetos ou com produtividade, custo de materiais, entre muitas outras informações relevantes.  

Na ciência

A ciência também exige estatística e é por meio dela que estudiosos de diferentes áreas de conhecimento podem chegar a conclusões relevantes sobre seus experimentos. 

Questões como taxa de vacinação, taxa de sucesso de remédios, efeitos colaterais, índices de saúde pública e muitas outras que são determinantes em sua atuação podem ser vistas por meio da análise de frequência.

Por isso, esse recurso não é útil apenas para estatísticos ou cientistas de dados. Nem somente para o uso prático na programação e na gestão backend. 

Um gráfico de distribuição de frequência efetivo é uma ferramenta que pode oferecer a pessoas de diferentes níveis de conhecimento estatístico um insight importante sobre as informações e resumir em algumas linhas ou barras pontos importantes que devem ser levados em consideração na hora de criar novas estratégias e inovar em cada setor.

Agora que você já conhece a importância das análises estáticas em diferentes setores e como fazer a distribuição de frequência, que tal se aprofundar nos dados? Confira nosso guia sobre Big Data e como aplicar na prática!

Sirius Educação

Somos uma escola de tecnologia, digital e diferente do tradicional. Permitimos uma jornada de aprendizagem individual, voltada à prática e altamente conectada com o ecossistema de inovação. E o mais importante, temos um olhar humano para o desenvolvimento do aluno ou aluna, empoderando-as para o futuro.

Sirius Educação
Sirius Educação
Somos uma escola de tecnologia, digital e diferente do tradicional. Permitimos uma jornada de aprendizagem individual, voltada à prática e altamente conectada com o ecossistema de inovação. E o mais importante, temos um olhar humano para o desenvolvimento do aluno ou aluna, empoderando-as para o futuro.
Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *