Dicas para sintetizar dados — Tabelas e Gráficos

Caderno de Anotações
5 min readAug 4, 2020

--

Dados, em qualquer quantidade, podem e devem ser sintetizados. Isso pode ser feito por meio de palavras, tabelas, gráficos e estatísticas descritivas.

TABELAS

Tabelas são úteis para comunicar informações e têm a vantagem de disponibilizar os dados para que o leitor faça suas próprias análises ou cheque se as que você fez estão corretas.

Dicas para construção de tabelas:

  • Devem, obrigatoriamente, ter um título explicativo e indicar a fonte;
  • Números devem ser arredondados, sempre! Em geral, muitas casas decimais, além de inútil, dificultam o entendimento;
  • De preferência, os valores que se deseja comparar deverão ser dispostos em colunas (e não nas linhas);
  • Tanto números absolutos quanto proporções podem ser exibidos em uma tabela, a escolha vai depender da informação que se pretende dar;
  • Dados devem ordenados de uma forma que faça sentido;
  • Totais nas linhas e/ou colunas devem ser incluídos;
  • Para cada variável, utilize entre 5 e, no máximo, 20 categorias;
  • Categorias de uma mesma variável não podem se sobrepor (do contrário, sua tabela não fará sentido nenhum);
  • Se possível, faça categorias com tamanhos parecidos.

Tipos comuns de tabelas:

Tabela de frequências — mostra quão frequente é cada item da tabela; pode usar dados categóricos ou numéricos; dados numéricos podem ser categorizados, inclusive dados contínuos (isso é feito agrupando os dados em intervalos antes da tabulação).

Tabela de frequências — exemplo

Tabela de contingência (ou tabela cruzada, multidimensional, tabulação cruzada, etc.) — permite exibir uma grande quantidade de dados, de maneira estruturada e resumida; apresenta a frequência conjunta de duas ou mais variáveis; observe que cada variável ou categoria de uma variável pode se subdividir. Na figura abaixo, por exemplo, a categoria “fruta” subdivide-se em maçãs, bananas, peras; a variável que indica o ano também aparece subdividida em categorias: 2001, 2002 e 2003.

Tabela de contingência ou tabulação cruzada — exemplo

Gráficos

Uma das melhores formas de analisar dados é criando uma imagem (de preferência um bom gráfico).

Por quê? Bem, porque é mais fácil de entender uma imagem do que uma tabela (geralmente). A imagem pode revelar padrões ocultos, e é mais fácil de explicar para outras pessoas.

Gráficos são ferramentas visuais que têm diversas vantagens, dentre elas: torna inteligível grande quantidade de dados, fornece uma visão geral, permite comparações, resume informações, conta uma história — tudo isso de forma mais rápida e acessível do que quando são utilizadas tabelas.

Entretanto, gráficos têm a desvantagem de levarem a interpretações equivocadas, caso não sejam construídos de forma correta. Mas isso pode ser evitado, seguindo recomendações básicas para a correta visualização dos dados.

Dicas para a construção de gráficos:

  • Devem ter um título informativo, rótulos nos eixos, legenda e fonte de dados;
  • Devem mostrar de forma clara e relativamente simples as principais características dos dados;
  • Não poluir o gráfico com informações inúteis; símbolos e cores devem servir para comunicar informação (conceito de Data-Ink Ratio, de Edward Tufte).

Gráficos nunca devem induzir ao erro!

  • Não usar espaços desiguais ou deixar lacunas em branco sem motivo;
  • Usar sempre a mesma escala nos eixos;
  • Evitar sombreados e gradação de cores;
  • Ênfase desnecessária em alguma parte do gráfico é jogo sujo;
  • Distorção de áreas e uso de 3D também são práticas temerárias na construção de gráficos. A representação em 3 dimensões é um erro comum, que deve ser evitado com todas as forças!
  • Não exagerar as diferenças usando cambalachos visuais. Por exemplo, em gráficos de colunas, a comparação entre valores é feita através das alturas de cada coluna, usar diferentes áreas e volumes para representar seus dados induz ao erro, proposital ou não;
  • Além disso, cuidado com o valor inicial de cada eixo (dependendo do caso, não exibir o ponto zero pode enganar o leitor), com a escolha de cores espúrias (lembre-se de que as cores têm conotações psicológicas), anotações e comentários sem propósito, extrapolação dos dados (a não ser que você possa mesmo fazer isso, não faça!)

Para resumir, um bom gráfico deve respeitar a regra de ouro, o “Princípio da Área”: a área ocupada no gráfico deve corresponder à magnitude dos dados que estão sendo representados.

Dicas especiais para a construção de gráficos quando a variável é categórica:

  • Categorias não devem se sobrepor (não faz sentido contar duas vezes a mesma observação e representar isso com um gráfico, ok?).
  • Se você quer ilustrar proporções, elas devem somar 1 ou 100% — cada uma das observações deve ser contadas. E apenas uma vez.
  • Percentuais são ótimos, mas apenas quando o número de observações é grande o suficiente. Um exemplo, qual é o sentido de falar que 33,3% das 3 empresas pesquisadas não tem um plano de carreira para seus funcionários? E pior, qual é o sentido de representar isso em um gráfico?!
  • Lembre-se dos Simpsons (já ouviu falar do Paradoxo de Simpson?) — algumas vezes, combinar percentuais é uma péssima ideia, para não dizer absurda.

Tipos de gráfico mais comuns e melhores aplicações:

Antes de mais nada, tenha em mente que o tipo de gráfico a ser escolhido para apresentar os dados depende do:

  • tipo de dado (dados são categóricos, discretos ou contínuos?)
  • tipo de resumo (números absolutos, frequências relativas, taxas, etc.?)

Gráfico de pizza (ou setores) → bom para mostrar como o conjunto dos dados se divide entre as categorias de uma variável. São indicados para mostrar as frequências relativas das classes de uma (e apenas uma) variável categórica.

Use com moderação! O gráfico em setores não é muito bom para comparar categorias, ainda mais quando são muitas. É um círculo, dispõe as proporções na forma de fatias de um círculo e não estamos acostumados a pensar o mundo em termos de graus.

Exemplo de como não fazer um gráfico de pizza:

Como NÃO fazer um gráfico de pizza

Gráfico de barras ou de colunas → bom para comparação entre as categorias de uma (ou mais) variáveis. Pode ser usado variáveis do tipo categórica ou numérica discreta. O comprimento (ou altura) de cada barra representa a frequência relativa da classe. Bastante útil para ordenar classes por tamanho, por exemplo, do maior para o menor.

Importante deixar um espaço entre as barras ou colunas, caso contrário ficará parecendo um histograma, um tipo especial de gráfico em colunas utilizado somente para dados numéricos contínuos.

Cuidado! Não usar um gráfico de barras/colunas quando há um número excessivo de categorias (o gráfico fica horroroso e é inútil). Deve-se atentar também para a escala do gráfico, ou você pode causar uma impressão equivocada (intencional ou não). Observe:

Como NÃO fazer um gráfico de barras: 1 -muitas categorias, 2- escala não muito honesta

Histograma → usados para representar frequências relativas nos intervalos de uma variável contínua. Para indicar que os dados são contínuos, não pode haver lacunas entre as barras. A área de cada barra representa sua frequência na distribuição dos dados.

Histogramas

--

--

Caderno de Anotações
Caderno de Anotações

Written by Caderno de Anotações

Aprendendo sempre uma coisa nova e esquecendo duas antigas

No responses yet