Bar Charts vs Dot Plots: Quick Comparison
Os gráficos de barras têm uma vantagem distinta sobre as formas de gráfico que exigem julgamentos de área ou ângulo. Isso ocorre porque as tarefas perceptivas simples que exigimos para decodificar um gráfico de barras - julgar comprimentos e / ou posição ao longo de uma escala - são tarefas nas quais somos bons. Mas também decodificamos gráficos de pontos julgando a posição ao longo de uma escala. Existe uma razão para escolher um em detrimento do outro?
Os gráficos de barras têm uma vantagem distinta sobre as formas de gráfico que exigem julgamentos de área ou ângulo. Isso ocorre porque as tarefas perceptivas simples que exigimos para decodificar um gráfico de barras – julgar comprimentos e/ou posição ao longo de uma escala – são tarefas nas quais somos bons. Mas também decodificamos gráficos de pontos julgando a posição ao longo de uma escala. Existe uma razão para escolher um em detrimento do outro?
Para explorar essa questão, vou criar vários gráficos de barras e gráficos de pontos a partir de um conjunto de dados do mundo real. Especificamente, veremos a tabela de expectativa de vida da Organização Mundial da Saúde (OMS) por país. Abrange três anos diferentes: 1990, 2000 e 2012 e veremos apenas a expectativa de vida ao nascer em ambos os sexos combinados. Os dados são arredondados para o ano inteiro mais próximo.
Vamos começar olhando para o aumento da expectativa de vida entre 1990 e 2012 para 12 das nações do G-20.

Qual gráfico é melhor? Com o gráfico de barras, você pode comparar comprimentos e posições, mas se você é um discípulo fervoroso de Edward Tufte, o gráfico de pontos tem a melhor proporção de dados e tinta. Além disso, sempre se pode alterar as linhas no gráfico de pontos para que elas só vão de 0 para a posição do ponto se alguém quiser julgar com base no comprimento. No final, acho que, neste caso simples, provavelmente é apenas uma questão de preferência pessoal.
E se, em vez de olharmos para a diferença entre 2012 e 1990 para cada país, quiséssemos apenas mostrar os dois valores correspondentes? No caso do gráfico de barras, criamos um gráfico de barras agrupado, no caso do gráfico de pontos, colocamos dois símbolos diferentes em cada linha.

É fácil comparar as duas barras do mesmo país, mas se quisermos comparar entre os países para o mesmo ano, devemos ignorar a presença de metade das barras. Como essas barras fornecem uma concentração bastante densa de cores, essa não é uma tarefa tão fácil. Com o gráfico de pontos, a comparação para o mesmo país é ainda mais fácil - apenas digitalizamos ao longo da mesma linha horizontal. Acho que a comparação entre países para o mesmo ano também é mais simples, não há grandes blocos de cores para nos distrair quando queremos comparar círculos azuis com outros círculos azuis ou quadrados vermelhos com outros quadrados vermelhos.
Isso cobre as tarefas de decodificação mais óbvias, mas podemos extrair outros insights? Acho que é imediatamente aparente a partir do gráfico de pontos que a Turquia viu o maior aumento na expectativa de vida (como era óbvio quando plotado diretamente no primeiro exemplo). Com o gráfico de barras agrupadas, essa informação está lá, mas está um pouco oculta. Da mesma forma, acho que o fato de que a expectativa de vida na Índia em 2012 era menor do que na maioria dos países listados em 1990 é mais óbvio no gráfico de pontos.
Vamos adicionar o ano intermediário de medição ao gráfico e ver que diferença isso faz.

Agora as coisas parecem um pouco apertadas. No caso do gráfico de pontos, por exemplo, há uma sobreposição entre o marcador para o ano 2000 e um dos outros dois anos em oito dos doze casos. Mas podemos mudar as coisas com o gráfico de pontos mais do que com o gráfico de barras. Supondo que estejamos restritos ao mesmo espaço horizontal e vertical acima, a única coisa que podemos fazer com o gráfico de barras é alterar a escala horizontal para que seu máximo coincida com o máximo nos dados. Mas com o gráfico de pontos, como o comprimento da linha não codifica nada, podemos expandir nossa escala em ambas as direções horizontais para o que for conveniente.

As coisas estão muito mais claras agora no gráfico de pontos, enquanto o gráfico de barras quase não é diferente.
A discussão acima fornece várias razões para favorecer um gráfico de pontos em vez de um gráfico de barras. O conjunto de dados usado é, no entanto, muito bem comportado. Especificamente, para cada país, a expectativa de vida aumentou de 1990 a 2000 a 2012. Este não foi universalmente o caso em todo o mundo. Na verdade, se eu tivesse escolhido uma amostra diferente de doze países do G-20, como a abaixo, nosso conjunto de dados não teria sido tão bem comportado.

No caso da África do Sul e da Rússia, temos sobreplotagem no gráfico de pontos. Esse é um problema com o qual provavelmente podemos lidar. Poderíamos usar pontos semitransparentes, por exemplo. As barras de um gráfico de barras agrupadas não estão na mesma linha e, portanto, a plotagem excessiva nunca será um problema.
