Data Visualization

Dominando Gráficos de Dispersão Matplotlib: Um Guia para o Controle do Tamanho dos Marcadores

Spread the love

Gráficos de dispersão são uma maneira eficaz de visualizar a relação entre duas variáveis. Matplotlib, uma biblioteca de plotagem Python amplamente utilizada, oferece várias opções para personalizar esses gráficos, incluindo o tamanho dos marcadores que representam os pontos de dados. Este artigo explora diferentes métodos para controlar o tamanho do marcador em seus gráficos de dispersão Matplotlib, permitindo que você crie visualizações mais informativas e visualmente atraentes.

Sumário

Controlando o tamanho do marcador com a palavra-chave ‘s’

O método mais comum e versátil para ajustar o tamanho do marcador em gráficos de dispersão Matplotlib é usar o argumento de palavra-chave s dentro da função scatter. O argumento s aceita um escalar ou um objeto semelhante a uma matriz que especifica o tamanho do marcador em pontos ao quadrado. Um valor de 100 representa um marcador com uma área de 100 pontos quadrados.


import matplotlib.pyplot as plt
import numpy as np

x = np.random.rand(10)
y = np.random.rand(10)
sizes = np.random.randint(10, 100, 10)  # Tamanhos aleatórios entre 10 e 100

plt.scatter(x, y, s=sizes)
plt.xlabel("Eixo X")
plt.ylabel("Eixo Y")
plt.title("Gráfico de Dispersão com Tamanhos de Marcador Variáveis")
plt.show()

Este código cria um gráfico de dispersão onde o tamanho de cada marcador é determinado pelo elemento correspondente na matriz sizes. Usar um único valor escalar para s resulta em tamanhos de marcador uniformes para todos os pontos.

Tamanho de marcador uniforme para todos os pontos

Para definir um tamanho de marcador consistente em todos os pontos de dados, simplesmente forneça um único valor escalar ao argumento s:


import matplotlib.pyplot as plt
import numpy as np

x = np.random.rand(10)
y = np.random.rand(10)

plt.scatter(x, y, s=50)  # Todos os marcadores terão tamanho 50
plt.xlabel("Eixo X")
plt.ylabel("Eixo Y")
plt.title("Gráfico de Dispersão com Tamanho de Marcador Uniforme")
plt.show()

Isso gera um gráfico de dispersão com todos os marcadores tendo uma área de 50 pontos quadrados.

Tamanho de marcador não uniforme baseado em dados

Muitas vezes, você desejará escalonar o tamanho do marcador com base em uma terceira variável. Por exemplo, se você tiver dados populacionais, poderá desejar marcadores maiores para representar áreas com maior densidade populacional. Isso é facilmente alcançado mapeando seus dados para tamanhos de marcador apropriados:


import matplotlib.pyplot as plt
import numpy as np

x = np.random.rand(10)
y = np.random.rand(10)
population = np.random.randint(1000, 10000, 10)  # Dados populacionais de exemplo

# Escalonar a população para tamanhos de marcador apropriados
sizes = (population / population.max()) * 200  # Escalonar para uma faixa razoável

plt.scatter(x, y, s=sizes)
plt.xlabel("Eixo X")
plt.ylabel("Eixo Y")
plt.title("Gráfico de Dispersão com Tamanho de Marcador Representando População")
plt.show()

Isso escala os dados populacionais para uma faixa adequada para tamanhos de marcadores, garantindo que populações maiores correspondam a marcadores maiores.

Usando a função plot para gráficos de dispersão simples

Embora a função scatter seja geralmente preferida para gráficos de dispersão devido à sua flexibilidade, você também pode controlar o tamanho do marcador usando o parâmetro markersize dentro da função plot. No entanto, este método é menos flexível e só permite um único tamanho de marcador para todos os pontos:


import matplotlib.pyplot as plt
import numpy as np

x = np.random.rand(10)
y = np.random.rand(10)

plt.plot(x, y, 'o', markersize=10)  # Todos os marcadores terão tamanho 10
plt.xlabel("Eixo X")
plt.ylabel("Eixo Y")
plt.title("Gráfico de Dispersão usando a função plot")
plt.show()

Isso produz um resultado semelhante ao uso de um tamanho uniforme com scatter, mas scatter oferece controle superior e é geralmente recomendado para criar gráficos de dispersão. Observe que 'o' especifica um marcador circular; outros estilos de marcador estão disponíveis (consulte a documentação do Matplotlib para obter detalhes).

Este artigo demonstrou várias técnicas para controlar o tamanho do marcador em gráficos de dispersão Matplotlib, permitindo que você crie visualizações personalizadas e informativas visualmente. Lembre-se de ajustar a escala de tamanho para corresponder aos seus dados e à representação visual desejada.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *