Dominando Consultas DynamoDB com Boto3 em Python

Agosto 8, 2025 - By admin

Spread the love

Este guia abrangente demonstra como interagir efetivamente com o Amazon DynamoDB usando a biblioteca Boto3 em Python. Abordaremos operações essenciais, desde a criação e exclusão de tabelas até técnicas de consulta avançadas e recuperação eficiente de dados.

Sumário

Introdução ao DynamoDB
Introdução ao Boto3
Criando Tabelas DynamoDB com Boto3
Excluindo Tabelas DynamoDB com Boto3
Listando Tabelas DynamoDB com Boto3
Consultando Dados no DynamoDB
Escaneando Dados no DynamoDB
Recuperando Itens Específicos
Implementando Paginação
Utilizando Índices Secundários Globais
Lidando Eficientemente com Conjuntos de Dados Grandes
Conclusão

Introdução ao DynamoDB

Amazon DynamoDB é um serviço de banco de dados NoSQL totalmente gerenciado e sem servidor. Sua estrutura de banco de dados chave-valor e documento oferece desempenho excepcional, escalabilidade e alta disponibilidade. Ao contrário de bancos de dados relacionais, o DynamoDB usa tabelas de itens, cada um identificado exclusivamente por uma chave primária. Este design o torna ideal para aplicativos que exigem baixa latência e alta taxa de transferência.

Introdução ao Boto3

Boto3, o SDK da AWS para Python, fornece uma interface amigável para gerenciar serviços da AWS, incluindo o DynamoDB. Ele simplifica tarefas como criação de tabelas, manipulação de dados e consultas. Antes de prosseguir, certifique-se de que o Boto3 esteja instalado (`pip install boto3`) e suas credenciais da AWS estejam configuradas corretamente.

Criando Tabelas DynamoDB com Boto3

Criar uma tabela DynamoDB requer definir seu nome, chave primária e outros atributos. O seguinte trecho de código demonstra a criação de tabelas usando Boto3:


import boto3

dynamodb = boto3.resource('dynamodb')

table = dynamodb.create_table(
    TableName='MyTable',
    KeySchema=[
        {'AttributeName': 'id', 'KeyType': 'HASH'},  # Chave de partição
    ],
    AttributeDefinitions=[
        {'AttributeName': 'id', 'AttributeType': 'S'},
    ],
    ProvisionedThroughput={
        'ReadCapacityUnits': 5,
        'WriteCapacityUnits': 5,
    }
)

table.meta.client.get_waiter('table_exists').wait(TableName='MyTable')
print(f"Tabela '{table.name}' criada com sucesso.")

Este exemplo cria uma tabela chamada ‘MyTable’ com uma chave primária string ‘id’. Ajuste as `ReadCapacityUnits` e `WriteCapacityUnits` de acordo com as necessidades do seu aplicativo.

Excluindo Tabelas DynamoDB com Boto3

Excluir uma tabela DynamoDB é simples:


table = dynamodb.Table('MyTable')
table.delete()
print(f"Tabela 'MyTable' excluída com sucesso.")

Listando Tabelas DynamoDB com Boto3

Para listar todas as suas tabelas DynamoDB:


tables = dynamodb.tables.all()
for table in tables:
    print(table.name)

Consultando Dados no DynamoDB

O DynamoDB oferece mecanismos de consulta eficientes. As operações `Query` são melhores para recuperar itens com base em uma chave primária específica ou um intervalo de valores dentro de uma chave composta. O exemplo a seguir demonstra uma consulta simples:


table = dynamodb.Table('MyTable')
response = table.query(KeyConditionExpression=Key('id').eq('123'))
for item in response['Items']:
    print(item)

Escaneando Dados no DynamoDB

Uma operação `Scan` recupera todos os itens em uma tabela. Embora menos eficiente que `Query`, é útil para varreduras completas da tabela. Lembre-se de implementar a paginação para tabelas grandes (consulte a seção sobre Paginação).


response = dynamodb.Table('MyTable').scan()
for item in response['Items']:
    print(item)

Recuperando Itens Específicos

Para recuperar um único item por sua chave primária:


table = dynamodb.Table('MyTable')
response = table.get_item(Key={'id': '123'})
item = response.get('Item')
print(item)

Implementando Paginação

Ao lidar com grandes conjuntos de dados, a paginação é crucial para a recuperação eficiente de dados. O Boto3 lida automaticamente com a paginação:


response = dynamodb.Table('MyTable').scan()
items = response.get('Items', [])
while 'LastEvaluatedKey' in response:
    response = dynamodb.Table('MyTable').scan(ExclusiveStartKey=response['LastEvaluatedKey'])
    items.extend(response.get('Items', []))

for item in items:
    print(item)

Utilizando Índices Secundários Globais

Os Índices Secundários Globais (GSIs) permitem consultar dados com base em atributos diferentes da chave primária. Criar um GSI envolve definir a chave do índice e os atributos de projeção durante a criação ou atualização da tabela. Consultar um GSI é semelhante a consultar a chave primária, mas você especifica o nome do índice.

Lidando Eficientemente com Conjuntos de Dados Grandes

Para desempenho ideal com grandes conjuntos de dados, utilize recursos como GSIs, paginação e escolha o método de consulta apropriado (Get, Query, Scan) com base em seus padrões de acesso. Evite varreduras desnecessárias de tabelas completas (Scan) sempre que possível.

Conclusão

Este guia forneceu uma visão geral abrangente da interação com o DynamoDB usando o Boto3 em Python. Lembre-se de consultar a documentação oficial da AWS para recursos avançados e melhores práticas. A compreensão do modelo de dados do DynamoDB e a escolha dos métodos de consulta apropriados são vitais para a construção de aplicativos eficientes e escaláveis.

Sumário

Introdução ao DynamoDB

Introdução ao Boto3

Criando Tabelas DynamoDB com Boto3

Excluindo Tabelas DynamoDB com Boto3

Listando Tabelas DynamoDB com Boto3

Consultando Dados no DynamoDB

Escaneando Dados no DynamoDB

Recuperando Itens Específicos

Implementando Paginação

Utilizando Índices Secundários Globais

Lidando Eficientemente com Conjuntos de Dados Grandes

Conclusão

Related posts:

Deixe um comentário Cancelar resposta