Knowledge

Buscas e listagens em MongoDB com stream em chunks: cursor, batchSize e getMore

Em MongoDB, buscas grandes não voltam "de uma vez": o banco responde em lotes por cursor, e sua API pode transmitir os dados em chunks conforme esses lotes chegam.

27/02/2026•10 min de leitura•Knowledge

Buscas e listagens em MongoDB com stream em chunks: cursor, batchSize e getMore

Resumo executivo

Em MongoDB, buscas grandes não voltam "de uma vez": o banco responde em lotes por cursor, e sua API pode transmitir os dados em chunks conforme esses lotes chegam.

Ultima atualizacao: 27/02/2026

Fontes

Resumo executivo

O ponto central que quase sempre gera confusão é este:

MongoDB não devolve uma busca grande inteira em uma única resposta.
O banco abre um cursor e retorna a primeira batelada (firstBatch).
Conforme o cliente consome, driver e servidor trocam chamadas getMore para buscar os próximos lotes.

Isso significa que "streaming" em listagens costuma ser um pipeline em duas camadas:

stream em lotes entre banco e aplicacao (cursor + getMore);
stream em chunks entre aplicacao e cliente HTTP (NDJSON/SSE/chunked transfer, por exemplo).

Quando esse modelo é entendido, fica muito mais fácil projetar APIs de listagem sem explodir memória nem latência.

1) Como o MongoDB realmente entrega resultados

Consultas como find() e aggregate() retornam cursor. Pela documentacao oficial:

o lote inicial padrão é o menor entre 101 documentos e 16 MiB;
lotes seguintes também respeitam limite de 16 MiB;
batchSize pode diminuir esse volume por rodada.

Em termos operacionais:

sua API envia find;
MongoDB retorna firstBatch + cursorId;
ao esgotar firstBatch, o driver emite getMore;
o ciclo se repete ate cursor encerrar.

Ou seja, o banco ja trabalha em "chunks" (batches), mesmo antes de voce decidir como responder no HTTP.

2) Busca/listagem em stream: o papel da sua API

A aplicacao pode escolher como expor esses dados para o cliente:

Para listagens grandes, o segundo e o terceiro caminho costumam ser mais robustos, porque permitem começar a enviar resposta antes do fim da consulta.

3) Exemplo pratico: listagem de pedidos em chunks

Imagine uma rota /orders/export.

Colecao: orders
Filtro: periodo + status
Ordenacao: por _id asc
Saida: NDJSON em streaming

tsimport { once } from 'node:events';

app.get('/orders/export', async (req, res) => {
  res.setHeader('Content-Type', 'application/x-ndjson; charset=utf-8');
  res.setHeader('Transfer-Encoding', 'chunked');

  const cursor = db.collection('orders')
    .find({ status: 'paid' })
    .sort({ _id: 1 })
    .batchSize(500);

  try {
    for await (const doc of cursor) {
      const ok = res.write(JSON.stringify(doc) + '\n');
      if (!ok) {
        await once(res, 'drain'); // backpressure do socket HTTP
      }
    }
    res.end();
  } finally {
    await cursor.close();
  }
});

O que acontece por baixo:

o driver nao busca um documento por vez no banco;
ele busca em lotes (chunks internos) e vai emitindo docs conforme consome o batch;
sua API pode escrever cada doc (ou grupos de docs) para o cliente em chunks HTTP.

4) Onde times costumam errar

Erro A: usar `toArray()` para tudo

Funciona em volume pequeno. Em volume grande, vira consumo alto de memória e tempo de resposta pior para o primeiro byte.

Erro B: `batchSize` extremo

muito pequeno: excesso de round trips (getMore) e overhead de rede;
muito grande: maior uso de memória e latência por lote.

batchSize deve ser calibrado por payload médio, rede e perfil de cliente.

Erro C: achar que chunked HTTP resolve query ruim

Se filtro/ordenação não usam índice adequado, o gargalo continua no banco. Streaming ajuda entrega progressiva, mas não corrige plano de execução ruim.

5) Como isso conversa com streaming de eventos (Kafka/Flink)

Para nao misturar conceitos:

listagem/busca: leitura sob demanda, cursor baseado em query;
event streaming: fluxo continuo de mudancas/eventos.

MongoDB entra nos dois cenarios:

query/list por cursor para APIs de leitura;
Change Streams para CDC e publicacao em pipelines de evento.

Os dois usam ideia de processamento progressivo, mas com contratos diferentes de consumo.

Checklist pratico para sua API de listagem MongoDB

Evitar toArray() em rotas de alto volume.
Usar cursor iteravel (for await) ou cursor.stream().
Ajustar batchSize com testes de latencia/memoria.
Implementar backpressure ao escrever chunks HTTP.
Fechar cursor explicitamente em cancelamento/erro.
Medir TTFB, throughput e memoria por endpoint.

Se você quer explicar corretamente "buscas e listagens em streaming no MongoDB", a formulação mais precisa é:

o MongoDB responde consulta em batches de cursor;
o driver recupera próximos lotes via **getMore**;
sua API pode transformar esse fluxo em chunks HTTP progressivos.

Pergunta para validar seu endpoint atual: hoje sua rota de listagem com maior volume transmite dados conforme chegam ou só responde quando terminou de carregar tudo em memória?

Fontes

cursor.batchSize() (MongoDB Docs) - documentacao oficial
getMore command (MongoDB Docs) - documentacao oficial
Cursors and Cursor Batches (MongoDB Docs) - documentacao oficial
Access Data From a Cursor - Node.js Driver (MongoDB Docs) - documentacao oficial
MongoDB Change Streams (MongoDB Docs) - documentacao oficial

Falar sobre software sob medida Ver mais artigos

Resumo executivo

Fontes

Resumo executivo

1) Como o MongoDB realmente entrega resultados

2) Busca/listagem em stream: o papel da sua API

3) Exemplo pratico: listagem de pedidos em chunks

4) Onde times costumam errar

Erro A: usar toArray() para tudo

Erro B: batchSize extremo

Erro C: achar que chunked HTTP resolve query ruim

5) Como isso conversa com streaming de eventos (Kafka/Flink)

Checklist pratico para sua API de listagem MongoDB

Fontes

Erro A: usar `toArray()` para tudo

Erro B: `batchSize` extremo