Datasets disponíveis

Datasets disponíveis no grupo de Comportamento da API de Pessoas.

Os datasets do grupo Comportamento oferecem diferentes visões sobre a presença e a atividade digital do indivíduo, combinando métricas de intensidade, frequência, recência e qualificação do contexto. A seguir, os datasets disponíveis:


Presença Online

Fornece indicadores de presença digital em faixas estatísticas (A a H), que posicionam o indivíduo de forma relativa em uma distribuição estatística normal, onde A indica maior intensidade e recorrência da atividade online observada e H representa baixa ou rara ocorrência, com base em sinais agregados de comportamento na internet, como participação em compras e vendas online, intensidade de uso e frequência de aparições na web, sem atribuição de pesos qualitativos ou juízo de valor. O dataset inclui métricas temporais de passagens (30, 90, 180 e 365 dias) e versões evolutivas de score (v2 e v3), que aplicam normalização, redução de sazonalidade e janelas deslizantes para maior estabilidade e precisão analítica.

Presença Online Familiar

Aplica a mesma lógica estatística do dataset Presença Online, porém com foco no núcleo familiar, considerando sinais agregados de atividade digital conjunta relacionados a compras, vendas e interações em marketplaces. Permite análises de inclusão digital e engajamento online da família a partir de registros públicos, mantendo a interpretação relativa das faixas e a leitura baseada em intensidade, recorrência e distribuição populacional.

Passagens pela Web

Disponibiliza métricas sobre a quantidade, diversidade, recência e contexto das aparições do indivíduo na web, com base em registros públicos e sinais capturados ao longo do tempo pela BigDataCorp. As passagens representam ocorrências associadas ao CPF consultado e são qualificadas conforme o contexto observado (positivo, negativo ou neutro), com recortes temporais dinâmicos, apoiando análises de histórico digital, confiabilidade e risco.

Propensão à Aposta Online

Fornece um score de propensão em faixas estatísticas (A a H) que estima o nível relativo de engajamento potencial do indivíduo com apostas online, a partir da combinação de sinais observados de frequência, intensidade e recência, enriquecidos por variáveis socioeconômicas e demográficas. O dataset é utilizado em segmentação, gestão de risco, modelagem comportamental e prevenção, apoiando a identificação antecipada de perfis e padrões relevantes para decisões regulatórias, operacionais e analíticas, sem se basear em declaração explícita ou confirmação de comportamento.