Documentação Técnica

E-mails - Estendido

Descrição

O dataset de E-mails Estendido retorna, além das informações contidas no antigo dataset de E-mails, uma série de informações adicionais sobre características gerais do próprio e-mail, tais como quantas vezes o e-mail foi visto (independente de ser junto com a entidade consultada ou não). Além disso, é retornado um objeto principal com uma série de informações agregadas sobre todos os e-mails encontrados para o indivíduo, simplificando trabalhos de modelagem e análise de dados.

Origem da Informação

Todos os e-mails disponibilizados pela BigData Corp. tem como origem algum conteúdo capturado do ambiente público da internet. Esse conteúdo pode ser o HTML de uma página (como um anúncio postado em um marketplace, ou uma mensagem postada em um fórum), um documento PDF (como um processo judicial ou um artigo acadêmico), ou qualquer outro elemento que contenha informações que possam ser extraídas. A evidência de origem da informação de contato e de sua associação com a entidade consultada está disponível mediante requisição para a equipe de atendimento.

Tabela de preços para esse dataset

Consultas Realizadas no MêsValor por consulta
1 - 10000R$ 0,050
10001 - 50000R$ 0,048
50001 - 100000R$ 0,046
100001 - 500000R$ 0,044
500001 - 1000000R$ 0,042
1000001 - 5000000R$ 34,000.00 (preço fixo)
5000001 e acimaEntre em contato

Parâmetros de consulta

A tabela abaixo detalha os campos aceitos na consulta a este dataset.

CampoDescriçãoValores PossíveisTipo de Campo
docDocumento de identificaçãoCPF🛑 Obrigatório
emailPermite um email adicional de entrada para a consulta. O propósito desse e-mail adicional é a pesquisa pelas informações globais genéricas do e-mail informado, independente de sua associação explícita com o número de documento específico consultado.Qualquer emailℹ️  Opcional
returnonlydifferentemailsPermite que sejam retornados apenas emails diferentes daquele(s) que foi(foram) informado(s) na chamada, Quando informado, esse parâmetro deve ser definido como true para que apenas os emails diferentes sejam retornados. Com esse parâmetro, você tem mais controle sobre o retorno dos dados, e evita ser cobrado por e-mails que já tenha dentro da sua base de dados.true, falseℹ️  Opcional
returnonlyvalidemailsDefine que deverão ser retornados apenas e-mails já validados e com status "válido". Isso garante que todos os e-mails que você irá receber como resultado tenham alta qualidade, evitando problemas de bounce e outros erros comuns em campanhas de e-mail marketing. Quando informado, esse parâmetro deve ser definido como true para que apenas os e-mails válidos sejam retornados.true, falseℹ️  Opcional
birthdateData de Nascimentoyyyy-MM-ddℹ️  Opcional
dateformatFormato da Datayyyy-MM-dd, dd/MM/yyyyℹ️  Opcional

Clique aqui para saber mais sobre os parâmetros de consulta da Plataforma de Dados.

Abaixo está um exemplo de como realizar a chamada apenas com os parâmetros obrigatórios:

{  
    "Datasets": "emails_extended",
    "q": "doc{CPF}"  
}  

Filtros

CampoDescrição do filtroTipo do filtroValores Possíveis do Filtro
TypeTipo do emailIgualcorporate, personal
isactiveSe o email está ativoIgualtrue, false
isrecentSe o email é recenteIgualtrue, false
ismainSe o email é principalIgualtrue, false
validationstatusStatus de validaçãoIgualVALID, ACCEPT_ALL, UNKNOWN, POSSIBLE_SPAM_TRAP, INVALID, HARDBOUNCE, RISKY, ACCEPT
domainDomínio do emailIgualgmail.com, yahoo.com.br, ...

Abaixo está um exemplo de como utilizar o parâmetro .filter(nome_do_campo=XXXX)

{  
    "Datasets": "emails_extended.filter(Type=corporate)",
    "q": "doc{CPF}"  
}  

Limite

Para utilizar o campo de limite basta utilizar o parâmetro .limit(x)

{  
    "Datasets": "emails_extended.limit(10)",
    "q": "doc{CPF}"  
}  

Emails Inválidos e Mudança de Status

Os e-mails retornados neste Dataset podem incluir tanto e-mails válidos quanto inválidos (o status de validação pode ser visto no campo "ValidationStatus"). Nós mantemos e-mail inválidos no retorno pois são importantes para a construção de modelos ou para processos de análise de risco ou de fraude, é interessante saber, por exemplo, que uma determinada entidade tem vários e-mails, e que a maioria desses são inválidos.
O nosso processo de validação dos e-mails acontece em vários passos, e o passo final inclui a comunicação com o servidor responsável por receber as mensagens daquele e-mail. A resposta que apresentamos sempre vem do servidor, e não temos controle sobre ela. Dito isso, algumas situações mais corriqueiras podem levar a uma mudança de status de um e-mail:

1. O e-mail pode ter sido desativado temporariamente porque uma pessoa saiu de férias;
2. O e-mail pode ter sido desabilitado porque a pessoa deixou a empresa, e reativado porque ela voltou a trabalhar lá;
3. O e-mail pode ter sido cancelado, mantido nesse estado de invalidez por um tempo, e depois reativado para funcionar como um "spam trap" para o domínio;
4. O servidor de e-mails referente ao domínio pode ter sido reconfigurado no modo "accept-all", que trata todas as contas embaixo do domínio como válidas;
5. O e-mail pode ter sido cancelado porque a pessoa saiu da empresa, e depois reativado porque havia alguma comunicação sensível que não poderia ser perdida;

O importante é lembrar que o status de validação é algo "vivo", que muda dinamicamente, daí a importância de realizar a validação de forma recorrente e periódica.

Prioridade de Contato

Os retornos da nossa API te permitem identificar o que seria o melhor contato para falar com alguém de algumas formas diferentes. Primeiro, retornamos para todos os contatos um atributo de "Prioridade" (Priority), que indica, na nossa avaliação, qual seria o contato prioritário para o indivíduo. Quanto mais baixo o número, melhor.
Segundo, você pode olhar para as passagens relacionadas com os contatos. No geral, quanto mais passagens uma informação de contato tem com uma entidade, maior a relevância daquele contato para ela. Ao mesmo tempo, as passagens também entregam informações de recência (quanto tempo tem que vimos o contato para a entidade), e da quantidade de entidades associadas à um contato. Um telefone muito recente, mas que esteja associado com 50 outras pessoas, por exemplo, talvez não seja o telefone ideal para você contatar alguém.
Finalmente, os status de validação são bastante úteis para identificar contatos bons ou ruins. Um e-mail, mesmo que fortemente associado com uma entidade pelas passagens, que está marcado como inválido, com certeza não é um bom contato. Temos diferentes atributos de validação para os e-mails, telefones e endereços, e vale a pena olhar cada um dos datasets para entender quais são.
Vale ressaltar que você deve pensar no que é o melhor contato para o seu processo específico. Para alguns processos, o melhor contato pode ser o que existe a mais tempo, para outros, o mais novo, e assim por diante.

Alguns campos, como o tipo do e-mail e o status de validação, tem valores predefinidos. Os valores possíveis para esses campos estão descritos acima.

CampoRetorno
ValidationStatusVALID, ACCEPT_ALL, UNKNOWN, POSSIBLE_SPAM_TRAP, INVALID, HARDBOUNCE, RISKY, ACCEPT
TypeWORK, PERSONAL
Language
Credentials
Click Try It! to start a request and see the response here!