A Mineração de dados é a organização e classificação de dados, transformando-os em informação útil para aplicá-la da melhor forma. Nós do Empresômetro temos uma enorme base de dados de empresas do Brasil, alimentada e atualizada constantemente.
O que é
Mineração de dados, prospecção de dados ou data mining são termos diferentes para a mesma prática, que aqui trataremos simplesmente como Mineração de Dados. Basicamente, a mineração de dados significa obter todos os dados já captados e organizá-lo de maneira mais lógica, viável e útil para cada uso e aplicação.
Parar organizar esses dados de maneira lógica, após recolher todos os dados obtidos (muitas vezes através da prospecção de clientes, cadastros, mailing ou de Consulta de CNPJ), devemos separar o joio do trigo estabelecendo regras de associação ou sequências temporais para encontrar relacionamentos sistemáticos entre as variáveis. Tudo isso, sempre levando em consideração a necessidade e o objetivo em se utilizar os dados obtidos após a mineração de dados.
Durante a mineração de dados, é necessário validar a consistência dos dados obtidos, para evitar duplicidade de dados, dados desatualizados ou desperdício de tempo ao empregar esses dados para diversos fins.
Quando completa a mineração de dados, é possível obter os seguintes tipos de informação:
- INFORMAÇÕES ASSOCIATIVAS: Dados associados a um único evento. Exemplo: Verifica-se que determinada empresa / indústria de chocolate dobra seu faturamento na época da páscoa. Com essa informação, os potenciais fornecedores podem ofertar seus produtos em tempo correto para a empresa de chocolate.
- INFORMAÇÕES SEQUENCIAIS: Na sequência os eventos estão relacionados ao longo do tempo. Pode-se perceber que a mesma empresa / indústria de chocolate citada acima, ainda mantém o dobro do seu faturamento uma semana após a páscoa e que junto com o chocolate, são compradas embalagem para presentes.
- INFORMAÇÕES CLASSIFICADAS: Reconhece modelos que descrevem o grupo ao qual o item participa por meio do exame dos itens já classificados e pela inferência de um conjunto de regras. Exemplo: Empresas de telefonia verificam e classificam determinado comportamento de clientes que provavelmente podem mudar de operadora. Assim poderão prever com antecedência clientes que irão abandonar a operadora e então criar um plano para conter a fuga de clientes.
- INFORMAÇÕES AGLOMERADAS: Consiste em dividir e agrupar as informações com base nos dados. Por exemplo: Após a obtenção de informações de diversas empresas, agrupar as informações de acordo com o dado de faturamento, regime tributário, classificação econômica. É uma forma de agrupar, organizar e segmentar as informações.
- PROGNÓSTICO: Ainda que os tipos de informações obtidas através da mineração de dados envolvem previsões, os prognósticos utilizam essas previsões de modo alternado. Parte da concepção de uma série de valores existentes atribuídos para prever quais serão os outros valores. Por exemplo: Um prognóstico pode descobrir padrões nos dados que ajudam as empresas a prospectar clientes que tendem a aumentar seu faturamento num futuro período de tempo.
Aqui no Empresômetro, utilizamos a mineração de dados em grandes bases de dados (oriundos de banco de dados ou data warehouse) e o resultado deste processo pode ser demonstrado através de hipóteses, sistemas para tomada de decisão, dendrograma etc. O resultado pode ser apresentado em planilhas, formulários, listas, mailing, mapas etc.