Data mining é uma expressão inglesa ligada à informática cuja tradução é mineração de dados. Consiste em uma funcionalidade que agrega e organiza dados, encontrando neles padrões, associações, mudanças e anomalias relevantes.
A expressão data mining surgiu pela primeira vez em 1990 em comunidades de bases de dado. A mineração de dados é a etapa de análise do processo conhecido como KDD (Knowledge Discovery in Databases), sendo a sua tradução literal "Descoberta de Conhecimento em Bases de Dado".
O data mining pode ser divido em algumas etapas básicas que são: exploração, construção de modelo, definição de padrão e validação e verificação.
A mineração de dados é uma prática relativamente recente no mundo da computação, e utiliza técnicas de recuperação de informação, inteligência artificial, reconhecimento de padrões e de estatística para procurar correlações entre diferentes dados que permitam adquirir um conhecimento benéfico para uma empresa ou indivíduo. Para uma empresa, o data mining pode ser uma importante ferramenta que potencia a inovação e lucratividade.
A utilização da mineração de dados é bastante usual em grandes bases de dados, e o resultado final da sua utilização pode ser exibido através de regras, hipóteses, árvores de decisão, dendrogramas, etc.
Uma mineração de dados bem executada deve cumprir tarefas como: detecção de anomalias, aprendizagem da regra de associação (modelo de dependência), clustering (agrupamento), classificação, regressão e sumarização. O processo de data mining costuma ocorrer utilizando dados contidos dentro do data warehouse.
Existem várias empresas e softwares que se dedicam à mineração de dados, pois a identificação de padrões em bancos de dados é cada vez mais importante. No entanto, a identificação de padrões relevantes não é exclusivo do mundo informático. O cérebro humano, utiliza um processo semelhante para identificar padrões e adquirir conhecimento.
Nos últimos anos, a mineração de dados tem sido amplamente utilizada nas áreas da ciência e engenharia, tais como bioinformática, genética, medicina, educação e engenharia elétrica.
O conceito de data mining é muitas vezes associado à extração de informação relativa ao comportamento de pessoas. Por esse motivo, em algumas situações, a mineração de dados levanta aspectos legais e questões relativas à privacidade e ética. Apesar disso, muitas pessoas afirmam que a mineração de dados é eticamente neutra, pois não apresenta implicações éticas.
Exemplos reais de Data Mining
A mineração de dados é muitas vezes usada por empresas e organizações para a obtenção de conhecimento a respeito de utilizadores / funcionários / clientes. Por exemplo, no setor público é possível fazer o cruzamento de dados entre o estado civil de um funcionário e o salário que ele ganha, para verificar se isso tem influência na sua vida conjugal.
Empresas como cadeias de supermercados podem recorrer a esse cruzamento de dados para determinarem produtos que são comprados em conjunto. Se um cliente que compra o produto X também compra o produto Y, talvez seja uma boa ideia posicionar os dois produtos perto, para facilitar a compra por parte do cliente.
Fonte: http://www.significados.com.br/
Leia Mais ►