sábado, 14 de julho de 2012

Introdução a Data mining

Um diferencial competitivo é quando a empresa torna-se capaz de criar modelos de mineração de dados, ou seja, baseado em um histórico de dados encontra tendências ou padrões de comportamento de forma inteligente.

Empresas armazenam em seus bancos de dados diversas informações e acontecimentos em todos os departamentos, uma empresa financeira, por exemplo, armazenam informações de orçamento, contábil, financeiro, jurídico, clientes entre outros. A função do BI é juntar toda essa informação e consolidar em uma única base de dados para em seguida aplicar a mineração de dados.

Segundo (Fayyad et al. 1996) Data Mining é o processo não trivial de identificar, em dados, padrões válidos, novos, potencialmente úteis e ultimamente compreensíveis.

Conforme Groth (1998) e Han, Chen & Yu (1996) os passos necessários à Data Mining são representados na figura a seguir:

Existem diferentes tipos de métodos para mineração de dados, são elas: Classificação, Modelos de Relacionamento entre Variáveis, Análise de Agrupamento, Sumarização, Modelo de Dependência, Regras de Associação e Análise de Séries Temporais, conforme citação e definição feita por Fayyad et al. (1996a).

A maioria dos métodos são baseados em técnicas de reconhecimento de padrões e estatística, neurais, lógica e algoritmos genéticos.

De acordo com FAYYAD et al. (1996) os métodos tradicionais de Data Mining são:

  • Classificação: associa ou classifica um item a uma ou várias classes categóricas pré-definidas.

  • Modelos de Relacionamento entre Variáveis: associa um item a uma ou mais variáveis de predição de valores reais, consideradas variáveis independentes ou exploratórias.

  • Análise de Agrupamento (Cluster): associa um item a uma ou várias classes categóricas (ou clusters), determinando as classes pelos dados, independentemente da classificação pré-definida.

  • Sumarização: determina uma descrição compacta para um dado subconjunto. As medidas de posição e variabilidade são exemplos simples de sumarização.

  • Modelo de Dependência: descreve dependências significativas entre variáveis. Modelos de dependência existem em dois níveis: estruturado e quantitativo.

  • Regras de Associação: determinam relações entre campos de um banco de dados.

  • Análise de Séries Temporais: determina características sequenciais, como dados com dependência no tempo.

[]s

Um comentário:

BI COM VATAPÁ disse...

Aos colegas do Domina Tudo, para quem deseja iniciar no mundo da mineração de dados, indico o curso Mineração de Dados no site APRENDA VIRTUAL. Tem vídeoaulas e material para laboratório e treinamento, custo super baixo, ok! abraços e continuem fazendo este blog muito legal!!

www.aprendavirtual.ninehub.com