segunda-feira, 3 de setembro de 2012

Principais técnicas do Data Mining

  1. Arvore de decisões

A analise dos dados baseado em árvore de decisão trabalha com testes automáticos em todos os valores a fim de identificar um meio eficiente de construir classificadores que interpretem ou identifique grupos ou informações úteis baseadas nos valores de atributos de um conjunto de dados.

A utilização de árvore de decisão tem como princípio categorizar os dados ou mesmo na utilização de regras de fácil entendimento explicadas e traduzidas para linguagem natural.

Na verdade a essência do processo é uma série de declarações if-elses, que quando aplicados a um registro de uma base de dados , resultam na classificação daquele registro. Uma das características da árvore de decisão não é a sua construção a partir de classificação de um conjunto de dados, e sim a sua habilidade de aprendizado e treinamento. Segundo (CHAPELLE et al., 2006) O aprendizado indutivo de árvores de decisão é geralmente dividido em aprendizado supervisionado e não supervisionado.

Quando o aprendizado ou treinamento é finalizado, é possível alimentar sua árvore de decisão construída a partir de exemplos com novos casos a fim de classifica-los.

Exemplo:

clip_image001

2. Redes Neurais

As Redes Neurais Artificiais utilizam um conjunto de elementos de processamento (ou nós) análogos aos neurônios no cérebro. Estes elementos de processamento são interconectados em uma rede que pode identificar padrões nos dados uma vez expostos aos mesmos, ou seja, a rede aprende através da experiência, tais como as pessoas (DIN, 1998).

As Redes Neurais tentam identificar modelos ou padrões nos dados, sua abordagem computacional esta diretamente envolvida com estruturas matemáticas com habilidade de absorver o conhecimento.

Uma Rede Neural artificial consiste em diversos elementos interconectados chamados neurônios ou nós que possuem entrada , saída e processamento de dados e são organizados em camadas que aprendem através da modificação das conexões.

Exemplo:

clip_image001[5]

3 Análise de Agrupamento

Nessa técnica os dados são agrupados em clusters conforme identificado uma classificação ou grupo que são construídos com base na semelhança nos dados percebendo características de cada grupo. Dessa forma objetos dentro do mesmo grupo são os mais semelhantes possíveis, enquanto objetos de outros grupos são os mais deferentes possíveis.

Por exemplo, para analise de crédito supondo que os objetos dessa cadeia de relacionamento sejam os clientes, e que tenham vários atributos como, idade, salário e sexo analisando esses dados com data mining utilizando a técnica de agrupamento, podemos encontrar grupos de clientes com determinada faixa de idade enquadrado em uma baixa faixa salarial e outros grupos de cliente com alta faixa salarial com idade inferiores, podendo assim traçar perfis de concessão de crédito

Essa diferenciação dos clientes em grupos pode ser bastante útil, já que clientes de grupos diferentes, presumidamente, tendem a ter comportamentos bem diferentes (FREITAS, 2000).

4 Indução de Regras

Nessa técnica busca-se detectar padrões ou tendências dentro de um grupo de informação ou de regras que obedeçam a um critério previamente estabelecido por um consultor financeiro de risco de crédito.

Por exemplo, no caso de risco de crédito poderíamos ter o atributo tipo do cliente, sexo, idade e limite de crédito. Analisando essa variáveis o sistema de mineração de dados poderia identificar uma regra de previsão onde:

SE idade > 18 e Sexo = ‘M’ e Tipo = ‘A’

Limite de crédito de 20000 para compra de automóvel

5 Analise Estatística de séries temporais

A estatística é uma das técnicas mais usadas e mais antigas da mineração de dados esta diretamente ligada a todas as outras técnicas.

É definida como uma técnica baseada em modelos matemáticos para conhecimento dos dados, tendo fortemente o envolvimento do usuário.

[]s

Nenhum comentário: