sábado, 24 de novembro de 2012

Algoritmos de mineração de dados


Algoritmos de mineração de dados são ferramentas que ajudam nas relações desenterrar úteis e padrões de qualquer corpo enorme de dados. Neste artigo, pretendo fornecer uma visão básica do que a mineração de dados é e como ele ajuda na análise de dados e extração de conhecimento a partir dele.

O que é Mineração de Dados?

A mineração de dados termo foi cunhado e muito sabiamente o próprio nome é auto-explicativo do conceito, se você olhar mais profundo sobre a analogia de mineração. Mineração do mundo real é cavar através de toneladas de terra e escombros, para encontrar minerais úteis da terra. Da mesma forma, a mineração de dados está cavando ou extrair informações úteis e padrões preditivos de uma inundação de dados. Seja qualquer negócio ou atividade humana, para planejar uma estratégia vencedora, é preciso analisar os dados disponíveis primas. A maioria das empresas lidar com grandes quantidades de dados de clientes de pesquisa ou dados relacionados ao desempenho da empresa. Para sobreviver no mundo de hoje de negócios competitivo, precisa de um conhecimento especializado que pode ajudá-lo a chegar com as estratégias de negócios adequadas adaptados às necessidades dos clientes. Programas de software baseado em algoritmos de mineração de dados pode identificar padrões dentro de grandes aglomerados de dados e extrair as inter-relações entre as diferentes categorias de dados. Isso pode ajudar na previsão de padrões futuros de tendências de mercado e dar à empresa uma vantagem sobre os concorrentes. Dados do mercado de ações é extraído por padrões preditivos que podem ajudar em previsões futuras. O motor de busca Google usa um tipo de algoritmos inteligentes de mineração de dados para selecionar as páginas web mais relevantes dos milhões disponíveis na Internet.

Quando se trata de projetos de pesquisa científica, análise de dados experimentais é importante para validar hipóteses científicas, para que as experiências são projetados. Um exemplo de um esforço científico que está usando algoritmos de mineração de dados é amplamente CERN máquina Large Hadron Collider ", o que gerou gigabytes de dados todos os dias. Analisando esses dados é automatizado através de algoritmos de mineração de dados engenhosamente concebido. As aplicações de algoritmos de mineração de dados são universais, como dados abunda em toda parte.

Tipos de Algoritmos em mineração de dados

Assim como a minerais da mina, é preciso usar as ferramentas certas que podem penetrar a terra e acesso a minerais, um precisa de um algoritmo de mineração de dados inteligente projetado que é adequado para o tipo de dados se está lidando. Os dados podem ser de vários tipos como numérica, alfabética, baseada em fatos e uma amálgama complexa de todos estes. Há uma variedade de programas de software com base em diversas técnicas de mineração de dados, que se pode escolher. Existem várias abordagens de classificação de dados e mineração-lo para extrair inter-relações. Aqui estão os dois principais tipos de algoritmos de mineração de dados.

Clássicos Algoritmos de mineração

A primeira classe de algoritmos de mineração de dados são aqueles que utilizam técnicas estatísticas e sentido velho liso comum para análise de dados. Um método primário é a regressão. Neste método, os dados apresentados é traçado e uma curva matemática que se encaixa que os dados são encontrados. Consequentemente, a equação da curva é utilizado para prever o futuro curso de fluxo de dados. Regressão é modelar os dados através do uso de uma equações matemáticas e existem vários tipos de técnicas de regressão usados ​​na extracção de dados.

Além de regressão, dois dos mais antigos clássicos algoritmos de mineração de dados são "cluster" e "vizinho mais próximo". Eles são bastante semelhantes em princípio. Algoritmos de mineração de dados com base no agrupamento usar o princípio de aglomeração como as coisas juntos em clusters de dados uniformes. É como um esquema de taxonomia, em princípio. O algoritmo "vizinho mais próximo" pode prever o futuro curso de dados, comparando-o com os dados mais antigos que é mais semelhante a ele. Predição é feita com base na ideia de que, o que acontece com o vizinho mais próximo de um fluxo de dados, pode acontecer novamente com o fluxo de dados de novo.

Modernos Algoritmos de mineração

Modernos algoritmos de mineração de dados são baseados principalmente no conceito de árvores de decisão. Ou seja, os dados são classificados com base em perguntas que filtra, em uma estrutura lógica. Os algoritmos são baseados na idéia de capturar a maioria dos tipos de dados usando uma estrutura complexa árvore de decisão. É uma rede de lógica que capta cada pequeno pedaço de dados. Ele permite um fluxo de dados para prever a partir de determinado quadro. Existem muitos tipos de algoritmos de extracção de dados, que são uma modificação desta ideia central.

Espero que este artigo lhe deu uma idéia aproximada do que algoritmos de mineração de dados podem fazer por você. Embora, eu não oferecem uma abrangente lista de algoritmos de mineração de dados, os tipos mencionados aqui são representativos da maioria. Selecione um software baseado em um algoritmo que é mais adequado para a sua área de negócio, de acordo com o tipo de dados que você precisa lidar. Muitos programas de software de banco de dados comerciais vêm com inbuilt ferramentas de mineração de dados, que você pode usar para o conhecimento de mineração de dados!...

Nenhum comentário:

Postar um comentário