A história do surgimento da informática é um assunto de fascínio para muitas pessoas. As empresas pioneiras, a evolução dos modelos de computadores, suas características de hardware e software, como funcionavam e o que eram capazes de fazer. Ao consultar a literatura que descreve esses fatos históricos, o leitor pode confundir fato com ficção, pois a realidade histórica da tecnologia ocorreu como uma obra de arte.
Graças à evolução dos computadores, muitas outras áreas puderam se desenvolver e atingir o estágio do qual desfrutamos hoje. Uma das tecnologias desenvolvidas paralelamente nesse contexto histórico, com início datado em meados dos anos 70 e que foi de suma importância para o sucesso da informática, é a tecnologia dos sistemas de banco de dados.
Bancos de dados são, resumidamente, sistemas compostos por um repositório de armazenamento de dados e uma interface de comunicação para consulta, inserção e alteração de dados. Através deles, é possível armazenar cadastros e dados de configuração de um sistema, registrar transações e monitorar dados de processo em tempo real. Com essas ferramentas em mãos, as organizações puderam criar uma infinidade de aplicações, tanto voltadas à gestão de empresas, como para integração de sistemas em processos industriais, projetos científicos ou até mesmo redes sociais. O resultado prático desses empreendimentos é que, hoje, existe uma massa gigantesca de dados das mais diversas origens e significados (grandezas físicas capturadas por sensores, registros de transações bancárias, e-mails, imagens, vídeos, etc.) espalhados por aplicações em todo o mundo.
Em função da disseminação da tecnologia e da alta disponibilidade de dados, por exemplo, na Internet, criou-se o ditado popular de que vivemos na era da informação, mas a verdade é que ainda não chegamos na era da informação, mas sim na era dos dados. A maioria das aplicações gera dados sobre os processos para fins de registros de transações, rastreamento, controle e monitoramento. Os dados são consultados sob demanda para fins específicos e parte deles, muitas vezes, nem são utilizados. Esses dados extraídos da realidade podem apresentar padrões e correlações que, se percebidos, podem gerar riqueza (a solução de um problema de engenharia, a identificação de um gargalo produtivo, uma nova oportunidade de negócio, o diagnóstico de uma doença em seus estágios iniciais).
O fato é que a grande massa de dados disponível supera a nossa capacidade humana de análise. Os dados em si não constituem informação, a informação é o conhecimento obtido através dos dados. Podemos dizer, portanto, que o nosso mundo é rico em dados, porém, pobre em informação, e por isso surge a necessidade de novas técnicas para lidar com esse problema.
Felizmente, já existem técnicas avançadas para realizar a análise de dados. Uma dessas técnicas é objeto de estudo na Altus, através de uma iniciativa para buscar novas tecnologias e prototipar soluções observando as tendências do mercado global. A técnica em questão é denominada “mineração de dados”.
O termo mineração expressa bem o objetivo da técnica. Assim como a atividade de mineração permite encontrar pepitas de ouro ocultas no solo, a mineração de dados permite encontrar conhecimento oculto nos dados.
A mineração de dados é definida como uma das etapas do processo de descoberta do conhecimento através dos dados. Ela permite a caracterização e reconhecimento de padrões em um conjunto de dados, que são utilizados para dois objetivos principais: descritivo e preditivo.
Quando o objetivo é descritivo, a mineração de dados resultará na identificação de padrões que correlacionem variáveis de processo ou crie grupos ou classes de dados baseados na semelhança. Esses padrões podem ser úteis nas tomadas de decisão, uma vez que é possível identificar oportunidades, tendências, gargalos, pontos fortes, pontos fracos e causas de problemas.
Quando o objetivo é preditivo, a mineração de dados resultará na identificação de padrões e em um subconjunto de dados que pode servir para treinar uma Inteligência Artificial (como o RNA) para realizar a predição de um evento com certa antecedência. Aí entram, por exemplo, as tecnologias de manutenção preditiva, controle inteligente de estoque e sistemas de estimativa de demanda. Em ambas as aplicações, o resultado prático é a otimização de um processo, levando à economia de tempo, à redução de custos e, em alguns casos, à geração de novos modelos de negócio.
De forma objetiva, a análise de dados utilizando mineração de dados segue as seguintes etapas:
1. Limpeza: Onde ruídos ou dados inconsistentes são removidos.
2. Integração: Onde diversas fontes de dados (bancos de dados) são integradas ou centralizadas.
3. Seleção: Onde os dados relevantes para a análise são selecionados.
4. Transformação: Onde os dados previamente selecionados são transformados em formatos apropriados para mineração. Nessa etapa, entra o data warehouse (armazém de dados), que é uma tecnologia de banco de dados de estrutura cúbica (diferente do relacional) bastante usada em aplicações de Business Intelligence.
5. Mineração: Onde ferramentas de estatística, algoritmos matemáticos e de inteligência artificial (machine learning) são aplicados aos dados para extração de padrões.
6. Avaliação de padrões: Onde são identificados quais padrões extraídos representam conhecimento e são interessantes para o atingimento dos objetivos.
7. Apresentação dos resultados: Onde o conhecimento minerado será apresentado ao usuário final por meio de recursos visuais.
Para todas essas etapas é necessário estar alinhado aos objetivos da organização para reconhecer quais dados e padrões são interessantes. Por mais que nessa área se utilizem ferramentas automatizadas e inteligência artificial, a presença e experiência do cientista de dados, profissional especialista em análise de dados, é essencial em todas as etapas do processo. O perfil profissional de um cientista de dados é de uma pessoa que, além de habilidades em estatística e programação, consegue traduzir os anseios da alta gestão em objetivos claros para a análise de dados, o que permite que ele entregue resultados de altíssimo valor agregado. Por estas razões, está entre as profissões de TI mais bem remuneradas.
Alguns setores empresariais, como bancário e varejo, já possuem diversas aplicações de análise de dados, sem as quais não sobreviveriam diante da competitividade e da complexidade de suas operações. No setor da Automação Industrial, a análise de dados ainda não está tão presente, mas com a crescente tendência em direção à Indústria 4.0, é inevitável que as empresas comecem a explorar as vantagens e se beneficiar com as otimizações que a análise de dados pode proporcionar. Dessa forma, o setor estará caminhando em direção à era da informação, e nós queremos fazer parte dessa história.

About the author
Felipe Rubo entrou para a família Altus em 2014, na equipe de P&D. Hoje, ocupa a posição de Projetista de Produtos, atuando no projeto e desenvolvimento dos softwares embarcados em nossos controladores programáveis e módulos de E/S.