Os dados estão se tornando cada vez mais importantes para a sociedade moderna e não há tempo melhor do que hoje para liberar o potencial que eles têm para a inovação. Essa crescente importância dos dados traz à imagem o conceito de “open data” (dados abertos), tema central deste artigo.
A iniciativa de análise de dados públicos e abertos dentro de uma ferramenta open source é algo que começou a ser muito discutido ultimamente e basicamente origina-se da necessidade de estruturação e disponibilização dos dados públicos para fornecer informações com valor analítico para o público geral. A ideia é que os dados devem estar disponíveis para que todos usem e publiquem, sem restrições de direitos autorais e patentes ou outros mecanismos de controle.
Nesse sentido, a inteligência analítica, conhecida como Analytics, agrega com o intuito de fornecer o tratamento necessário a esses dados, a fim de disponibiliza-los como informações de qualidade ao cidadão, permitindo maior flexibilidade e facilidade de análise, uma das maiores deficiências existentes nos sistemas públicos atuais.
Entrevistamos Alexandro Romeira, cofundador e responsável pelas áreas de negócios da empresa D2i, para compartilhar conosco um pouco de seu conhecimento e nos ajudar a esclarecer melhor alguns pontos a respeito desse assunto. Confira abaixo e fique por dentro!
Segundo um dos estudiosos do tema, David Eaves, os dados para serem abertos devem seguir três "leis" e oito princípios. As "leis" são:
E seus princípios:
É importante considerar que muitos dos princípios são destinados a dados públicos, por isso é necessário entender que todo dado que é público deve ser aberto, mas nem todo dado é público. Restrições razoáveis de privacidade, segurança e controle de acesso podem ser permitidas na forma regulada por estatutos.
O conceito de dados abertos (open data) tem por definição o seguinte contexto: “Dados abertos são dados que podem ser livremente usados, reutilizados e redistribuídos por qualquer pessoa - sujeitos, no máximo, à exigência de atribuição da fonte e compartilhamento pelas mesmas regras.”.
Esse movimento tem se fortalecido a cada momento, não só por governos como também por iniciativas privadas e, recentemente, no segmento financeiro com o movimento "open banking". Deixar os dados abertos, além de servir como subsídio para pesquisadores e sociedade, também mostra transparência para as operações, deixando os envolvidos com uma boa impressão no mercado. Isso é muito legal!
Os dados públicos brasileiros são uma fonte riquíssima de informações, passando desde dados cadastrais completos das empresas (CNPJ), informações de emprego e renda (RAIS e CAGED), dados de atendimentos de saúde, com tipos de doenças, dados completos de censos demográficos e entre outras muitas informações.
Para utilização dos dados públicos brasileiros, nossos desafios são insanos. Seguindo a edição da Lei nº 12.527/2011, foi efetivamente incorporado ao ordenamento brasileiro o tema da política de dados abertos governamentais, como reflexo inclusive dos compromissos assumidos externamente pelo Brasil com outros sete países (África do Sul, Estados Unidos, Filipinas, Indonésia, México, Noruega e Reino Unido) que participaram da parceria para Governo Aberto (Open Government Partnership), união esta que hoje congloba quase 80 países. É importante ressaltar que isso não segue as regras e leis comentadas anteriormente. Os dados são em sua maioria desatualizados, complexos, restritos e limitados, o que torna o uso em sistemas de Analytics uma grande caça ao tesouro.
Por sorte, muitos pesquisadores e empresas têm agregado essas informações de formas adequadas, trazendo o potencial desse valor para nossos modelos analíticos. O importante é não desistir. A Pesquisa e a curiosidade fazem parte desse processo, então vamos pegar nossas ferramentas e ir a campo.
Atualmente, todos podem se beneficiar desse movimento de várias formas, principalmente com o acesso a fontes de dados confiáveis, permitindo agregar essas informações aos dados das empresas, melhorando os modelos analíticos e preditivos, como machine learning e outras técnicas. Para isso, destacam-se algumas vantagens: dados abertos e públicos agregam valores importantes às suas análises, fundamentam a tomada de decisão, fomentam a Inteligência Competitiva (Análise de ambiente e mercado), reduzem o tempo para lançamento de novos produtos e permitem agregar valores externos, melhorando os modelos de Machine Learning e Analytics.
O dado é o novo petróleo e como tal ele precisa ser extraído, refinado e destinado para desenvolvimento de produtos específicos. Penso nos dados abertos como uma fonte inesgotável desse petróleo. É importante minerar e extrair todo o seu valor.
A relevância dos dados abertos para os sistemas de IA são enormes, eles agregam um volume de dados e possibilidades aos nossos modelos. As ferramentas de Inteligência Artificial se beneficiam muito dessas informações, já que correlacionam informações, até antes indisponíveis, melhorando nossos modelos analíticos.
Um exemplo prático é usar dados de RAIS / CAGED com CNAE (CNPJ) para verificar regiões com potencial de crescimento e crise, permitindo políticas públicas mais assertivas para preservar os empregos de uma região. Da mesma forma, os mesmos dados permitem que empresas busquem novas regiões para instalar suas operações de forma a conhecer o perfil de mão de obra, cargas tributárias, centros de especialização etc. Ou seja, os benefícios são enormes.
Para o futuro, acredito que teremos dados melhores, tanto em quantidade como em qualidade, já que os sistemas de Big Data estão cada vez mais reais e acessíveis, possibilitando aos cientistas de dados desenvolverem modelos mais rentáveis. Por último, a sociedade poderá se manifestar como utilizadores dessas informações, pressionando governos, empresas e bancos a serem mais transparentes.
Além disso, temos uma questão que não pode ser descartada: a adoção da LGPD (Lei Geral de Proteção de Dados), com previsão para vigorar a partir de agosto de 2020. Esse movimento não pode ser detido, já que os dados pessoais não estarão presentes nessas informações, porém é possível que muitos deixem de disponibilizar essas informações com uma base legal, por desconhecimento ou "preguiça". O dado é nosso, vamos nos promover!
Se você deseja aprimorar seus conhecimentos na área de TI e acompanhar as tendências, você está no lugar certo! Conheça os cursos de Ebusiness, a escola de Tecnologia da Informação da Live University. Aqui você encontra workshops, eventos, MBA, pós-graduação e muito mais. Clique aqui e comece já a sair da teoria e aplicar na prática!