Última alteração: 2023-08-14
Resumo
No contexto das organizações, os dados são produzidos em função das necessidades. Muitas vezes, essa produção é imposta por requisitos impostos pelo exterior à própria organização. Por exemplo, no caso das obrigações legais, como as associadas aos impostos ou mesmo, em situações de necessidade de conformidade com os clientes ou os fornecedores (bem comuns no contexto da prestação de cuidados em contexto de saúde); neste caso, aspetos associados com determinados tipos de certificação existem, como a questão da segurança da informação (ISO 27000) ou, mais simples, pela certificação da atividade em processos (ISO 9000) – proporcionando sistemas de qualidade que melhoram a atividade das organizações – por via da normalização.
Estes requisitos exteriores à própria organização acabam por influenciar os dados extraídos da atividade da organização. Neste contexto, o reporte realizado em dados tem tendência a servir aspetos exteriores e potencial e não a representar de forma mais adequada o modo como a cada atividade é de facto realizada. À medida que os dados associados à atividade são explorados com base em técnicas mais sofisticadas, como as associadas com a aprendizagem máquina, mais crítico se pode tornar o diferencial entre os dados representarem a atividade ou serem apenas extraídos como dados associados com necessidades de reporte exterior.
Assim, este é o ponto essencial desta reflexão: que o reporte de dados da atividade da empresa, possa de facto corresponder à atividade interna e não apenas às necessidades de integração e reporte externo a fornecedores, clientes e Estado, no cumprimento de requisitos legais. E que este diferencial se torna mais crítico pela via da sofisticação de meios de exploração de dados e extração de informação e conhecimento para uso, exploração e pilotagem da organização.
Com o aparecimento de ferramentas mais eficientes e sofisticadas como é o caso do recurso à Ciência dos Dados (datascience) e, especificamente à aprendizagem de máquina (machine learning), que permite o uso de dados para previsão futura. Neste contexto a importância dos dados aumenta bem como se torna mais relevante que a sua representação seja fidedigna dos processos associados na atividade realizada.
O uso crescente de meios e capacidades digitais, impulsionados pelas tecnologias de informação e comunicação tornaram a atividade das organizações cada vez mais mediada pelo digital e praticamente todos os setores da atividade humana, sofreram um processo de digitalização. De facto, parece existir uma relação entre a digitalização e a agilidade das organizações, propondo três grandes grupos de agrupamentos em função da digitalização: capacidades analíticas de grandes dados (bigdata); ao nível da cadeia de suprimentos; e no papel das tecnologias de informação desempenhado para melhorar as organizações.
Assim e embora os sistemas de informação proporcionem quantidades significativas de dados, que resultam da atividade desenvolvida, pode suceder que esses dados que necessitamos para responder às questões realmente importantes, podem não existir ou não teram sido capturados da atividade realizada. A natureza das necessidades de dados poem mudam com as condições de negócio e da envolvente de pesssoas e organizações. Assim podemos afirmar que a natureza dos dados e os meios para os obter se alteram, também em resultado das circunstâncias das próprias organizações, num fenómeno que acelera as mudanças nos próprios dados e nas organizações e que pode ser pilotado pela elicitação dos dados a recolher ou a serem produzidos – os dados são afetados pelas questões que são colocadas e pelo modo como são respondidas.
Os dados gerados da atividade da organização são muito resultado dos requisitos associados com necessidades de informação para satisfação de conformidade exterior, como o caso de requisitos legais, de operação ou de reporte de atividade para faturação. Um exemplo é, no contexto hospital, a captura de dados das atividades e ações clínicas em função das necessidades de reporte para faturação dos diferentes sistemas de saúde, de modo a faturar a atividade de acordo com as regras e procedimentos estabelecidos por convenção com essas necessidades exteriores. Este exemplo ilustra a influência do exterior na organização e captura dos dados de atividade das organizações. Não é caso único, em geral, em atividades de valor onde o cliente é indireto, isto é, a atividade é realizada com foco numa entidade (individuo ou organização) que não é a entidade pagadora.
Este diferencial, que podem ser maior ou menor, em função da área ou setor de atividade e da influência e poder económico, número e complexidade das entidades pagadoras, pode distorcer os dados capturados da atividade. A este processo e ao enviesamente potencialmente associado, podemos associar o conceito de fidegnidade dos dados, isto é, qual o diferencial entre os dados que podem ser produzidos e a forma como são produzidos e organizados, está focada na atividade da organização ou se encontra focada no reporte a entidades exteriores. Este aspeto pode ter maiores consequências, em função das tecnologias e do uso e exploração dos dados por via da inteligência artificial.
As organizações, no decurso das suas atividades geram dados que permitem a posterior análise dos processos realizados, também do ponto de vista eficiência e eficácia. É precisamente neste contexto, que importa assegurar a fidegnidade dos dados em relação ao uso e exploração posterior dos dados de atividade da empresa. Ora, precisamente resultado da ciência dos dados e do recurso a ténicas como a aprendizagem máquina, os resultados da atividade podem ser previstos de um modo bem mais efetivo. Neste sentido, precisamos de recolher os dados de atividade da organização e quantos mais melhor.
Assim, todos os dados produzidos são de interesse e acabam por condicionar os resultados associados com o recurso a técnicas de aprendizagem máquina, que podem informar melhor as decisões de pilotagem da organização e da sua atividade. Como a recolha de dados e o seu tratamento é realizado de forma cada vez mais contínua, tal permite uma ação-reação mais rápida entre a produção dos dados e a sua análise. Deste modo, os sucessivos ciclos de retorno dos resultados da análise de dados tornam ainda mais exposta a organização à qualidade dos dados analisados e da sua capacidade de representação da atividade realizada – referida como fidegnidade dos dados – pois permite realizar ações em sequência da análise desses dados, cada vez mais próximas da sua produção.
É precisamente esta a contribuição proposta neste texto: que os dados produzidos devem focar a atividade realizada e não, como muitas vezes acontece, estarem focados no reporte para necessidade de conformidade de requisitos exteriores. Pode parecer subtil a diferença, mas torna-se relevante no contexto de um ciclo contínuo de análise de dados para ação direta sobre a atividade da empresa, ainda mais, num contexto de maior automação e da necessidade de garantir que a representação da realidade seja o mais fidedigna possível.
Neste contexto, emerge mais uma preocupação com os dados empresariais, que é a garantia de qualidade de representação da atividade, na fase da sua produção de dados; uma quase ironia que resulta do uso crescente de ferramentas mais sofisticadas para lidar com os dados e que nos podem levar ao distanciamento da realidade em vez de assegurar a sua condução, graças ao acumular de pequenas, quase impercetiveis diferenças, resultado dos próprios dados recolhidos e do seu tratamento e que, na sua totalidade nos proporcionam o suporte para a tomada de decisão que é distorcida pelos próprios dados e ferramentas utilizados para a representar.