- 4 minutos
- nov 13, 2024
Soluções de TI estão presentes em absolutamente todas as áreas que podemos imaginar. Na verdade, encontrar uma área que não envolva tecnologia pode ser uma tarefa difícil. Mas muitos não sabem da complexidade envolvida no desenvolvimento dessas soluções, já que engloba o uso de ferramentas complexas e dezenas de profissionais especializados, como o Machine Learning.
Nesse contexto, projetos que fazem uso de Inteligência Artificial se destacam por envolver maiores riscos, pela sua dificuldade e, muitas vezes, pela impossibilidade de garantir que o resultado final cumpra todos os requisitos necessários desde o primeiro dia.
Para diminuir esses riscos, utilizamos no time de Inovação da SantoDigital o modelo de processo de mineração CRISP-DM (Processo Padrão Inter-Indústrias para Mineração de Dados), que identifica e coordena as diferentes fases na concepção, desenvolvimento e implantação de um projeto de Mineração de Dados e, consequentemente, Inteligência Artificial e Machine Learning.
O CRISP-DM é um modelo que independe do domínio de aplicação e de tecnologia, podendo ser aplicado em qualquer contexto pela generalidade da sua proposta. Para isso, divide as tarefas necessárias em soluções de Mineração de Dados em 6 fases:
Essas fases auxiliam o entendimento do processo e fornecem um roteiro que será seguido durante o planejamento e execução de um projeto nessa área.
O processo se inicia com a fase de Entendimento do Negócio onde é feita a definição e entendimento tanto do contexto como do problema a ser resolvido para, em seguida, fazer o levantamento dos objetivos do projeto. É importante que nesse momento seja avaliada a necessidade de Machine Learning para a solução da demanda bem como os riscos sobre os dados necessários e os possíveis modelos que serão desenvolvidos. Essa etapa deve garantir o alinhamento das expectativas entre fornecedor e cliente sobre os resultados esperados.
Na fase de Entendimento dos Dados, é feito o recolhimento (quando os dados ainda não existem) e a familiarização com as amostras. Caso exista algum problema nessa etapa, o CRISP-DM sugere reavaliar a fase anterior. Naturalmente, um bom entendimento do problema a ser resolvido auxilia no entendimento dos dados e vice-versa.
A etapa seguinte é a de Preparação dos Dados, onde estes são tratados com base nos conhecimentos adquiridos na etapa anterior com o objetivo de gerar um modelo de Machine Learning. É uma etapa que pode se repetir diversas vezes durante o projeto e que normalmente ocupa de 60 a 70% do tempo total.
Os dados tratados são utilizados para a Modelagem através de ML e se os dados não são adequados, os modelos obtidos não possuem boa qualidade. Nesse caso, pode ser necessário retornar à etapa anterior e gerar um novo conjunto.
A Avaliação do modelo precisa mostrar com clareza que os requisitos do projeto foram atingidos. Caso contrário, é preciso verificar se o entendimento do problema está correto e como os objetivos poderão ser alcançados a partir desse ponto.
Por fim, quando o modelo é suficiente, o conhecimento adquirido é reunido e apresentado de maneira que o cliente possa entendê-lo e utilizá-lo. Dessa maneira, garantimos a Implantação e consumo correto da solução.
Com essas 6 fases, CRISP-DM incentiva melhores práticas e oferece às organizações a estrutura necessária para obter resultados melhores e mais rápidos da Mineração de Dados e Machine Learning.
Agora que você conhece o CRISP-DM e a sua importância, veja um bom exemplo de como esse modelo auxilia em cases de sucesso como o Santo iD, a solução de OCR e Identity da SantoDigital que ainda utiliza esse processo de ponta a ponta.
Quer conhecer mais sobre todas as soluções que a SantoDigital oferece? Entre em contato com nosso time especializado em cloud computing e leve inovação para sua empresa!