Analisamos os desenvolvimentos em Deep Learning fim a fim para cibersegurança e fornecemos percepções sobre sua eficácia atual e futura.
A aplicação de inteligência artificial (IA) em vários setores trouxe inegáveis melhorias significativas na era digital. Com a capacidade de interpretar e tomar decisões complexas com base em dados, as tecnologias de IA permitiram que tarefas ou processos funcionassem com inteligência quase humana, aumentando a velocidade, além de inovar as operações de negócios ao adicionar experiências valiosas do usuário.
O setor de cibersegurança é um dos muitos que se beneficiaram com a IA. Se feita de forma eficiente, a aplicação de IA pode fornecer às soluções de cibersegurança capacidade aprimorada de detectar uma ampla gama de ameaças, incluindo aquelas que são novas ou não classificadas. O processo de uso eficiente de IA geralmente envolve modelos de última geração, um método iterativo para melhorar a precisão do modelo e dados rotulados com precisão, entre outros. Para muitas empresas de segurança cibernética que usam IA, os referidos requisitos – particularmente o processo de rotular dados com precisão – são suportados por especialistas em ameaças que pré-processam os dados, os extraem e projetam recursos, entre outras tarefas manuais ou técnicas que produzem entradas manuais. Em essência, essas entradas realizadas manualmente por especialistas permitem que os modelos funcionem com menos ambiguidade, admitindo que a estrutura subjacente dos dados seja representada com precisão, aprimorando, assim, os recursos de detecção de ameaças.
Entretanto, o surgimento de novos métodos para detectar ameaças usando IA desafia a necessidade de contribuições feitas manualmente por especialistas. Especificamente, esses métodos envolvem soluções de deep learning de fim a fim, que estão sendo apontadas por alguns como a próxima grande novidade na detecção de malware. No pipeline de tais soluções, as contribuições feitas à mão por experts estão fora do circuito e são substituídas por outras fornecidas por procedimentos automatizados. Embora isso esteja se tornando mais aceitável em alguns setores que usam IA para vários fins, a ausência de contribuições manuais de especialistas levanta a questão de se essas contribuições ainda são relevantes no processo de desenvolvimento de uma solução de cibersegurança baseada em IA eficiente.
Deep learning de fim a fim como solução para detecção de malware
Algumas pesquisas sobre deep learning de fim a fim, propõem uma metodologia que não depende de contribuições manuais de especialistas no processo de teste e treinamento de amostras que são alimentadas para modelos de IA. Em uma abordagem conjunta entre Intel e Microsoft, sua equipe inspecionou arquivos binários de malware que foram plotados como imagens em tons de cinza, revelando as semelhanças de texturas e estruturas, bem como diferenças, tanto entre binários das mesmas famílias de malware, quanto em diferentes, ou entre malware e software benigno. Isso evita o processo de engenharia manual de recursos, economizando tempo e reduzindo os esforços para empresas de cibersegurança. Outra abordagem envolve um processo em que o mecanismo era alimentado com uma entrada bruta composta de valores de byte brutos e uma saída produzida que mostrava a classificação de um arquivo malicioso ou benigno.
Por motivos de confidencialidade, detalhes adicionais sobre os arquivos usados para treinamento e teste dos modelos de deep learning de fim a fim não foram divulgados. Infelizmente, isso torna difícil obter uma visão mais profunda dos resultados de desempenho dos modelos de IA que eles usaram. Em particular, a referida pesquisa não foi capaz de divulgar a porcentagem de amostras de malware desconhecidas facilmente detectadas, bem como a porcentagem daqueles que são difíceis de detectar. Essas informações são cruciais, pois podem determinar se tais soluções são suficientes para revelar de forma proativa ameaças complexas e desconhecidas que os cibercriminosos estão continuamente desenvolvendo nos dias atuais.
Medindo as taxas de detecção de um modelo de deep learning de fim a fim
Em uma tentativa de validar um dos primeiros modelos fim a fim, os especialistas da Trend Micro conduziram um experimento em 2017. Eles usaram conjuntos de dados experimentais que consistiam em amostras cuidadosamente coletadas. Os conjuntos de dados usados foram para treinamento e teste de duas abordagens: uma com deep learning de fim a fim e outra com uma abordagem de machine learning que inclui recurso manual especializado. Este último será denominado “Expert AI” nas seções posteriores. Deve-se observar que os conjuntos de dados foram organizados de duas maneiras de acordo com os resultados de clustering do Trend Micro Locality Sensitive Hashing (TLSH). Isso foi feito para comparar e demonstrar uma imagem mais clara do desempenho de detecção das duas abordagens.
Os datasets foram organizados em Tipo A e Tipo B. Para os de Tipo A, os especialistas da Trend Micro selecionaram uma amostra de cada cluster TLSH para formar o conjunto de treinamento, enquanto o restante das amostras foi selecionado de cada cluster para formar o conjunto de teste. Isso significa que cada amostra no dataset teve um resultado semelhante no conjunto de treinamento. Para o Tipo B, os especialistas fizeram experiências com clusters selecionados como um todo no conjunto de dados de treinamento e teste. Isso significa que era possível que as amostras nos dados de teste fossem significativamente diferentes daquelas nos dados de treinamento. Teoricamente falando, os dados de teste do Tipo A poderiam ter sido mais fáceis de detectar se o modelo já tivesse visto os dados de treinamento do Tipo A porque são muito semelhantes aos dados de teste.
Os resultados do experimento mostraram que, para o Tipo A, o deep learning de fim a fim alcançou 99,39% de precisão, enquanto o Expert AI atingiu 99,87%.
Figura 1. Datasets experimentais, nomeados como Tipo A e Tipo B, foram treinados e testados usando Expert AI e abordagens de deep learning de fim a fim.
Para o Tipo B, o deep learning de fim a fim alcançou 92,49% de precisão. Por outro lado, o Expert AI atingiu 95,21%. Embora haja apenas uma diferença extremamente pequena nos resultados de desempenho deep learning de fim a fim e Expert AI para o Tipo A, os resultados para o Tipo B mostraram que o Expert AI se saiu melhor – com uma vantagem de 2,72% – do que deep learning de fim a fim em termos de detecção de amostras difíceis e desconhecidas. O experimento concluiu que o Expert AI, que fez uso da entrada manual por especialistas, teve um desempenho melhor do que o modelo aproximado de deep learning de fim a fim em termos de detecção de amostras desconhecidas.
Modelo | Tipo A | Tipo B |
Expert AI | 99,87% | 99,39% |
Deep learning de fim a fim | 95,21% | 92,49% |
Tabela 1. Os resultados do experimento mostraram que o Expert AI tem um desempenho melhor do que o deep learning de fim a fim em termos de detecção de amostras desconhecidas.
Uma pesquisa conduzida em 2018 que experimentou um dataset de 20 milhões de arquivos Portable Executable (PE) de meio megabyte descompactados ecoou as descobertas do experimento da Trend Micro de 2017. O primeiro concluiu que uma abordagem de aprendizado de fim a fim ainda estava um pouco atrás de um pipeline de machine learning tradicional que fazia uso de recursos manuais.
O deep learning de fim a fim é inovador, mas fica um pouco atrás de uma solução de IA com suporte de especialistas
No experimento da Trend Micro mencionado anteriormente, as descobertas revelaram que o deep learning de fim a fim é uma abordagem inovadora, sem dizer impressionante, para a detecção de malware em termos de cancelamento de ruído. No entanto, o experimento também mostrou que, ao detectar ameaças desconhecidas, uma solução de deep learning de fim a fim é menos precisa em comparação com uma solução de IA que é suportada por informações feitas manualmente por especialistas.
Por outro lado, as entidades de cibersegurança interessadas em deep learning de fim a fim devem investir em uma nova arquitetura de rede ou esquemas de aprendizado para aprimorar suas tecnologias de detecção de malware. Algumas dessas entidades, por exemplo, podem ser fornecedores que usam técnicas de aprendizagem de transferência do domínio da visão computacional para reduzir a quantidade de dados de consumo necessários para treinar um modelo. Da perspectiva da Trend Micro, quando o deep learning é usado para detectar com sucesso um objeto em um arquivo de imagem bruto, deve-se destacar que o arquivo de imagem bruto em discussão é, na verdade, os valores da matriz de bitmap extraídos de arquivos de imagem (por exemplo, JPEG, TIFF e PNG) formatados por meio de analisadores projetados por especialistas. Se o deep learning for aplicado diretamente a formatos de arquivo complexos, como JPEG, TIFF e PNG, é provável que o desempenho do modelo caia. Portanto, ao detectar malware em um formato de arquivo do Windows PE ou um arquivo executável Linux ELF que tem diversas variantes em diferentes versões do sistema operacional, simplesmente usar o deep learning para aprender com os arquivos brutos resultará em uma capacidade de detecção menos suficiente. Esse é apenas um dos problemas que os fornecedores precisam examinar de perto, caso a contribuição manual de especialistas seja removida do pipeline.
Por enquanto, pode-se supor que uma estratégia de cibersegurança mais eficaz envolve a colaboração entre IA e experts em ameaças, especialmente no cenário de ameaças atual, onde os agentes de ameaças estão empregando cada vez mais ameaças de malware modularizadas. Em ataques do tipo advanced persistent threat (APT), por exemplo, uma parte do malware é dividida em muitos componentes que podem ser espalhados por diferentes vetores de ataque. Existe a possibilidade de que cada componente seja detectado como um arquivo benigno por soluções tradicionais ou insuficientes de cibersegurança. Em tal cenário, uma solução deep learning de fim a fim pode ter suas limitações.
AI e análises de segurança especializadas no Trend Micro™ XDR
O Trend Micro XDR, uma solução multicamadas que emprega IA e informações manuais de especialistas, pode ser usada pelas organizações para quebrar os silos de detecção a fim de montar e contextualizar esses componentes de malware dispersos. Em particular, ele faz isso aplicando análises especializadas aos dados de atividades coletados por e-mails, redes, endpoints e servidores, produzindo alertas correlacionados e acionáveis. O XDR combina inteligência global de ameaças e regras de detecção especializada continuamente atualizadas para maximizar o poder dos modelos analíticos.
Além disso, o XDR fornece uma plataforma única para investigação visando obter o contexto completo necessário para uma visão centrada no ataque de uma cadeia inteira de eventos nas camadas de segurança. O XDR também permite que as organizações executem uma análise de causa raiz, examinem o perfil de execução, identifiquem o escopo do impacto e obtenham resposta de um único lugar.