Navegando por Autor "Trindade, Laize Dariele de Lima"
Agora exibindo 1 - 2 de 2
- Resultados por página
- Opções de Ordenação
Item Identificação do consumo de dietas obesogênica e diabetogênica a partir de dados do hemograma com Machone Learning: uma abordagem pré-clínica(2025-02-19) Trindade, Laize Dariele de LimaO hemograma é um exame de rotina e geralmente não apresenta alterações significativas nas fases iniciais de doenças metabólicas, nem é utilizado diretamente para avaliar a qualidade dos alimentos ingeridos. Neste estudo, testamos e avaliamos a viabilidade de aplicar algoritmos de Machine Learning (Aprendizado de Máquina) para identificar o tipo de dieta consumida a partir de parâmetros obtidos do hemograma. O estudo foi conduzido em cinco etapas. Inicialmente, utilizamos 7 (sete) algoritmos diferentes de Machine Learning para analisar dados de hemogramas de 44 (quarenta e quatro) animais de laboratório, que foram submetidos a uma dieta padrão com (11%) de gordura ou uma dieta rica em gordura (58%), considerando 14 (quatorze) parâmetros do hemograma. Os resultados iniciais apresentaram uma acurácia de 88% na identificação da dieta. Após o balanceamento do conjunto de dados utilizando a técnica SMOTE (Synthetic Minority Over-sampling Technique), as acurácias atingiram 100%. Em seguida, realizamos a exclusão de algumas variáveis e observamos que o impacto da Glicemia de jejum e PESO variou entre os modelos, afetando principalmente algoritmos como K- vizinho mais próximo KNN, sem comprometer a performance de Regressão Logística RL. A remoção de variáveis como WBC, RBC, HGB, HCT não impactou negativamente os modelos, contribuindo para uma maior simplificação do processo. Para evitar overfitting (sobreajuste), dividimos os dados em conjuntos de treinamento, validação e teste, realizando uma média de 30 (trinta) repetições, e comparamos os modelos utilizando Datasets desbalanceados e balanceados. O Dataset balanceado proporcionou melhorias estatisticamente significativas na métrica de especificidade em grande parte dos modelos e na sensibilidade em alguns casos, conforme indicado pelo t-teste (p-valor ≤ 0,05). Portanto, verificamos que é possível identificar o tipo de dieta com base em apenas oito variáveis. Além disso, ao reduzir o número de variáveis para duas - neutrófilos e linfócitos - associadas a avaliação do processo inflamatório presente na obesidade e diabetes, os modelos ainda mantiveram um bom desempenho, com acurácia superior a 91% e equilíbrio nas cinco métricas analisadas. Toda a análise e o tratamento realizados neste estudo também podem ser considerados uma abordagem relevante para experimentos com pequeno tamanho amostral, um desafio recorrente em pesquisas pré-clínicas devido às restrições éticas e aos altos custos. Os métodos aplicados demonstraram sua capacidade de maximizar o uso dos dados disponíveis, enfrentando desafios como o desequilíbrio de classes e a limitação no número de amostras. Por fim, desenvolvemos um protótipo de aplicação web voltada para pesquisadores da área saúde e biológicas. Concluímos que a aplicação de técnicas de Machine Learning em parâmetros hematológicos obtidos a partir do hemograma pode servir como suporte à tomada de decisão para profissionais de saúde na identificação de padrões alimentares inadequados que possam induzir obesidade e diabetes.Item Modelo matemático canônico na precificação de recursos computacionais na nuvem no contexto IAAS(2020-08-03) Trindade, Laize Dariele de LimaInfrastructure-as-a-Service (IaaS) surgiu como uma alternativa para a redução de custos com a infraestrutura de hardware local das empresas, pois disponibiliza diferentes configurações de instâncias de máquinas virtuais (MVs) na nuvem. Entretanto, a grande quantidade de provedores e instâncias, aliado a falta de transparência na compreensão da política de preços oferecida, torna complexa a escolha pela melhor combinação provedor-plano-instância. Além das diferentes configurações disponibilizadas pelos provedores, outro fator pouco explorado pela comunidade científica é a localização física do datacenter e a sua influência na formação do preço final na instância. Diante deste problema, percebe-se a necessidade de um modelo matemático que descreva detalhadamente a forma de cálculo do valor final de cada instância. Com base neste cenário desenvolveu-se um modelo matemático canônico para representação dos provedores líderes do mercado. Primeiramente realizou-se a modelagem individual dos provedores líderes, com vistas a modelar a precificação das instâncias oferecidas pelos provedores de IaaS. A modelagem foi conduzida de modo empírico, inicialmente com a observação dos dados, visando conhecer e explorar as características dos provedores e os fatores que podem influenciar a composição do preço. Na análise do comportamento dos dados observou-se que o custo de uma instância é diretamente proporcional à quantidade de recursos computacionais contratados, isso se deve à especificidade de cada configuração/combinação do plano de instâncias oferecido pelo modelo IaaS. Variáveis qualitativas como o sistema operacional e a localização geográfica do datacenter são recursos que influenciam no preço final da instância. A localização do datacenter, por exemplo, possui regras específicas para cada provedor, pois depende da legislação vigente em cada país no que tange a política de acesso à dados. Já variáveis quantitativas como CPU, memória e meio de armazenamento permitem inúmeras combinações, alterando sistematicamente o valor final de cada instância. As verificações e análises do modelo canônico foram realizadas por meio da comparação entre o preço real e o preço do gerado pelo modelo, como isso foi possível perceber que os valores obtidos representaram as características dos recursos computacionais na composição dos planos de provedores estudados.