Uso de aprendizado de máquina para otimização da seleção recorrente recíproca em milho
| dc.contributor.advisor | Souza, João Cândido de | |
| dc.contributor.referee | Carneiro, Vinícius Quintão | |
| dc.contributor.referee | Mendes, Marcela Pedroso | |
| dc.contributor.referee | Davide, Livia Maria Chamma | |
| dc.contributor.referee | Garbuglio, Deoclécio Domingos | |
| dc.creator | Pedro, César | |
| dc.date.accessioned | 2025-07-07T15:27:38Z | |
| dc.date.issued | 2025-01-30 | |
| dc.description.abstract | Reciprocal Recurrent Selection (RRS) has been widely used in maize breeding to maximize genetic potential and heterosis between populations. However, its effectiveness is intrinsically linked to the precise analysis of maize traits and progenies. In this context, machine learning-based methodologies and advanced statistical models can be jointly employed to optimize selection and predict performance in RRS programs. The main objective of this study was to optimize the selection process of maize progenies in the Federal University of Lavras RRS program using machine learning techniques. The experiments were conducted at the Federal University of Lavras between 2021 and 2024 using an Alpha Lattice design. The study was structured into four main stages: i) Analysis of the genetic potential of progenies through strategies based on the integration of the Best Subset Regression methodology to optimize the simultaneous selection of traits using selection indices. ii) Recombination of the top 15% of selected progenies followed by the generation of four intrapopulation and interpopulation crosses using the Bulk Pollen Pollination method. These populations were evaluated and subjected to genetic and factorial parameter analyses based on phenotypic and genetic correlations, aiming for the simultaneous selection of progenies with optimal phenotypic and genetic expression of their traits, optimized through K-means clustering. iii) Prediction of progeny yield using multilevel models in the context of nested breeding progenies within populations and populations within crosses. iv) Integrating high-throughput phenotyping with interpretable tree-based machine learning models and simultaneous selection indices. In conclusion, the integration of Best Subset Regression and simultaneous selection indices proved to be an effective approach for identifying promising lineages and enhancing the genetic progress of maize populations in RRS. Factorial selection strategies in populations demonstrated efficacy in identifying progenies with simultaneous phenotypic and genetic performance, contributing to the development of cultivars with greater agronomic and genetic stability. The multilevel model stood out as a tool with high predictive power, supporting the accurate selection of superior progenies. The integration of machine learning models with simultaneous selection indices maximized selection response by choosing maize progenies with optimal genetic gains. This study validates machine learning and its integration with statistical models as an innovative and effective strategy for optimizing RRS in maize, accelerating genetic breeding progress, and contributing to the development of high-performance hybrids. | |
| dc.description.areastematicasdaextensao | Meio ambiente | |
| dc.description.areastematicasdaextensao | Tecnologia e produção | |
| dc.description.notes | Arquivo retido, a pedido do autor, até abril de 2026. | |
| dc.description.ods | ODS 2: Fome zero e agricultura sustentável | |
| dc.description.ods | ODS 13: Ação contra a mudança global do clima | |
| dc.description.resumo | A Seleção Recorrente Recíproca (SRR) tem sido amplamente empregada no melhoramento genético do milho, com o objetivo de maximizar o potencial genético e a heterose entre populações. Contudo, sua eficácia está intrinsecamente ligada à análise precisa de caracteres e progênies de milho. Nesse contexto, metodologias baseadas em aprendizado de máquina e modelos estatísticos avançados podem ser conjuntamente utilizadas para otimizar a seleção e predizer o desempenho em programas de SRR. Este trabalho teve como objetivo principal otimizar o processo de seleção de progênies de milho no programa de SRR da Universidade Federal de Lavras, por meio do uso de técnicas de aprendizado de máquina. Os experimentos foram conduzidos na Universidade Federal de Lavras entre os anos de 2021 a 2024, em um delineamento Alpha Lattice. O estudo foi estruturado em quatro etapas principais: (i) Análise do potencial genético das progênies por meio de estratégias baseadas na integração da metodologia Best Subset Regression para otimização da seleção simultânea de características por meio de índices de seleção. (ii) Recombinação de 15% das progênies selecionadas, seguida da geração de quatro populações de intracruzamento e intercruzamento pelo método Bulk Pollen Pollination. Essas populações foram avaliadas e submetidas às análises de parâmetros genéticos e fatoriais baseadas em correlação fenotípica e genética, visando a seleção simultânea de progênies com expressão fenotípica e genética de suas características e otimização por agrupamento de K-means. (iii) Predição da produtividade das progênies por meio de modelos multiníveis no contexto de melhoramento aninhado (progênies dentro de populações e estas dentro de cruzamentos).(iv) Integração da fenotipagem de alto rendimento a modelos de aprendizado de máquina baseados em árvores interpretáveis e índices de seleção simultânea. Em conclusão, a integração das metodologias Best Subset Regression e índices de seleção simultânea é uma abordagem eficaz para orientar a identificação de linhagens promissoras e impulsionar o progresso genético das populações de milho em SRR. As estratégias de seleção fatorial em populações mostraram eficácia ao identificar progênies com desempenho simultâneo em relação à expressão fenotípica e genética, contribuindo para o desenvolvimento de cultivares de maior estabilidade agronômica e genética. O modelo multinível destacou-se como ferramenta com maior poder preditivo e suporte à seleção acurada de progênies superiores. A integração dos modelos de aprendizado de máquina com índices de seleção simultânea maximizou a resposta de seleção por meio da escolha de progênies de milho com ótimos ganhos genéticos. Este estudo valida o aprendizado de máquina e sua integração com modelos estatísticos como uma estratégia inovadora e eficaz para a otimização da SRR em milho, acelerando o progresso do melhoramento genético e contribuindo para o desenvolvimento de híbridos de elevado desempenho. | |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | |
| dc.description.tipodeimpacto | Tecnológico | |
| dc.identifier.citation | PEDRO, César. Uso de aprendizado de máquina para otimização da seleção recorrente recíproca em milho. 2025. 76 p. Tese (Doutorado em Genética e Melhoramento de Plantas) - Universidade Federal de Lavras, Lavras, 2025. | |
| dc.identifier.uri | https://repositorio.ufla.br/handle/1/60008 | |
| dc.language.iso | pt_BR | |
| dc.publisher | Universidade Federal de Lavras | |
| dc.publisher.college | Instituto de Ciências Naturais – ICN | |
| dc.publisher.country | brasil | |
| dc.publisher.initials | UFLA | |
| dc.publisher.program | Programa de Pós-Graduação em Genética e Melhoramento de Plantas | |
| dc.rights | Attribution 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/3.0/br/ | |
| dc.subject | Zea mays L. | |
| dc.subject | Índice de seleção simultânea | |
| dc.subject | Análise de fatores | |
| dc.subject | Modelos multiníveis | |
| dc.subject | Fenotipagem | |
| dc.subject | Selection index | |
| dc.subject | Factor analysis | |
| dc.subject | Multilevel models | |
| dc.subject | Phenotyping. | |
| dc.subject.cnpq | CIENCIAS BIOLOGICAS::BIOLOGIA GERAL | |
| dc.title | Uso de aprendizado de máquina para otimização da seleção recorrente recíproca em milho | |
| dc.title.alternative | Application of machine learning for optimizing reciprocal recurrent selection in maize | |
| dc.type | tese |
Arquivos
Licença do pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 955 B
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
