Resumo:
Os marcadores moleculares são ferramentas importantes para acelerar os programas de melhoramento. Para o cafeeiro, uma espécie perene, o uso de marcadores é particularmente desejável devido ao tempo e recursos gastos para o lançamento de uma nova cultivar. Duas espécies do gênero Coffea são responsáveis por quase toda a produção de café: Coffea arabica e C. canephora. Contudo, para C. arabica, o número de marcadores polimórficos é relativamente baixo comparado a C. canephora e outras culturas, uma vez que a espécie apresenta baixa diversidade genética. Muitos estudos com marcadores genéticos foram feitos para analisar a diversidade da C. arabica, mas os resultados não foram eficientes para a discriminação genotípica detalhada e mapeamento genético. O Instituto Agronômico do Paraná (IAPAR) possui uma coleção de 132 acessos de C. arabica originários da Etiópia, que apresentam variabilidade fenotípica com potencial para serem utilizados para exploração da diversidade. Neste sentido, este estudo buscou analisar a diversidade nucleotídica pela identificação de polimorfismos, SNPs e INDELs, de uma população do centro de origem de C. arabica, associado com o sequenciamento de nova geração. O RNA-seq de dois tecidos, frutos e folhas, de quatro genótipos de C. arabica de uma população da Etiópia, C. arabica cv. Mundo Novo e de um dos seus ancestrais de C. arabica – C. eugenioides, foram sequenciados pela metodologia Illumina HiSeq2000. Os reads obtidos foram processados e posteriormente as sequências foram mapeadas em uma referência de C. canephora para identificação dos polimorfismos. Foram feitas duas estratégias: i) na primeira estratégia, foi utilizado uma ferramenta chamada SNiPloid com critérios de cobertura para o polimorfismo identificado e ii) uma segunda estratégia que considera os polimorfismos encontrados diretamente dos arquivos de detecção dos polimorfismos. Os resultados identificaram um número grande de polimorfismos. Na primeira estratégia, foram encontrados pelo menos 5.500 SNPs potenciais para a genotipagem e na segunda, 103.791 SNPs potenciais. Para essa última, ainda é necessário estabelecer critérios e filtros para escolher os polimorfismos que serão inicialmente genotipados. Os dados também mostraram a importância de utilizar um grupo mais diverso de genótipos associado com o sequenciamento de nova geração para detecção de SNPs. Este trabalho será importante para direcionar futuros trabalhos na caracterização da diversidade genética em C. arabica, além de estudos de mapeamento genético por associação.