O café é um produto agrícola tradicional da economia brasileira que representa 2,4% do valor total das exportações e gera cerca de 8 milhões de empregos. O Brasil produz aproximadamente 40% do café comercializado no mercado internacional, além de ser o segundo maior consumidor mundial desse produto, particularmente da espécie Coffea arabica. Apesar da produção e consumo de C. arabica corresponder à cerca de 70% do mercado de café, essa espécie é altamente susceptível a nematóides, pragas e doenças. Portanto, há um crescente interesse de programas de melhoramento genético de cafeeiro em desenvolver variedades de C. arabica com resistência a nematóides, pragas e doenças. Um grande número de genes de resistência (genes R) de plantas já foi isolado e classificado em seis grupos denominados classe 1- classe 6. A maioria dos genes R conhecidos pertence à classe 2 e codifica proteínas que contêm os seguintes domínios em sua sequência: nucleotide binding site (NBS), leucine-rich repeat (LRR) e, no N-terminal, um domínio leucine-zipper (LZ) ou outra sequência coiled-coil (CC). A classe 1 compreende genes R homólogos ao membro tipo dessa classe, que é o gene R denominado pto, o qual codifica uma proteína que apresenta o domínio catalítico de serina/treonina quinase e regiões de miristilação em sua porção N-terminal. Seqüências aminoacídicas bem descritas correspondentes a genes R das classes 1 e 2 foram usadas para rastrear o Banco Brasileiro Genoma Funcional de Café (CafEST) por sequências de ESTs homólogas de genes R classes 1 e 2 em C. arabica. Os ESTs selecionados nessa busca foram agrupados em clusters (contigs ou singlets), os quais foram subseqüentemente analisados quanto a homologias com genes R disponíveis em banco de dados públicos. Alinhamentos múltiplos entre seqüências de aminoácidos deduzidas a partir das seqüências consensos dos contigs do tipo genes R do CafEST e seqüências homólogas foram usados para gerar filogramas. Os filogramas gerados indicam ambas as classes 1 e 2 de prováveis genes R de C. arabica estão consideravelmente representadas no CafEST, um vez que alto número total de ESTs foi recuperado quando do rastreio desse banco, ou seja, 525 ESTs homólogos a genes R classe 1, agrupados em 262 clusters (118 contigs e 144 singlets), e 449 ESTs homólogos a genes R classe 2 agrupados em 190 clusters (82 contigs e 108 singlets), perfazendo um total de 973 ESTs e 452 clusters (200 contigs e 252 singlets). Ademais, os filogramas mostram que as seqüências de aminoácido deduzidas a partir de contigs de C. arabica do CafEST podem ser agrupadas em quatro grupos de prováveis genes R classe 1 e quatro grupos de prováveis genes R classe 2, além de mostrar que as seqüências desses contigs são consideravelmente homólogas às seqüências conhecidas de genes R usadas para rastrear o CafEST. Análises de domínios típicos de proteínas R estão em andamento e poderão adicionar novas informações a estes dados. Esse estudo vai auxiliar o futuro desenvolvimento de marcadores moleculares correlacionados com marcadores genéticos de resistência em cafeeiro e o futuro isolamento de sequências completas de genes R de C. arabica que poderão ser usados em transgenia de plantas.
Coffee is a traditional agricultural product of the Brazilian economy which accounts for 2,4% of the total value of exportations and for the generation of 8 million jobs. Brazil produces ca. 40% of the coffee commercialized in the international market and is the world’s second biggest coffee consumer, particularly of the species Cofffea arabica. Although C. arabica production and consumption corresponds to approximately 70% of the coffee market, it is highly susceptible to nematodes, pests and diseases. Therefore, there is a raising interest of genetic breeding programs in developing C. arabica varieties with resistance to nematodes, pests and diseases. A large number of plant resistance genes (R genes) have already been isolated and classified into six categories denoted class 1-class 6. The majority of the R genes belong to the class 2 and encode proteins which contain the following domains in its sequence: nucleotide binding site (NBS), leucine-rich repeat (LRR) and an N-terminal putative leucine-zipper (LZ) or other coiled-coil (CC) sequence. Class 1 comprises the R genes homologous to the type member gene of this class, which is the gene denoted pto, that encodes a protein possessing a serine/threonine kinase catalytic region and a myristylation motif at its N-terminus. Well described aminoacid sequences corresponding to class 1 and 2 R genes were used to screen the Coffee Functional Genome Brazilian Database (CafEST) for class 1 and 2 R gene homologous EST sequences from C. arabica. The selected ESTs in this search were grouped into clusters (contigs ou singlets), which were subsequently analyzed in terms of homology with R genes available within public databases. Multi-alignments among the consensus deduced amino acid sequences of contigs representing probable CafEST R genes were used to generate phylograms. The phylograms generated indicate that both putative class 1 and 2 C. arabica R genes are csiderably represented within the CafEST, since a high number of class 1 and 2 R gene related ESTs was retrieved upon screening of this database, this is, 525 ESTs homologous to class 1 R genes clustered into 262 clusters (118 contigs and 144 singlets) and 449 ESTs homologous to class 2 R genes clustered into 190 clusters (82 contigs and 108 singlets), resulting in a total of 973 ESTs and 452 clusters (200 contigs and 252 singlets). Moreover, the phylograms show that the CafEST C. arabica contig sequences may be grouped in four groups of putative class 1 R genes and four groups of putative class 2 R genes, besides showing these contig sequences are considerably homologous to the sequences used to screen the CafEST. Undergoing analysis of typical R protein domains may add new information to the presented data. This study will help the future development of molecular markers correlated with genetic markers of resistance in coffee and the future isolation of complete R gene sequences from C. arabica., which may be used for plant genetic transformation.