Projetos Genoma EST são uma forma relativamente barata de inventariar os genes de um organismo. O grande volume de dados gerado por eles, entretanto, torna sua análise complicada. O Projeto Genoma Café brasileiro gerou 218.150 seqüências EST de C. arabica, C. canephora e C. racemosa. A análise realizada na Embrapa Recursos Genéticos e Biotecnologia descartou 63.380 seqüências e agrupou as 154.770 restantes em 45.366 grupos (UniGenes). Este trabalho apresenta o ferramental de análise disponibilizado até o momento aos usuários do projeto. Acessando o endereço https://alanine.cenargen.embrapa.br/cafEST/ e utilizando a senha designada pela coordenação do projeto, o usuário pode localizar rapidamente os dados de interesse partindo de diversos parâmetros, incluindo o nome do UniGene, o nome do clone seqüenciado, ou ainda palavras presentes na descrição de proteínas homólogas às do projeto. Buscas mais elaboradas incluem listar UniGenes específicos ou preferencialmente expressos em um conjunto de bibliotecas.
EST Genome Projects are a relatively inexpensive way to describe genes. The overwhelming amount of data coming from such a project complicates analyzing it. The Brazilian Coffee Genome Project generated 218,150 EST sequences from C. arabica, C. canephora e C. racemosa. The analysis done at Embrapa Genetic Resources and Biotechnology discarded 63,380 sequences and grouped the 154,770 remaining sequences on 45,366 clusters (UniGenes). This work describes the tools currently available to the project users. Going to https://alanine.cenargen.embrapa.br/cafEST/ with the username and password assigned by the project coordinators, one can promptly find the sequence of interesting by imputing data such as the UniGene name, sequenced clone name or even words used in the description of homologous protein. Powerful searched includes finding library specific or preferentially expressed UniGenes.