转录组测序质量评估中碱基含量和质量分布图怎么分析

2025-03-11 02:43:22
推荐回答(1个)
回答1:

采用新一代高通量测序技术Illumina HiSeq 2000对鸟巢蕨转录组(Asplenium nidus)进行测

序,共获得29 254 595个序列读取片段(reads),包含了5 908 586 517个碱基序列(bp)信息。对reads

进行序列组装,共获得42 907个单基因簇(Unigene),平均长度936 bp,序列信息达到了40.16 Mb。数

据库中的序列同源性比较表明,24 993个Unigene与其他物种的已知基因具有不同程度的同源性。鸟巢蕨

转录组中的Unigene根据GO功能大致可分为细胞组分、分子功能和生物学过程3大类51个分支,其中

有大量的Unigene与代谢进程、结合活性、催化活性和细胞进程相关。将Unigene与COG数据库进行比

对,根据其功能大致可分为24类。KEGG数据库作为参考,依据代谢途径可将Unigene定位到116个代

谢途径分支。SSR位点查找发现,从42 907个Unigene中共找到6 067个SSR位点。SSR不同重复基序

类型中,出现频率最高的为AG/CT,其次是AC/GT、A/T和AGG/CCT。针对这些序列,设计了20对引

物进行了扩增效率和多态性检测,其中7对引物在不同蕨类材料中表现出多态性。