1. QTL( Trait Locus)及其定位原理、常用方法
QTL ( trait locus):代表染色体上影响数量性状的某个区段,区段内可能会有一个甚至多个影响数量性状的功能基因
QTL定位的目的:定位影响数量性状的功能基因
QTL定位的基本原理:当标记与控制特定性状基因连锁时,不同标记基因型的表型值存在显著差异,通过分析表型与标记间的相关性,就可以确定控制数量性状的基因在染色体上的位置及效应
QTL定位的基本步骤:分离世代群体建立,遗传标记检测,表型测定,统计分析,候选基因鉴定
2. LOD值( of the odds score)及如何确定其阈值?
LOD值: of the odds score,LOD=log10(L1/L0),L1是这个位点有QTL的概率,L0是这个位点无QTL的概率。如果LOD=3,则意味着这个位点有QTL的概率是无QTL的概率的1000倍。
LOD置信区间:2-LOD置信区间就是LOD波动曲线从峰的最大值降低2的时候(Y轴), 对应在遗传图谱上跨越的区域(X轴)。2-LOD置信区间大概对应99.8%的置信区间,即功能基因有99.8%概率已经落在这个区域内了
显著性阈值的确定—— test
3. 全基因组关联分析(-wide study, GWAS)的原理及优缺点
全基因组关联分析 (-Wide Study, GWAS)是连接遗传变异 ( , GVs)和表型 ()的主要工具。
4. 连锁不平衡( )会造成什么问题?为什么?
连锁不平衡(LD)是指给定种群中不同基因座(位点)上的等位基因之间的非随机关联性,即分属两个或两个以上基因座位的等位基因同时出现的频率高于预期的现象。
(1)连锁不平衡使得基因关联分析的解释变得困难,在进行基因关联分析时,如果存在LD,即使两个基因座之间没有功能相关性,它们也可能显示出关联。这使得解释不同基因座与特定性状之间的关系变得困难。
(2)遗传定位的精度受限,当一个基因座与一个性状相关的基因座紧密连锁时,很难确定哪个基因座是导致性状的真正原因,可能使得全基因组关联分析研究和基因定位研究中的假阳性和假阴性结果。
(3)多重比较校正,由于基因座之间的关联,相关性检验的结果可能会导致大量的假阳性关联,需要进行多种比较矫正,以降低错误发现的概率。
(4)遗传分析的复杂性增加:当进行基因型推断、基因频率估计和遗传模型建立时,需要考虑并纠正LD的影响,否则会导致偏误估计和错误的结果解释。
5. 群体结构及其影响?
6. 什么是混合线性模型?为何GWAS要用混合线性模型?
混合线性模型在GWAS中被广泛使用,可以有效地控制人口结构和近交效应的影响,并考虑随机效应的影响,从而提高关联分析的准确性和可靠性。
7. 亲缘关系()矩阵及其作用?
在使用混合线性模型进行全基因组关联分析时,亲缘关系矩阵的作用包括以下几个方面:
(1)控制人口结构和近交效应
(2)估计随机效应
(3)处理缺失数据
8. 哪些因素决定全基因组关联分析和QTL定位的精度?
最根本性的因素: (1)重组事件的数目;
可推及的其他因素:(2)标记的数目{要比重组事件多才能检测出重组};
(3)群体大小{群体大了,重组事件多};
(4)群体结构的影响{群体隔离和受选择都会降低重组率};
(5)群体的类型{不同的群体,重组率差别很大;是否有杂合基因型也有影响};
另一个因素是表型方面:(6)表型的遗传率和测量误差的影响;
还有就是方法是否合适:(7)模型的选择{线性模型/混合模型};
(8)位点之间是否存在复杂的互作。
9. 曼哈顿图和QQ-plot
在GWAS(基因组关联研究)中,plot(- plot,分位数-分位数图)是一种常用的统计图形,用于评估GWAS结果中的关联统计量是否偏离了预期的分布。
10. 缺失基因型填补()的概念
有话要说...