在昨天的内容中,我们具体介绍了生物信息学中主流的几种组学内容,那么今天我们就从基因组学开始,带大家逐步开始学习啦,一定要跟上节奏哦!!
1基因型与等位基因的关系
等位基因
指位于同一基因座上的两种或更多种基因变异。每个基因座从父母那里分别继承一个等位基因。
举例:对于眼睛颜色的基因座,父母各自传递一个等位基因,比如“A”和“a”。这些等位基因分别可能表示不同的眼睛颜色(如“蓝色”或“棕色”)。
基因型
是指个体在某一特定基因座上的两种等位基因的组合。
举例:
如果一个人从父亲那继承了“A”,从母亲那继承了“a”,那么这个人就有“Aa”的基因型,表示该个体携带两个不同的等位基因。
AA:两个相同的等位基因(纯合子)。
Aa:两个不同的等位基因(杂合子)。
aa:两个相同的等位基因(纯合子)。

不同组合示意图
总结
等位基因是指同一基因座上的不同版本(例如A和a)。基因型则是指个体在该基因座上的具体基因组合(例如“AA”、“Aa”或“aa”)。
2遗传力:基因的影响有多大?
遗传力
遗传力表示基因对表型(如身高、智力或疾病风险)变异的贡献程度。它告诉我们基因在个体差异中占多大比例。遗传力的范围是从0到1。
举例:
假设身高的遗传力是 0.8,这意味着身高的80%差异由基因决定,剩下的20%差异可能与环境(如营养、运动等)有关。如果某种疾病的遗传力是 0.5,则说明该疾病的50%风险由遗传因素决定,其他50%由环境和生活方式等因素影响。
广义遗传力(H²)
衡量所有遗传因素对表型变异的影响,包括显性效应、基因间互作等。
举例: 如果身高的广义遗传力是0.9,表示几乎所有身高差异都受到基因的影响,少数情况可能受环境因素影响。
狭义遗传力(h²)
仅考虑加性效应,即每个等位基因独立作用对表型的影响。
举例:
对于一个基因,如果它的加性效应是0.4,那么每个等位基因的改变对表型的影响就会单独计算。
3
表型和SNP位点的定义与关系
表型
指个体外在可观察到的特征,通常包括物理特征和疾病状态。表型受基因和环境共同作用。
举例:
身高:基因决定一个人可能的身高范围,而最终身高还受到营养和运动等环境因素的影响。
疾病:如某种遗传性疾病(比如囊性纤维化),表型就是个体是否患病,这由多个基因变异和环境因素共同决定。
SNP位点
单核苷酸多态性(SNP)是基因组中常见的一类遗传变异,它指的是在某一位置上的碱基(A、T、C或G)的变异。每个人在这些位点上可能有不同的碱基,这些变异被称为SNP。
举例:在某个基因的特定位置,可能有两个不同的碱基C和T。如果一个人携带的是C,另一个人携带的是T,那么这个位置就存在一个SNP。
疾病相关SNP
某些SNP变异与特定疾病相关。例如,某些人可能在“C”或“T”位置携带不同的等位基因,这可能影响其罹患某种疾病的风险。
4SNV与SNP的关系
什么是SNV?
SNV 是 单核苷酸变异(Single Nucleotide Variation)的缩写,指的是基因组中某一个碱基发生的单个变化。SNV是一个广义术语,可以描述个体或群体中出现的任何单核苷酸变化。
特点:
1.SNV可以是稀有的或常见的。
2.SNV可能是功能性的(影响基因功能)或中性的(不影响基因功能)。
3.它可以发生在基因组的任何区域,包括编码区(基因部分)和非编码区(如启动子、内含子、调控区等)。
什么是SNP?
SNP 是 单核苷酸多态性(Single Nucleotide Polymorphism)的缩写,指的是群体中频率较高的SNV,即某个位置的变异在一个种群中至少有1%的个体携带。
特点:
1.SNP是SNV的一个子集,但它更强调在群体中的频率。
2.SNP通常用作遗传标记,广泛用于遗传研究(例如GWAS)。
3.因为它是群体中普遍存在的变异,通常不会直接导致严重的疾病或功能性破坏,但可能与某些性状相关联。
举例:
如果一个基因中的某个位点有两个版本(A和G),并且G的频率在种群中超过1%,则这个SNV被称为SNP。

关系图5
GWAS:全基因组关联研究的原理
全基因组关联研究
GWAS(全基因组关联研究)是一种用来寻找基因和表型(如疾病)之间关系的方法。其目标是识别特定基因位点(例如SNP)与某些特征或疾病的关联。
举例:
研究人员通过GWAS研究寻找与某种疾病(例如心脏病、糖尿病等)相关的基因位点。例如,发现某些特定SNP位点的人更容易患心脏病。
回归分析
GWAS通过回归分析模型,评估每个SNP与表型之间的关联强度。常见的回归模型包括线性回归(用于连续表型,如血压值)和逻辑回归(用于二分类表型,如是否患病)。
举例:
线性回归:分析血压值与基因型(如SNP 1的位置C/T)的关系。
逻辑回归:分析是否患病(0或1)与基因型(如“C”和“T”)的关系。
筛选显著SNP
根据计算出的p值,筛选出显著的SNP位点
曼哈顿图
展示SNP与表型的关联性,图中每个点代表一个SNP,y轴代表其与表型的关联强度(通常是log(p-value)),越高的点表示关联越强。

曼哈顿图