分子生物学笔记完全版

第一章 基因的结构

第一节 基因和基因组

一、基因(gene) 是合成一种功能蛋白或 RNA 分子所必须的全部 DNA 序列. 一个典型的真核基因包括

①编码序列—外显子(exon)

②插入外显子之间的非编码序列—内合子(intron)

③5′-端和 3′-端非翻译区(UTR)

④调控序列(可位于上述三种序列中)

绝大多数真核基因是断裂基因(split-gene),外显子不连续。

二、基因组(genome)

一特定生物体的整套(单倍体)遗传物质的总和,

基因组的大小用全部 DNA 的碱基对总数表示。

人基因组 3X1 09(30 亿 bp),共编码约 10 万个基因。

每种真核生物的单倍体基因组中的全部DNA量称为C值,与进化的复杂性并不一致(C-value

Paradox)。

人类基因组计划(human genome project, HGP)

基因组学(genomics),结构基因组学(structural genomics)和功能基因组学(functional

genomics)。

蛋白质组(proteome)和蛋白质组学(proteomics)

第二节 真核生物基因组

一、真核生物基因组的特点:

①真核基因组 DNA 在细胞核内处于以核小体为基本单位的染色体结构中.

②真核基因组中,编码序列只占整个基因组的很小部分(2—3%),

二、真核基因组中 DNA 序列的分类 •

(一)高度重复序列(重复次数>lO5)

卫星 DNA(Satellite DNA)

(二)中度重复序列

1.中度重复序列的特点

①重复单位序列相似,但不完全一样,

②散在分布于基因组中.

③序列的长度和拷贝数非常不均一,

④中度重复序列一般具有种属特异性,可作为 DNA 标记.

⑤中度重复序列可能是转座元件(返座子),

2.中度重复序列的分类

①长散在重复序列(long interspersed repeated segments.) LINES

②短散在重复序列(Short interspersed repeated segments) SINES

SINES:长度<500bp,拷贝数>105.如人 Alu 序列

LINEs:长度>1000bp(可达 7Kb),拷贝数 104-105,如人 LINEl

(三)单拷贝序列(Unique Sequence)

包括大多数编码蛋白质的结构基因和基因间间隔序列,

发表回复

后才能评论