常规技术,但是是非常重要的技术,支持!
本人觉得引物设计对于PCR的成功非常重要,所以将一点引物设计的知识和大家分享
1.寡核苷酸的优化设计
在核酸分子杂交、DNA序列测定和通过PCR放大DNA片段等实验中,都需要使用寡核苷酸作为探针或引物,而对这些反应的质量起最重要影响作用的,就是这些寡核苷酸探针或引物。用优化的寡核苷酸进行实验能够很快得到好的结果,而用不够合适的寡核苷酸时,常常得出似是而非的结果,不仅大大增加了后续实验的工作量,还可能一无所获。
怎样优化设计寡核苷酸呢?至少有下列几个方面的问题需要考虑。
1. 估测可能形成的DNA或RNA双链的稳定性
寡核苷酸,无论是DNA的或者RNA的,都有形成双链结构的潜在可能性,正如下面反复提到的,这种结构对寡核苷酸的作用有很大影响。所以,预测这种结构的稳定性对设计和优化寡核苷酸就很重要。在一个双链结构中,碱基对的相对稳定性是由其邻近碱基决定的。在热动力学中,这样的性质以双链形成时的自由能(ΔG)来表示。现在,大多采用 Breslauer等人提出的,以最接近的相邻核苷酸的动力学数值(自由能)来预测双链稳定性的方法。为简化起见,所有的计算都在25 ℃条件下进行。此时,最接近的相邻核苷酸的自由能是:
此主题相关图片如下:
ΔG(kcal/mol)
例如,双链d(ACGG/CCGT)的ΔG是:
ΔG(ACGG)=ΔG(AC)+ΔG(CG)+ΔG(GG)=-(1.3+3.6+3.1)=-8.0 kcal/mol
此计算方法特别适用于测定其3′末端会形成双链的引物的相容性。也可以用来计算发夹环结构的ΔG。不过,这时需要根据环区内核苷酸的数量添加一定的数值。如3个核苷酸时为5.2 kcal/mol;4个时为4.5;5个为4.4;6个是4.3;7和8个为4.1 kcal/mo1。
2. 选择引物的一般规则
设计和选择引物时有5个要素必需注意。
2.1 引物的3′末端不互补 引物的3′末端一定不能有很大的互补性,因为它们的互补会形成引物二聚体,这就会带来很大的问题,例如合成出非专一的产物,极大地减少所期望产物的得量。有实验表明,3′末端双链的ΔG是0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%,到-8时少于20%,而-10时,接近于0。虽然产量还取决于其他参数,如退火温度、引物的专一性等等,但是用Taq聚合酶操作时,由于它的工作能力很强,能够在很短的时间内就识别3′末端互补的双链区并发动聚合反应,即使3′末端双链的稳定性很差也不能阻碍它的作用,所以这时产量对二聚体的形成就有很大的依赖性。
2.2 引物分子内不互补 应当尽量不用会通过释放能量而形成分子内双链结构的寡核苷酸。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。
2.3 引物的组分、解链温度和长度 普遍认为PCR引物应当有50%的GC/AT比率。其实,这是不对的。以人基因组DNA为模板,用81% AT的引物可以产生单一的,专一的,长250 bp,含有70% AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。
要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500 bp,选用短的(16~18 mer)的引物:若产物长5 kb,则用24 mer的引物。有人用20~23 mer引物得到40 kb的产物。但是,引物较长时,如果不借助引物选择的计算机软件帮助,就很难确定一对引物是否会形成二聚体,是否有自身互补性以及专一性如何。于是,用眼睛选出来的寡核苷酸放大长片段DNA时就会使引物彼此引发而不是延伸模板,得出非专一产物。通过下述的观察内部稳定性原理可以极大地减少这种问题。
2.4 引物的内部稳定性 在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。
如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。还要注意的是PCR反应产物的质量还取决于模板(底物的复杂性、Tm、产物长度)和退火的温度与时间。
所以,有时3′末端稳定的引物也可以满意地进行反应。但是,无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。
2.5 引物的唯一性 为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。虽然不会整个引物序列都偏好于和模板中的一个以上位点匹配,但是,通常见到的引物的3′末端往往都有6~7个没有什么个性的核苷酸。如果假引发的位点正好在放大区的内部,那麻烦就大了。由于短的DNA片段有更高的PCR或杂交效率,就容易产生非专一产物。
如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。由此也可知,应当避免使用同寡聚物(如—AAAAAA—)和二核苷酸重复(如—ATATAT—)。
3. 按照氨基酸序列设计寡核苷酸
按照多肽的氨基酸序列来设计 PCR引物或杂交探针是最常用的实验手段,尤其是在试图“钓取”一个蛋白质的基因时。此时要注意的问题有:
(1)宁可用简并引物,也不用猜测的引物。氨基酸密码子的简并性给予引物设计以可塑性,这比用猜测的密码子要好得多。有人用1 024个简并引物得到很好的结果。
但是,应当避免在一个区域内有很高的简并性。但也有简并性低使引物不工作的报道。
(2)引物与模板的错配。一般认为,所用引物与模板有15%~20%的错配,PCR的效果还能接受。但是,引物3′末端的错配比同样错配率的5′末端错配会引起更严重的问题。
在最后4个碱基中有2个错配的引物,其 PCR产量急剧下降。但是,当核苷酸浓度高时,3′末端有错配的引物还能被Tag聚合酶很好地利用。在0.8 mmol/L时,大多数3′末端错配引物可以接受,虽然非专一产物比较多,DNA合成的忠实性也下降。即使在低核苷浓度下,还会有少量从错配碱基出发的合成,因此,在开始的PCR循环中把退火时间增加到3~5分钟,比之于用标准退火时间和高浓度核苷酸能够产生质量更好的所求产物。
(3)在用唯一性引物时,建议用0.2 mmol/L或更低的总核苷酸浓度,因为高浓度会增加错误参入的比率。
(4)简并寡核苷酸时,PCR应当在比较高的引物浓度下进行,即1~3 μmol/L而不是0.2 μmol/L,因为在反应混合物中的大多数寡聚物并不是被用来引发专一的反应,而只是产生高的背景而已。
2.推荐使用Primer Premier 5.0
推荐使用Primer Premier 5.0
作者:LiFeng
下载的安装文件有4M, 安装后运行该软件, 屏幕上方是最基础的工具条,如 File, Edit, View, Search 等等, FILE下拉菜单中包括New Sequence(Protein or DNA), Open Sequence( Protein or DNA), save, save as, Degenerate Bases, Print, Exit。EDIT下拉菜单中除包括常用的Copy, Cut, Paste 之外,还有一项Preference可以设定默认引物长度等参数。其余View, Search, Function, Translate 等其他的功能基本上可以在中央的操作框中实现。
下面简要介绍一下操作框。 下半部分显示的是一段DNA序列, 可以改变其中的碱基,但DEMO版中不可以,序列上方有一排工具钮, 如下
5' Sequence No: 5' 到 3' 显示DNA序列。 实际上该功能确定序列中第一个碱基的号码,可将所处理的碱基在整体中的位置加以确定。
Header: 好像是表示这段基因的来源说明。 当基因序列来自于各大数据库格式的文件时,显示序列前的其他说明文字。
3, 10; 碱基对以 3 或 10 为一单元显示序列。
Find, Find next: 寻找一段特定碱基序列.(Search 下拉菜单中还有一项Go to position 可查找指定位置。)
S, A, ds DNA: 显示源序列互补序列或双链DNA序列。
还有两个与声音有关按钮, 无太大用。 在刚输入序列、测序后等对比文件序列与文字序列是否一致时非常重要,可以让一个人轻松对序列。
在操作框上方正中有两个按钮; DNA, PROTEIN, 由于我用的是试用版这项功能不能使用, 但很明显这项功能可将已知DNA序列翻译为蛋白质氨基酸序列,或者是反过来。当序列是核酸时,PROTEIN可以操作,将序列翻译成蛋白;而序列是蛋白时,可以进行DNA操作,将蛋白生成对应的DNA序列。这两个键在将表达系统从一种转移到另一种的设计时很有用。在上方的Translate下拉菜单中可以对读码框和密码子进行设定和编辑, 可以设定标准密码子, 也可以设定酵母,植物,脊椎,无脊椎密码子, 还可以添加新的密码表。
左上角纵向排列有三个Function按钮: Ⅰ, Primer; Ⅱ, Enzyme; Ⅲ, Motif 。
Ⅰ,Primer; 在PCR和核酸杂交中设计引物。点击后出现一新框。中间偏上是DNA序列与引物, 可以用鼠标直接选择引物的位置。 序列下方显示了各项参数,还包括发夹结构,二聚体异二聚体在链中出现次数,如没有的话出现NONE钮, 如果存在该结构则为FOUND钮, 点击该钮可以察看该结构出现的具体位置, 包括这样引物的特性一目了然。
最上方是三个功能按钮① Search ② results ③ Edit primers
① Search: 搜寻引物,可选择PCR引物,序列引物,杂交探针,可以自己定义在正负链中搜索,搜寻范围,引物长度,PCR产物长度,可选择自动搜索手动搜索,还可设定搜索参数,如Tm, GC, Degeneracy,3' 端稳定性, Dimer, Hairpin, 等引物参数。设定完毕点击OK即可得到结果列表,包括所有可能的引物数目,以及各项参数达不到要求筛去的引物,最下方显示的是最佳方案的个数,可以在Result项中详细察看搜索得到的结果。
② Result: 显示引物搜寻结果列表,可以选定正负链或PAIRS,表中显示了每个引物的位置长度,还可以点击每个引物方案察看其在链中位置及其各项参数,你还可以选择所需要的并标记。
③Edit primers: 可以点击链两侧的左右箭头来选定引物位置,可以任意编辑引物,添加或删除任一个碱基,修改任一个碱基,当你编辑完毕,点Analyze钮就可以察看你编辑的引物的各项参数。
Ⅱ,Enzyme: 做序列的酶切位点, 可以应用于基因操作中酶切部位和所用酶 的选择。 最上方有两个选择:序列分析的范围;酶切位点个数选择(可低于1-6个)。点击后左右两边有一栏酶,左边为所有酶, 右边为选定的酶。
中间四个钮分别为:
ADD: 从所有酶列表中选定所用酶加入右侧列表,
DELETE:从选中酶列表中删除某个酶,
EDIT: 编辑酶列表,可以加入新的酶或删除已有酶,
FILTER: 如果你不知道该选用那几种酶,可用此功能筛选所需酶, 可用酶切位点BP数(4BP-13BP)和 切割后的接头Overhang ( 3', 5', BLUNT, 还可以具体规定切出的接头为那几个碱基)来筛选。
所用酶选好后点OK即可得到酶切结果, 有四种格式:
Table: 酶切位点,位置。
SEQ; 整段序列及酶切位置。
MAP: 与上一项近似。用示意图的方式显示结果。
NON Cutter: 切不动的酶
Ⅲ,Motif: 查找特定序列, 如 -10区,-35区,AGGA BOX, CAAT BOX, 与基因表达调控有关。 最上方有两个选择:序列分析的范围;Motif位点个数选择(可低于1-6个)。 左边一栏是所有特定序列,右边是选定的,中间按钮与Ⅱ近似,只是没有FILTER功能。选定你要查找的东西,点一下OK就可以看结果了,与Ⅱ的结果输出一样有四种格式:
Table: Motif的位置,数量。
SEQ: 整段序列及Motif的位置。
MAP: 与上一项近似。 用示意图的方式显示结果。
Motif absent: 序列中不存在的Motif。
3.我个人感觉,先用RNA structure模拟一下mRNA结构,选择非发夹结构区,再用Primer Premier 5.0设计引物,设计出来后再用oligo验证一下,这样最保险!
不过万一不行的,RNA structure只能是个参考,不要全信,否则很难设计引物
而且Primer Premier 5.0有时对antisense的能否有配对等识别不清,oligo可靠!