吉凯基因:过表达工具经验分享

  • A+
所属分类:生物信息学

手上有篇关于lncRNA研究的cell文章,一位兄弟要求我分析下。刚从网上把全文搞下来了,看了下,思路清晰,没有啥需要另外需要学习的内容,应该花不了多少时间用来分析,老毛病就犯了。放到一边去了,先歇歇。今天是周末,看了4份项目,休息下总可以吧。不过,休息的时候看到QQ群上大家对过表达的问题在纠结。想想,分析高分文章,高大上,对大家是有帮助。但对于这些工具的了解,其实也不可小视。手就痒了。

对于研究,其实工具很重要。古语云“工欲善其事,必先利其器”。意思应该中国人都懂吧,除了“香蕉”外(不知道香蕉啥意思?外黄内白)。基因的操作,其实就两个方向,overexpress,和knockdown(程度大点就是knockout,不是季博卖弄英文,这里用英文表述得更清晰些)。

Knockdown今天不讨论。就讨论过表达。过表达,就是把基因上调表达,高于原本天然的表达量。方法,1、外源构建目的基因的CDS区,使用外源启动子表达外源构建的目的基因。这个是最常用的方法,今天就讨论这个。2、上调目的基因的激活型转录因子,从而使得基因上调表达。

怎么上调目的基因的激活型转录因子呢。一个是参考1中的外源构建。一个是用药物刺激(这里的药物可以是化合物,也可以是蛋白等等。比如免疫中常用的LPS也算一个。这次刺激可以是上调基因,其实也可以用来抑制。)。

前面比较热的TALEN技术,大家了解比较多的是用来编辑DNA,其实也可以用来上调基因,把TALE后面不要接DNA酶,接转录因子激活元件,且序列让他识别启动子区。那么就做成人工的转录激活因子了。

Sigh,又开始扯了。还是回到我们的主题吧。外源构建目的基因。其实,这个工具,一开始,只需要考虑两个地方。1、什么启动子。2、基因CDS区。

一、先说启动子。这个是看过表达工具在什么地方用。是原核表达呢,还是真核表达,表达的环境是什么物种。是否需要受诱导。等等。要是不需要表达,T载体就OK了。这里说几个事情,季博以前也弱过(现在其实也很弱)。

啥事呢,在microRNA刚兴起的时候,季博搞不懂用啥启动子来研究的。就问国外的一个教授,教授回答,“与常规过表达有区别吗?”再问:“常规是蛋白编码基因,需要翻译的,microRNA不需要翻译,没有特殊要求吗?”答:“啊,你认为基因表达的过程中,翻译过程会影响转录过程?”

额,不知道,至少现在没有人说过。意思是啥呢,基因表达的两个过程,转录和翻译。启动子只是把后面的片段转录出来,后续的翻译过程启动子控制不了。(有人不了解?跟本科生借本遗传学仔细复习下。)

有人需要组织特异表达基因,这个在哪里控制呢,就是启动子。使用组织特异的启动子就OK了。其实组织特异的敲除也是使用这个原理,把CRE酶放在组织特异的启动子后面就OK了。(CRE loxp系统,不清楚的度下吧。季博就不多扯了。避免有人扔砖头)。

还有就是可诱导,使用可诱导启动子。比如teton启动子。

所以,根据研究目的的不同,寻找合适的启动子。这些启动子,基本上都有相应商业化的载体。如果没有,就自己改建吧。

二、启动子确定了,下面就是基因了。很多人说,这个简单呀。到NCBI上查下,不就OK了吗。是的呀。不过还是有很多细节需要注意的。

多转录本。一个基因如果有多个转录本,那么我做哪个呢。季博也不知道,前面有个兄弟给了个很好的方法,用不同转录本的NM号及研究的内容到NCBI上查,看哪个NM号文章最多,就用哪个。虽然这个方法跟那位兄弟一样比较粗暴,但确实是个好办法(希望老徐看不见这段,哈哈)。当然,如果你知道你的研究方向,别人用的是哪个。哪怕文章少,也得用。

特殊定位蛋白。比如,分泌蛋白。需要有分泌肽。如果研究其功能是分泌出来行使的呢,还是在细胞内行使的。可以把他的分泌肽去掉,看功能。

注意,这个研究方案建议做分泌蛋白和其他特殊定位蛋白的筒子们都做做。把研究做得越细,越有水平。(另外,分泌蛋白,不是说细胞内就没有了,其实蛋白表达都在细胞内进行,细胞内都有的。)

说了这么多,那么问题来了,是不是启动子确定了,CDS也确定了。就OK了呢。

如果OK,季博就不用写这个日志了。以前带师弟师妹,帮别人分析问题,大道至简,对于过表达构建,季博就抓两个地方,1、构建序列正确。2、外源tag抗体检测有外源条带。(季博其实比较笨,老师说了,笨鸟先飞,所以季博就在飞上下功夫。

练就了一手分析的本领。不管啥问题,总能扯出个123的道理来。其实吧,这是吹的。季博的经验是从别人那里获得的。帮人就是帮己。帮10个人,就有10个问题解决的经验了,帮得人越多,经验值越高,就可以打大怪了。)

1、序列。其实,过表达构建,我们能够控制的就是构建的序列。WB发现有问题,第一时间就是看测序结果中,序列是否OK。如果OK。再往下分析。

2、外源tag抗体检测表达。为啥用外源tag抗体呢,因为这些商业化的抗体都是经过大家实践验证的。出来就是出来,不出来就是不出来,不会参入其他原因。

正是因为这一点,验证一个蛋白的目的抗体是否OK,就用一个带有外源tag的蛋白来做WB。外源tag抗体和目的抗体同时做WB,如果条带一致,说明目的抗体OK。如果不一致,说明目的抗体有问题。

在WB中,出现过啥问题。A、不表达。B、大小不对。C、定位不对。

A、不表达。这个比较少,但遇到就很头大。明明序列是正确的,载体也是OK的。为啥不表达呢。为了这个问题,当年季博查了不少文献。大家都知道,真核基因,转录后翻译,是从ATG开始(有其他的,非常罕见,不讨论)。但一个基因有好多ATG,到底从哪个开始?

其实,真核基因翻译开始的ATG有两个特点。Kozak序列有多少人知道呀。这段序列是翻译起始ATG前9到10个碱基,在-3,-6,-9有要求,为嘌呤。所以,很多表达载体上,如果是提供ATG的,基本上都有kozak序列在。老外做过表达构建,引物设计时,往往不是从ATG开始,而是再往前一点点,目的就是把基因自己的kozak序列包括进来。

那么问题来了,是不是没有kozak就不行了呢。不要急。还有一个特点,ATG后面如何还是一个G,也就是ATGG,那么这个ATG也可以作为翻译起始位点。但不绝对。有个比例的,这么多年,忘记了。很多基因CDS区,其实都是ATGG,大家去看看。这两个规律是根据蛋白表达基因分析归纳出来的。不是推导的。

B、大小不对。其实,只要1、序列正确。2、外源tag抗体能够检测到条带。季博就认为过表达构建是OK了。B和C的问题,不是构建的事情了,而是需要研究了。大小不对,一般需要考虑是否为修饰,什么修饰,是磷酸化还是糖基化(膜蛋白经常会有)。是否有剪切。

这个就复杂了,以前季博的建议是,看看别人的研究中是否也这样。如果找不到原因。反正序列是正确的,到细胞内发生什么事情,外源会这样,内源也会这样。就直接做功能吧。实在不行,就去做干扰。

C、定位不对。这个一般是考虑构建时GFP放在什么地方。蛋白定位信号一般在N端,所以,外源tag或者GFP等荧光蛋白,一般是构建在蛋白的C端。但有例外。自噬的marker基因LC3,其定位到自噬体膜上,其C端是需要剪切掉,再加上一个分子,才能定位到自噬体膜上。所以,如果把GFP构建到LC3的C端,把细胞饿死了,也不会看到荧光自噬体的出现。

这个地方的考虑,需要在构建前就考虑清楚。季博以前是要求,做课题的人查文献看,确定构建的序列。如果不能确定,那就先做了看。构建的人,不一定知道这些道道。(其他地方不知道如何,复旦这边,一般是师兄师姐带师弟师妹,所以,构建的事情一般是师弟师妹做。

季博当时的主张是,多帮师兄师姐干活,因为,如果遇到问题,他们来解决,就长经验了。等做自己的课题,就少走弯路了。要感谢师兄师姐提供学习的机会。)以前,别人帮忙做构建,季博只要求构建的序列是OK的。如果WB出现异常情况,这个不是构建的人能够解决的。

By 吉凯基因 季国庆 博士

  • 蛋白质组学业务咨询
  • 扫码咨询相关问题
  • weinxin
  • 代谢组学业务咨询
  • 扫码咨询相关问题
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: