02 27
高通量测序(下一代测序)最大的特点就是产生海量的数据,454测序运行一次可以产生400M左右的数据,Illumina HiSeq运行一次产生的数据量高达200G!这么多数据出来以后,必然需要大量的计算,而随着高通量测序在各个领域的广泛应用,个人计算机和工作站显然将无法完成这种数据处理工作。一些大公司或高校可以用他们自己的超级计算机进行计算,如华大拥有数个大型生物信息学超级计算中心,港大有HPC。那一些小的公司和科研单位怎么办呢?
云计算是个非常合适的选择。云计算(Cloud computing)是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。整个运行方式很像电网(摘自维基百科)。简单地说就是可以通过互联网,把数据放到“云”中进行计算。目前Google、亚马逊(Amazon)和微软都在开发并提供云计算服务,比较适合进行高通量测序数据处理的应该是亚马逊的AWS。
今天简单了解了一下亚马逊提供的云计算,觉得挺不错的,灵活且价格便宜:
(1) 进行计算的时候才收费,不用的时候不收费;
(2) 操作系统可以自由选择Windows和Linux,而港大的HPC只有Linux可用……
(3) 价格非常便宜,以EC2为例,标准情况下,1个Instance(大致相当于一台普通电脑的计算能力吧)使用1小时只要0.085美元。这样,租20台电脑运行1天(24小时),才40美元多一点,大致相当于260RMB,简直是太便宜了。
事实上,已经有很多人在用云计算在进行高通量测序数据处理了。请看:这里。
一个生物领域的新技术,一个计算机领域的新技术,这么一碰,火花就产生了。有点可惜的是,在这两个领域,中国都没有掌握核心技术,远远落后,需要加油!
02 11
做饭和做PCR,仔细琢磨琢磨简直是一样一样的:
1. 步骤很一致。 做饭的时候,穿上围裙,走进厨房,打开冰箱,拿出各种料,解冻……
做PCR的时候,穿上白大褂,走进PCR房间,打开冰箱,拿出各种料,解冻……
看,多么一致的操作步骤啊!
2. 都要用锅。做饭要用锅这个大家都知道;有人纳闷了,做PCR也要用锅吗?是的,没错,最早的PCR就是用锅做的,三个水浴锅,折腾来折腾去,没见过这种锅的人可以到这里(Figure 1b)见识一下,现在用的PCR仪只是个升级版的锅而已。
3. 都讲究火候。做饭最讲究火候了,火候小了不熟,火候大了就糊了;做PCR也是,anealing那一步的火候可重要的,火候小了非特异性扩增,火候大了,啥也扩不出来。
4. 配料都很重要。做饭的时候,油盐酱醋少一样也调不出想要的味道;做PCR的时候Buffer,酶,dNTP,引物,模板一个也不能少。
5. 有时候都要回锅。Nested PCR都知道吧,把第一锅的PCR产物作为模板放进第二锅再次做PCR;做饭有时候也需要这样,吃过烩饼么?第一步先把饼烙熟,切成条状,第二步放进美味的汤里煮像煮面条那样煮一下。类似的还有回锅肉。哈哈
6. 有PCR歌,也有做饭歌。
不了解PCR的同学阅读以上内容可能有困难,那么需要先做点热身运动:看看这个视频,了解一下PCR原理,再看看这个视频,了解一下操作步骤,然后再看就懂啦!
02 07
1、Bubble Ball

Bubble Ball是最近比较火的一个免费iPhone小游戏,能够锻炼创造力、想像力、智力及其它各种能力!据说这个游戏是一个14岁的小孩用Lua语言开发的,14岁就会用Lua编程?还能做出这样的游戏?真是有点玄乎!
2、Aerox

Aerox是一个3D滚球游戏,有免费和收费两种版本,对技术要求特别高,稍不小心就完蛋了。玩这个游戏能锻炼端盘子的水平,这个游戏玩好了,端盘子的时候,里面有再多的汤也洒不了。哈哈。
02 06
以前读本科的时候总喜欢偶尔编个小程序啥的,可是那时候买不起电脑,经常都是写了程序之后在脑子里运行几次就算了,每天做梦都想有台自己的电脑,那滋味……后来读研究生的时候有电脑了,可是太忙了,每天除了做实验,就是在琢磨怎么赚钱,把编程序这事儿就逐渐放下了,也都忘的差不多了。前段时间由于处理高通量测序的结果需要写些程序,于是又比较系统的复习了一下,尤其比较多地看了些关于Python的资料。正好最近Facebook搞了个Hacker Cup编程比赛,就去试了一下。
继续阅读 »
02 05
Python是一种面向对象、直译式计算机程序设计语言,也是一种功能强大的通用型语言(维基百科)。自从上次写那个批量Blast小程序的时候接触了Python,发现这个玩意儿真是好用,后来还用它弄了个动态作图小程序,最近在处理高通量测序数据的时候也一直用Python,越用觉得好用!给大家推荐一下,如果你想快速学一种实用的编程语言用来写小程序或处理数据,就学Python吧。
继续阅读 »
02 01
不得不佩服有些老外,真是能折腾!看看下面这个视频,他们把细菌染上不同的颜色,然后在培养基上长出一个Google Logo:
你们知道这是用什么细菌、什么化学试剂做出来的吗?
01 25
这里说的淘汰是指DGGE在微生物群落结构分析方面的应用,其它方面咱不懂。
虽然PCR-DGGE这种方法给出的结果比较直观,但是将它用于生态学或环境生物学等领域的微生物群落结构分析,从严谨的角度去看,既不能准确定性,也不能准确定量,毫无可取之处,加之其操过程复杂,重复性及其差等特点,淘汰是必须的!以前之所以一直有人用,是因为没有别的手段,不好用也得用,现在不是这样了,高通量测序肩负着淘汰这些普通分子生物学方法的使命,昂首阔步朝我们走来啦!
与DGGE一起被淘汰的,还有TGGE,T-RFLP,SSCP等等这些DGGE的兄弟,他们在微生物群落结构分析方面都有着几乎共同的缺点和各自无法克服的缺陷。
01 15
有次在吃饭的时候,大家一起讨论起了最近的电影,说有部电影,从网上下载下来在电脑上看的时候声音和画面不同步,让人感觉很不爽。这时有位同学说:很简单嘛,用两个播放器同时播放,其中一个调成静音,一个看画面,一个听声音,不就可以了么?众人恍然大悟,原来让不同步的视频声音和画面同步的方法这么简单啊……
有些事情,其实很简单!
01 13
下面是华大基因目前提供的高通量测序在肠道微生物群落结构研究中主要的四种服务:
(1) 16S rDNA 宏基因组调查
(2) 全基因组的宏基因调查
(3) 简单环境基因集构建
(4) 人肠道微生物与疾病关联分析
其实这些方法不仅仅可以应用于肠道微生物,也可以用于其它微生物群落结构研究。目前华大基因在这四个方面的技术都已经比较成熟。除此之外,还有Small RNA测序、转录组测序等等,是否也是非常成熟,不清楚。在这里帮忙做个宣传,有兴趣做高通量测序的,去联系华大吧。
华大的高通量测序仪主要是llumina HiSeq 2000和AB SOLiD,这两种的优点是数据量特别大,但测序片段(读长)太短(低于180bp),测16S的时候,一般用V3区或V6区,不能用V4区。Roche 454的特点是测序片段较长(高于400bp),但产生的数据量不大,通量不够高。