02 02
SATA硬盘(又叫串口硬盘)的各方面的性能都比普通硬盘好,但是在SATA硬盘上安装系统实在是让人头疼的事情。由于之前一直没有在这种硬盘上安装过系统,工作站的系统坏了之后,折腾了一天多的时间才搞定。根据我了解和观察,大致的情况是这样的:
安装Windows XP,必须用到系统安装盘,软驱和带有硬盘驱动程序的软盘,没有软驱的SATA硬盘的电脑无法安装XP;
安装Windows 7, 可以将驱动程序放到U盘或光盘代替软盘;
安装Linux(Ubuntu 10.04),不需要驱动程序也可以安装,但是成功安装之后,重启无法进入,可能通过一定设置可以解决,但我没找到方法。
要在一个既没有Windows又没有Linux的SATA硬盘的电脑上安装这两个系统,我是这样折腾的:
首先安装Windows 7,在联想官网上下载的驱动cdsas09ws17.exe解压之后的文件竟然不能用,不知怎么回事,换成买工作站时候带的光盘里的驱动就可以,比较奇怪。
Win7安装之后,可以顺利启动,一切OK,接下来用光盘安装Ubuntu,也可顺利安装,可是安装之后Win 7和Ubuntu两个系统都进不去了,提示“无法引导”。
接下来,再安装一次Win7,又顺利安装成功了,也可以顺利重启,可是启动菜单中没有Ubuntu,到这一步,解决方法就很容易了,方法见这里:Win7和Ubuntu双系统问题
真是很折腾啊,不知道有没有什么好办法。
01 03
这里所说的超大内存是指512GB以上,1TB甚至是2TB(注意是内存大小不是硬盘大小),目前内存100GB以下的工作站现在已经很便宜了,大约30K-40K港币(5K美元)左右就可以买到,而超大内存的机子却非常贵,在这篇文章中(blogspot上的文章,需翻墙),作者认为计算机的Memory比CPU对于下一代测序(高通量测序)数据分析更为重要,并且解释了为什么用计算机集群很难代替超大内存的计算机用于高通量测序数据分析。
上面这篇文章中提到的512G内存的机器,价格是55K美元。
Dell的PowerEdge R910机架式服务器,1TB内存,价格大约为50K-100K美元,2TB内存,超过200K美元。
12 20
刚刚速成了一下shell语言,在试着用它写个小脚本的时候发现,这种编程语言的if语句用起来讲究还蛮多的,比如下面这段程序,就有很多错误:
#!/bin/bash
while read line
do
if [$line != "abc"]; then
echo $line;
fi
done < "input.txt"
运行的时候会报unexpected operator,xxx not found, too many arguments等各种错误。
原因是if后面的[]中前后都要有一个空格,并且$line这个变量要房子引号中。
正确的写法如下:
#!/bin/bash
while read line
do
if [ "$line" != "abc" ]; then
echo $line;
fi
done < "input.txt"
10 20
Mothur是一个架构非常好的生物信息学软件,把大量的工具和模块整合到了一起,并且将输入和输出标准化,非常简单易学。在高通量测序数据处理中特别有用。Mothur可以在Mac、Windows和Linux中运行,在Ubuntu系统中通过源代码编译的方式安装过程如下:
1. 安装GCC
sudo apt-get install build-essential
2. 安装readline库
sudo apt-get install libreadline-dev
3. 编辑Makefile文件
将TARGET_ARCH 这一行注释掉,去掉 CXXFLAGS 这一行的注释; 另外根据机器配置选择是否64位版本,64BIT_VERSION ?= yes 。具体参考这里的说明。
4. 进入源代码所在文件夹,编译
make
编译需要很长一段时间,编译结束后将生成的mothur这个可执行文件所在的目录加入环境变量中,或者将mothur这个文件复制到已经在环境变量中的目录中即可。
10 17
Biopython是Python的计算分子生物学和生物信息学工具包,它使得python在生物学数据处理中变得更加强大和高效,在Windows中安装biopython非常简单,下载之后,双击然后一路点下一步就可以了。在Linux中安装有多种方法,以Ubuntu(10.04)为例:
方法一:使用apt-get install方式安装
sudo apt-get install python-biopython
只有一行命令,可是这种方法安装的不是最新版本,很多新的功能不能用,非常不爽,不建议使用这种方法安装。
方法二:使用easy_install安装
(1)安装python-dev,不然会出现Setup script exited with error: command ‘gcc’ failed with exit status 1错误
sudo apt-get install python-dev
(2)安装easy_install工具
sudo apt-get install python-setuptools
(3)安装biopython
sudo easy_install -f http://biopython.org/DIST/ biopython (DIST/和biopython之间有个空格)
(4) 安装Numpy
从http://numpy.scipy.org/下载numpy,现在的最新版本是numpy-1.6.1.tar.gz
tar -xzvpf numpy-1.6.1.tar.gz
cd numpy-1.6.1/
python setup.py build
sudo python setup.py install
还可以继续安装一些其它的dependencies,如flex,ReportLab等等,暂时不装,需要的时候再装也可以。
这里有biopython的详细安装说明,好长的一大篇,看了头会晕。
10 08
这是我去年春节假期的时候写的一个小软件,用于把高通量测序的结果以DGGE的形式展示出来。
DGGE虽然有无数的缺点,以至于正在被淘汰,但是它的结果展现形式非常直观,我决定把这种直观的方式移植到高通量测序领域来,于是就有了这个小软件。实际上这种图不仅仅可以用于高通量测序,一切与多样性和丰度有关的数据都可以用这种方式来表示。
生成的图像效果如下:

继续阅读 »
08 22
Linux里面的命令行用习惯之后的感觉真是太爽了,一个命令,能搞定很多东西,比如fasta文件拆分、提取与合并,非常简单。
很久之前还写过一个小软件用于合并多个fasta文件,还有用BioEdit合并多个基因序列文件,现在想想真是too naive!
FASTA文件拆分:
1. 从a.fasta中提取第10至第20个序列存到b.fasta中
-
awk -v RS='>' 'NR>1{i++}i>=10&&i<=20{print ">"$0}' a.fasta|sed '/^$/d'>b.fasta
上面命令行中的红色的10和20可以换为其它数字
2.将input.fasta中第每一条序列保存到一个文件中, 这个是在网上看到的,链接在这里。
awk '/^>/{f=++d".fasta"} {print > f}' input.fasta
FASTA文件合并:
cat *.fasta > output.fasta
awk是Unix/Linux下的一种用于文本处理的编程语言,Sed是Unix/Linux下的一种流编辑器。功能都非常强大。
当然这些操作用Python或Perl编程也很容易实现,但不如命令行这么直截了当。
另外,在Windows下如果安装了Cygwin这个软件,也可以使用这些命令。
08 12
刚说过安装使用Linux是件很简单的事情,结果前段时间在给实验室新买的工作站安装Ubuntu的时候就遇到问题了。
问题如下:
在Windows下用wubi方式安装,很容易,但是给Ubuntu分配的硬盘空间太小,最大只有几十G,我希望给Ubuntu多分配一些空间(比如500G),于是就用光盘安装,结果问题就来了,安装结束之后不显示启动菜单,一下子就进入Windows,根本无法进入Ubuntu。
解决方法:
安装EasyBCD这个软件,然后点击Add New Entry,添加一个Linux Entry即可,Type选择GRUB2.
07 07
2011.11.5更新:24GB内存处理Metagenomics数据根本不够,实验室新买的一台工作站96GB内存,仍然不够。。。
实验室的工作站终于到了,联想的ThinkStation D20, Intel Xeon(至强)处理器,16个Processor,24GB内存,4TB硬盘, 这样的工作站价格竟然只要23000港币多一点折合人民币不到19000,便宜的出乎我的意料!

简单试了一下,蛮不错的,速度嗖嗖的,再也不用老牛拉破车似的PC处理高通量数据了。
04 22
使用Liunx有什么好处?以Ubuntu版本为例,Liunx系统至少有以下这些优点:
1. 免费,完全免费;
2. 开机速度快,上网速度也很快;
3. 中毒的可能性比用Windows少很多很多;
4. 适合进行大数据量的科学计算,比如高通量测序数据处理。
安装Ubuntu Linux系统有多种方法:用光盘安装,虚拟机安装,U盘安装,在Windows下直接安装等等,其中最后一种方式非常简单,比较适合初学者,就像安装普通软件一样简单:从下面这个链接下载一个安装软件wubi.exe,然后双击,填上密码,点击安装即可。
http://www.ubuntu.com/desktop/get-ubuntu/windows-installer
安装后重启,就会发现有两个系统了,用上下箭头选择”Ubuntu”就进入了Ubuntu系统。
如果Windows系统中安装了卡巴斯基,可能需要先关掉,再安装Ubuntu。
我在笔记本上安装了Ubuntu,用了一段时间后,发现几乎完全可以满足普通的办公和上网需求。如果开个公司的话,我觉得可以考虑让公司的办公电脑都用Linux系统,这样既可以节省成本,又可以减少中毒的可能,还没有版权等烦恼。