有一个叫做dropbox的玩意儿,试用了一下感觉非常不错,它是一个免费的文件备份、同步、共享工具,也可以看看成是一个免费的网盘。主要功能就是能使多台电脑中的某个文件夹始终保持一致,也就是说将dropbox软件安装在多台电脑中之后,会在每台电脑中建立一个文件名为My Dropbox的文件夹,如果在其中一台电脑的这个文件夹中存放了一些文件,那么这些文件会被自动同步到其它电脑,速度超快,我用一个700多兆的文件测试了一下,瞬间完成。点击这里可以注册dropbox帐号,dropbox空间大小是2G,邀请别人注册可以增大空间,最大5G。
另外,微软也有一个类似的网站:Live mesh,空间大小5G,同步功能也很强大,但个人感觉不如dropbox简单好用。
常见的DNA序列格式有下面这些:
PLAIN格式 、EMBL格式、 FASTA格式、 GCG格式、GenBank格式、 IG格式 IUPAC格式和PHYLIP格式等。这些DNA序列文件的书写规则及示例在这里有详细介绍: http://www.genomatix.de/online_help/help/sequence_formats.html
有很多软件可以对这些格式进行转换,比如SeqVerter 、DataConvert、Visual Sequence Editor 等。如果需要转换的文件不是很多,就不需要下载安装软件了,用在线工具即可:
http://www-bimas.cit.nih.gov/molbio/readseq/
http://searchlauncher.bcm.tmc.edu/seq-util/readseq.html
这是2个可以在线进行这些格式之间的相互转换的工具,使用非常简单。
另外,如果需要将多个FASTA格式的文件合并为一个文件,这个文件合并软件可能可以用一下,不过不是太好用。
2009.8.20更新:
建议使用BioEdit合并多个序列文件,具体请看:用BioEdit合并多个基因序列文件
-----
昨天做了一个小软件,把多个后缀名为.seq文件的基因序列文件合并为一个FASTA格式的文件,并且把每个.seq文件的文件名放到合并后的文件的相应基因序列的前一行。比如有两个后缀名为.seq的文件s1.seq和s2.seq,内容分别为:
GGTACCCGGGGAT……
和
GTCTTTCGACAGGT……
合并后的文件就是:
>s1.seq
GGTACCCGGGGAT……>s2.seq
GTCTTTCGACAGGT……
如果合并的时候不涉及文件名,非常简单,用word就可以合并了。但要把文件名一起掺和进去,比较少见,没见过哪个软件可以这样做,所以就自己做了个小软件。
这小软件压缩之后只有4.71k,很小很简单,界面很丑…… 下载:seq文件合并小软件
关于FASTA格式:FASTA格式又称Pearson的格式,这种序列格式要求序列的标题行以大于号">"开头,之后是关于该序列的描述。下一行起为具体的序列。一般 建议每行的字符数不超过80个(也有的地方建议不超过60个)。FASTA格式的详细说明可以参考这里:http://www.ncbi.nlm.nih.gov/blast/fasta.shtml
经常需要把一些文件名乱七八糟的文件(比如:IMG1087.jpg、IMG1231.jpg、IMG1578.jpg、IMG1934.jpg、IMG1236.jpg……)批量改名使文件名变的整齐有序。
很久以前某人(忘记是谁了,不好意思)告诉我一种方法:
按Ctrl+A把文件全选,然后按F2,然后改动其中一个文件名,其它的文件名也就会相应改变。
比如把其中一个改为pic.jpg,其它的文件就变为pic(1).jpg、pic(2).jpg、pic(3).jpg……
如果对这样的形式还不满意,那就用软件吧:
有个叫拖把更名器的文件批量改名软件蛮好用的,
下载地址:http://www.skycn.com/soft/9011.html
这个软件非常灵活,可以说想怎么改就怎么改。
比如可以改为:1.jpg、2.jpg、3.jpg……
或者:pic_1.jpg、pic_2.jpg、pic_3.jpg……
或者:pic(1).jpg、pic(2).jpg、pic(3).jpg……
等等好多形式。
使用这个软件批量改名之前还可以先预览一下。