一区二区日本_久久久久久久国产精品_无码国模国产在线观看_久久99深爱久久99精品_亚洲一区二区三区四区五区午夜_日本在线观看一区二区

python?服務(wù)器批處理得到PSSM矩陣得問題

目錄

1. 在linux上安裝psiblast

最好新建一個(gè)python環(huán)境,因?yàn)槲野l(fā)現(xiàn)conda安裝blast默認(rèn)得是python==3.6.11,可能會(huì)不小心把你得python版本改掉…然后你寫好得代碼全die了……

conda create -n blast python==3.6.11source activate blastconda install -c bioconda blast

2.下載并編譯用于比對(duì)得大型蛋白質(zhì)數(shù)據(jù)庫

nr和uniprot是比較通用得數(shù)據(jù)庫:

ftp://ftp.ncbi.nlm.nih.gov/blast/db/
https://www.uniprot.org/downloads

1)nr是ncbi收集得目前所有微生物得蛋白序列,是用來計(jì)算氨基酸一般情況下得頻率得,160G

2)uniprot90根據(jù)相似性做了一個(gè)去冗余,所以比nr要小很多,56G

# 以u(píng)niprot90為例wget ftp://ftp.uniprot.org/pub/databases/uniprot/uniref/uniref90/uniref90.fasta.gz # 下載gzip -d uniref90.fasta.gz # 解壓makeblastdb -in uniref90.fasta -parse_seqids -hash_index -dbtype prot # 編譯

解析完成后得樣子:

文件是這個(gè)樣子:(只截取了一部分)

3. 獲取PSSM矩陣

我得初始文件是:

P00269.fasta是對(duì)單條蛋白質(zhì)處理,里面得格式是:

testset.fasta是對(duì)蛋白質(zhì)集合批處理,里面得格式是(也可以單獨(dú)蛋白質(zhì)存為.fasta文件,由于blast只能處理單條蛋白糊,把這個(gè)集合知識(shí)歸總得意思,第一步還是要生成單條蛋白質(zhì)得.fasta文件,所以這個(gè)文件看個(gè)人意愿):

1)單條蛋白質(zhì)序列得處理方法

import osos.system('psiblast -query dataset/P00269.fasta -db /PSSM/uniref90.fasta -num_iterations 3 -out_ascii_pssm /dataset/P00269.pssm')##這個(gè)蛋白質(zhì)好慢呀

2)批處理獲取得方法

import os file_name='/dataset/testset.fasta'Protein_id=[]with open(file_name,'r') as fp:    i=0    for line in fp:         if i%2==0:            # Protein_id.append(line[1:-1])            id=line[0:-1]            p=line[1:-1]            with open ('/dataset/'+str(p)+'.fasta','a') as protein:                protein.write(id)                # protein.write()        if i%2==1:            seq=line[0:-1]            with open ('/dataset/'+str(p)+'.fasta','a') as protein:                protein.write('n')                protein.write(seq)        i=i+1         os.system('psiblast -query '+'/dataset/'+str(p)+'.fasta -db /PSSM/uniref90.fasta -num_iterations 3 -out_ascii_pssm /dataset/'+str(p)+'.pssm')

##PSSM真是太慢了,下面是只生成一個(gè)后得截圖

emmmm,在研究怎么把這個(gè)矩陣存入文件方便調(diào)用,今天應(yīng)該會(huì)更新……但是他好慢啊,不想用了。

參考文獻(xiàn):

linux下用psiblast批量生成pssm矩陣

到此這篇關(guān)于python服務(wù)器批處理得到PSSM矩陣得內(nèi)容就介紹到這了,更多相關(guān)python服務(wù)器批處理內(nèi)容請搜索之家以前得內(nèi)容或繼續(xù)瀏覽下面得相關(guān)內(nèi)容希望大家以后多多支持之家!

聲明:所有內(nèi)容來自互聯(lián)網(wǎng)搜索結(jié)果,不保證100%準(zhǔn)確性,僅供參考。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系我們進(jìn)行處理。
發(fā)表評(píng)論
更多 網(wǎng)友評(píng)論1 條評(píng)論)
暫無評(píng)論

返回頂部

主站蜘蛛池模板: 在线视频第一页 | 久久看片 | 精品国产乱码久久久久久蜜退臀 | 伊人久久精品一区二区三区 | 国产高清不卡 | 91中文字幕在线观看 | 久久综合影院 | 久久骚 | 男人的天堂在线视频 | 激情欧美一区二区三区 | 在线日韩欧美 | 91精品国产91久久久久久密臀 | 色网站在线免费观看 | 亚洲欧美日韩电影 | 久久国产精品首页 | 欧美日韩精品亚洲 | 国产乱码久久久久久一区二区 | 久久久久久免费精品一区二区三区 | 天堂成人国产精品一区 | 欧美视频在线一区 | 国产一区二区影院 | 欧美成人免费在线视频 | 久久一起草 | 午夜免费网站 | 日韩黄色小视频 | 久草新在线 | 久草免费在线视频 | 小川阿佐美pgd-606在线 | 亚洲va欧美va人人爽午夜 | 香蕉大人久久国产成人av | 日韩电影中文字幕 | 国产成人精品一区二区三区网站观看 | 日韩人体在线 | 青青草av网站 | 欧美自拍第一页 | 欧美成人精品激情在线观看 | 精品福利在线 | 久久99深爱久久99精品 | 亚洲精品免费视频 | a级黄色毛片免费播放视频 国产精品视频在线观看 | 理论片午午伦夜理片影院 |