科研工作者在發(fā)表paper的時(shí)候,如果文章中涉及高通量測(cè)序數(shù)據(jù)分析,就需要提前向NCBI上傳數(shù)據(jù)獲得登錄號(hào)。然而,如何向NCBI提交這些序列?提交什么序列?總是提交失敗怎么辦?這一系列問題成為科研工作者不得不面對(duì)的一個(gè)難題。
今天小編就來介紹一種重要的NCBI數(shù)據(jù)庫GEO,它可用于存儲(chǔ)測(cè)序數(shù)據(jù),實(shí)現(xiàn)資源共享。小編將GEO數(shù)據(jù)庫的提交過程做一個(gè)簡(jiǎn)單概述,希望能為大家提供一點(diǎn)幫助。
一.GEO數(shù)據(jù)上傳操作方法
1.NCBI 賬號(hào)注冊(cè)
數(shù)據(jù)上傳前需要注冊(cè)一個(gè)NCBI()賬號(hào)
若賬號(hào)已存在,可點(diǎn)擊“Log in”直接登錄,若未注冊(cè)賬號(hào),需點(diǎn)擊“Sign up“注冊(cè)后登錄。
2.GEO賬號(hào)注冊(cè)
登錄NCBI后點(diǎn)擊“Submit”
下拉至“Other Tools”點(diǎn)擊GEO對(duì)應(yīng)的“l(fā)earn more”,進(jìn)入GEO
NCBI 賬號(hào)關(guān)聯(lián)GEO 數(shù)據(jù)庫提交賬號(hào)
填寫姓名、電話、E-mail等基本信息 (帶*號(hào)的為必填信息)
注:、 或 電子郵件地址可能不能收到來自 NCBI 的郵件。請(qǐng)?zhí)峁┢渌]箱以確保NCBI能夠與您溝通。
注冊(cè)成功后會(huì)收到GEO注冊(cè)成功郵件。
注:GEO帳戶三個(gè)月內(nèi)不上傳數(shù)據(jù)將自動(dòng)刪除。
3.數(shù)據(jù)上傳導(dǎo)航
RNA-seq 選擇高通量測(cè)序
需要提交的數(shù)據(jù):
可在下方直接下載填寫
data fies即表達(dá)量文件gene count或gene fpkm文件
raw data files即原始數(shù)據(jù)raw data
4. 表格填寫
(1)STUDY主要包含文章的標(biāo)題、概述、實(shí)驗(yàn)整體設(shè)計(jì)、共同作者等
(2)SAMPLES: 包括樣品名稱、樣品的詳細(xì)信息、物種、細(xì)胞系、細(xì)胞類型、試驗(yàn)處理情況、單雙端測(cè)序情況、測(cè)序機(jī)器、原始文件名等(目前諾禾致源普通轉(zhuǎn)錄組標(biāo)準(zhǔn)項(xiàng)目使用 NovaSeq 6000測(cè)序儀器,采用paired-end測(cè)序)
主要是基因表達(dá)的數(shù)據(jù)文件(或FPKM),需要換成文本txt格式。
raw file對(duì)應(yīng)原始數(shù)據(jù)raw data中的壓縮包名稱,以fq.gz結(jié)尾,由于是雙端測(cè)序,因此一個(gè)樣本對(duì)應(yīng)-1、-2兩端數(shù)據(jù)。
(3): 樣本的處理方案,建庫方案,類型,處理步驟,處理過程中文件信息等
(4)PAIRED-END : 雙端測(cè)序的樣本fq文件名
(5)MD5
MD5 即 Message-Digest 5,是當(dāng)前計(jì)算機(jī)領(lǐng)域廣泛使用的哈希算法之一,用于確保信息傳輸完整一致。
RAW FILES即raw data,對(duì)應(yīng)的file cheksum可直接在釋放的全部數(shù)據(jù)中的md5.txt直接查看。
DATA FILES即結(jié)果文件中的表達(dá)量fpkm文件,需將文件轉(zhuǎn)換成txt格式后上傳,windows電腦的file cheksum可利用md5.exe(釋放的全部數(shù)據(jù)中有)生成,具體操作如下。
5.數(shù)據(jù)上傳
將以上涉及的三部分需提交的內(nèi)容(表格與數(shù)據(jù))打包到一個(gè)文件夾內(nèi)
注:可接受的壓縮格式是 gzip 和 bzip2(即以 .gz 或 .bz2 擴(kuò)展名結(jié)尾的文件)。切勿壓縮二進(jìn)制文件(例如,BAM、bigWig、bigBed),也不要上傳 ZIP 檔案(擴(kuò)展名為 .zip 的文件)。
點(diǎn)擊“ your ”跳轉(zhuǎn)到數(shù)據(jù)上傳界面
分兩步:第一步下載FTP軟件上傳數(shù)據(jù),第二步發(fā)郵件通知GEO
上傳路徑:
上傳的主機(jī),賬號(hào)及密碼:
“快速連接”工具欄中輸入主機(jī)(),用戶名(geoftp)和密碼()來快速連接,會(huì)看到“快速連接”錯(cuò)誤,可以忽略此錯(cuò)誤。在“遠(yuǎn)程站點(diǎn)”地址欄中輸入個(gè)性化工作區(qū)的路徑(如我的路徑為:/ uploads / )。然后可以通過從“本地站點(diǎn)”窗口拖動(dòng)包含所有提交文件的文件夾并將其拖放到右側(cè)的上傳空間(“遠(yuǎn)程站點(diǎn)”窗口)中來傳輸文件。
此外,可以通過設(shè)置站點(diǎn)管理器避免目標(biāo)列表錯(cuò)誤,步驟如下:
(1)選擇文件-站點(diǎn)管理器-常規(guī)-輸入主機(jī)(),用戶名(geoftp)和密碼()
(2)選擇文件-站點(diǎn)管理器-高級(jí)-選擇需要上傳數(shù)據(jù)的文件夾-數(shù)據(jù)庫給出的遠(yuǎn)程站點(diǎn)
(3)選擇文件-站點(diǎn)管理器-傳輸設(shè)置-選擇主動(dòng)-點(diǎn)擊連接即可
6.郵件確認(rèn)
待傳輸完成后,點(diǎn)擊Notify GEO通知GEO審核數(shù)據(jù),GEO官方大概在5個(gè)工作日左右回復(fù),在收到管理員郵件確認(rèn)之前不要引用GEO號(hào)。
在方框輸入上傳文件路徑
選擇數(shù)據(jù)公開的時(shí)間(根據(jù)需求自行決定)
注:若老師選擇3年后公開,后續(xù)想更改時(shí)間,可以進(jìn)行提交界面,通過設(shè)置修改時(shí)間,或者直接反饋GEO官網(wǎng)進(jìn)行修改。
二.GEO數(shù)據(jù)上傳常見問題
1.連接失敗問題
忽略錯(cuò)誤,在遠(yuǎn)程站點(diǎn)處輸入GEO給出的上傳路徑,回車后將要上傳的文件夾拖曳到右側(cè)即可開始上傳。
2.FTP上傳數(shù)據(jù)報(bào)550錯(cuò)誤
請(qǐng)求操作未被執(zhí)行,文件不可用,可以嘗試以下的方法來解決:
(1)準(zhǔn)備要傳輸?shù)奈募灰蜷_使用,很多人經(jīng)常會(huì)忘記關(guān)閉了個(gè)別的文件,同時(shí)又將文件發(fā)給別人,這種正在使用著的文件是傳輸不過去的;
(2)文件的體積比較大,傳輸過程中耗費(fèi)時(shí)間比較長(zhǎng),網(wǎng)絡(luò)不穩(wěn)定,容易造成傳輸文件中斷,可以嘗試將體積比較大的文件分開傳輸,或者嘗試將文件壓縮一些體積,打包傳輸;
(3)網(wǎng)絡(luò)條件比較差,網(wǎng)絡(luò)不給力,傳輸文件比較困難,可以在網(wǎng)絡(luò)較好的情況下再傳輸;
(4)電腦上某些殺毒軟件攔截文件,造成文件傳輸?shù)腻e(cuò)誤,可以嘗試暫時(shí)關(guān)閉特殊的殺毒軟件。
3.Ftp服務(wù)器連接失敗
主要分為以下四種情況:
(1)連接被拒, 錯(cuò)誤信息如下:
正在連接到 -> DNS= IP=218.13.164.102 PORT=21
連接失敗 (連接被拒)
原因:這是因?yàn)榭蛻粼谧鱂tp上傳時(shí) 填寫錯(cuò)了Ftp服務(wù)器造成這個(gè)問題。
解決:在Ftp上傳時(shí)服務(wù)器填寫。
(2)FTP用戶登入失敗 錯(cuò)誤信息如下:
正在連接到 -> DNS= IP=211.155.224.184 PORT=21 已連接到 (Ftp服務(wù)器連接成功)
220 Serv-U FTP Server v6.2 for WinSock ready...
USER test
331 User name okay, need .
PASS (隱藏)
530 Not logged in.
原因:這是用戶填寫錯(cuò)誤的FTP服務(wù)器、Ftp用戶名/或Ftp密碼。
解決:請(qǐng)您核對(duì)您的Ftp 信息(開通空間時(shí),系統(tǒng)會(huì)把FTP信息發(fā)到你郵箱里,你可以查看一下郵件)。如果您忘記Ftp密碼。可以在“用戶中心---虛擬主機(jī)管理---控制面板”里重設(shè)Ftp密碼。
(3)用戶本地上網(wǎng)問題,錯(cuò)誤信息如下:
無法解析主機(jī):
C:\>ping
Ping request could not find host .please check the name and try again.
原因:如這兩種情況同時(shí)都出現(xiàn),那是用戶本地上網(wǎng)的DNS有問題。
解決:請(qǐng)用其它的DNS試下。
(4)Ftp服務(wù)器解析正常,Ftp服務(wù)器連接超時(shí),錯(cuò)誤信息如下:
正在連接到 -> DNS= IP=203.171.239.16 PORT=21 連接失敗(連接超時(shí))
原因:網(wǎng)絡(luò)方面有問題。
解決:更換網(wǎng)絡(luò)再次嘗試。
總結(jié):目前最常見的FTP錯(cuò)誤檢查主要是檢查FTP服務(wù)器、Ftp用戶名/或Ftp密碼是否正確;切換站點(diǎn)管理器中傳輸設(shè)置的主動(dòng)被動(dòng)模式;站點(diǎn)管理器常規(guī)中的加密選項(xiàng)選擇只使用普通FTP(不安全)。
以上就是本次GEO數(shù)據(jù)上傳操作指南的主要內(nèi)容啦,希望可以對(duì)各位老師有所幫助。后續(xù)小編還會(huì)推出SRA數(shù)據(jù)上傳指南,敬請(qǐng)期待~
鍵盤操作方法
鍵盤操作方法
1、Esc:取消鍵
2、F1~F12鍵:功能鍵。在不同的軟件中,起為其定義的相應(yīng)功能的作用,也可以配合其他的鍵起作用。例如在常用軟件中按一下F1是幫助功能。
3、Tab:切換鍵 。
4、Caps look:字母大小寫切換鍵 。
5、Shift: 換檔鍵 。
6、Ctrl:控制鍵,一般與其它鍵組合使用。例如復(fù)制 CTRL+C 。
7、Alt:選擇鍵,一般與其它鍵組合使用。例如要將計(jì)算機(jī)熱啟動(dòng)可以同時(shí)按住Ctrl+Alt+Del完成。
8、:退格鍵。
9、Enter:回車鍵,用于執(zhí)行操作。
10、Print Screen|SysRq:打印鍵或拍照鍵
11、Scroll Lock:用于開啟中間區(qū)域的鍵
12、Pause|Break:暫停鍵
13、Home:光標(biāo)移動(dòng)到字的開頭
14、Insert:插入鍵
15、Delete:刪除鍵
16、End:光標(biāo)移動(dòng)到字的結(jié)尾
17、PageUp鍵:向上翻頁鍵。
18、鍵:向下翻頁鍵。
19、10.Num Lock:燈滅的話,鍵盤右邊的數(shù)字鍵那一塊(俗稱小鍵盤)就無效了,按一下Num lock就會(huì)亮起來,就可以用了。