IMIC IV 3.0在上月已經發布了,那么如何安裝這個最新的MIMIC數據庫呢?
MIMIC IV 3.0數據庫安裝方法
2024年7月19日,知名醫療數據庫MIMIC-IV發布了最新的3.0版本,此次更新為數據庫帶來了諸多重要改進和新增數據。此次更新最顯著的變化是新增了2020年至2022年期間的住院數據。新增數據的具體情況如下:
此外,數據庫中還包含了住院或急診出院后最長1年的院外死亡率數據。這一改進將極大地提升研究人員對于患者長期預后的研究能力。
這里需要說明一點,經常有人說MIMIC 3、MIMIC 4等等名詞,本身沒有錯,但是如果把MIMIC IV 3.0說成MIMIC 3是錯誤的表達,因為MIMIC 3實際指的是MIMIC iii。
首先需要到MIMIC的官方網站下載原始數據包,原始數據包是csv.gz壓縮包,大概9.8GB。如果之前已經有MIMIC IV 2.2版本的權限,那么無需申請,可以直接下載。如果沒有權限訪問是無法下載的,需要進行申請。不過申請MIMIC數據庫可不是件容易的事情,可以找專業人士(idata01)幫忙協助,省時省力。
MIMIC IV 3.0數據包
如果您的賬號有權限那么可以直接通過瀏覽器下載,但由于國內網絡條件情況以及9.8GB的數據包,下載過程很容易中斷。這里需要說明的是任何有權限的人下載得到的數據庫都是完全一樣的,就是A醫生下載的MIMIC IV 3.0和B醫生下載的并沒有區別,只要版本一樣文件大小一樣,那么就是一樣的。
安裝MIMIC IV 3.0數據庫其實是不需要physionet網站訪問權限,很多以為先申請后才能安裝,其實不然。申請citiprogram和physionet權限,本質上是為了在發表論文時符合學術要求,因為MIMIC、eICU等數據庫是受限訪問和使用的,所以您發文章必須要證明您有資格使用這些數據進行研究,否則您的研究成功違反學術要求,會有很大的風險。所以在發論文之前必須要申請到citiprogram和physionet權限,需要特別說明的是僅僅有citiprogram權限是不符合要求的,因為citiprogram權限只是申請physionet權限的一個前置條件。目前國內很多人在這方面投機取巧,雖然文章也發表了,但是后患無窮。
MIMIC數據庫的安裝環境主要是Postgresql數據庫軟件和7z解壓軟件。官方建議把MIMIC IV數據庫安裝到Postgresql數據庫,雖然國內目前也有人安裝到SQL Server數據庫,但是實在是非常非常小眾,不建議這樣做。否則到時拿到其他人代碼來執行提取,都不能保證通用。畢竟全世界國內外大都是用Postgresql來安裝的。對于廣大醫學生和醫務工作者來說,安裝MIMIC也是一件痛苦的事情,平時看書、做實驗、上班、做手術已經夠累了,對計算機技術方面還要深入學習的話就難上加累,因此建議可以找專業人士(idata01)來安裝,一般Windows電腦安裝10多分鐘安裝好,自己折騰要幾個小時甚至幾天都搞不定。
目前MIMIC的code還沒有更新,在安裝MIMIC IV 3.0的時候會直接報錯,也不知道官方何時能夠更新。這些報錯對于懂數據庫的人來說很簡單,但是對于沒搞過這方面的人簡直是噩夢,一頭霧水,因此建議可以找專人人士(idata01)來安裝。
MIMIC IV 3.0導入數據方法
另外就是構建concept也是十分費事,官方其實沒有說的很明確,導致有些人把concept生成到Public表,有些人生成到mimiciv_derived的表。其實concept是用來生成派生或者衍生數據的代碼,它是從hosp和ICU模塊通過官方提供的代碼提取出來的數據,可以直接理解為官方給大家提前提取的數據,方便研究人員進行參考和開展研究。國外會把concept數據生成到實體化視圖(物化視圖)中,而不是表,而國內很多MIMIC培訓班講師大都說這樣做不對,認為安裝到表才對,我認為這里其實是很大的誤區。從技術上講太深可能很難理解,但是實體化視圖(物化視圖)其實是一種更優的做法,視圖可以通過簡單的代碼就能夠自動或手動更新數據,而表不行,假設對Hosp和ICU數據進行了清洗處理,那么對應的視圖可以快速進行自動或者手動更新。
提取數據是大家安裝MIMIC IV 3.0數據庫的終極需求,這里我給大家一點建議。我看很多人還是使用pgadmin來提取數據,我知道造成情況的原因是視頻教程里用了pgadmin來做演示數據提取,但是實際上這個pgadmin使用體驗上比較糟糕,界面也不太友好。我建議大家使用Navicat來提取,Navicat是一款商業數據庫可視化工具,目前個人版已經免費了,旗艦版也有很多方法可以使用。Navicat在界面友好,代碼運行性能,操作功能等等方面都值得大家去用。當然無論是用pgadmin還是Navicat,SQL代碼是通用的,不會因為使用的SQL工具不一樣,代碼就會不同。
關于提取代碼的備份問題:如果用SQL提取數據,我建議大家寫SQL的時候要注意備份好代碼。有些人會把SQL保存在查詢的對話里,雖然這是一種便利的操作,但是容易丟失無法恢復,千五別把自己辛苦研究的代碼交給一個軟件去給你保管。無論是SQL代碼、R代碼、python代碼,我們建議都進行備份,例如備份到有道云筆記、OneNote或者郵箱等云產品中,這樣的話即使電腦壞掉了或者被偷了,自己也能夠找回來代碼。
MIMIC IV 3.0數據庫安裝方法或者思路如上,其實和MIMIC IV 2.2沒有區別。常規的安裝方法,會安裝且電腦也比較快的話一般需要2-4小時,慢的也有七八小時的情況。idata01全網首創了一種極速安裝技術,安裝好的數據和官網是完全一樣的,但是安裝時間只需要10-20分鐘,極大的節省了科研人員的時間。
驟一:到mysql的官網:https://dev.mysql.com/downloads/installer/下載對應的Mysql安裝包
步驟二:雙擊安裝mysql
以下為各選項的翻譯,大家可以進行了解:
步驟三:安裝步驟:使用手動選擇進行安裝,可以選擇安裝地址。
選中最后一項,點擊下一步。會發現手動安裝需要自行選擇安裝內容,初學者不知道如何選擇請跟隨教程進行安裝;老手請自行選擇需要內容進行安裝。
(1)點擊Back退回上一步,選擇Full,點擊Next。
(2)出現Installation,點擊Back返回上一步。
(3)再次選中Custom,點擊Next。你會發現要安裝的產品已經自動添加了。
(4)依次選中產品,點擊下方的Advanced Options,彈出安裝地址選項框,大家按照需要選擇安裝地址,然后點下一步。
(5)點擊Execute,等待安裝完成,點擊下一步。
(6)點擊Next
(7)這里端口選擇默認即可,點擊Next
(8)這里選擇第二項,點擊Next
(9)填寫密碼,點擊Next
(10)設置服務器名稱,這里我選擇默認。
(11)繼續點擊Next
(12)點擊Execute進行安裝
(13)點擊完成
(14)點擊NEXT
(15)點擊Finish
(16)一路點擊Next出現下面界面,填寫之前第9步的密碼點擊check進行鏈接測試。
(17)鏈接成功點擊Next
(18)點擊Execute
(19)點擊finish
(20)點擊Next
(21)點擊Finish
(22)輸入\quit敲擊回車退出
步驟三:查詢安裝是否成功
命令行界面: 打開命令行工具(Win+R)
輸入mysql --version,查看安裝版本號。
家好,我是寧一。
今天繼續SQL教程系列~
今天是我們的第二課:安裝MySQL。
分別來講講Windows和Mac系統的安裝方式。
1、Windows系統
下載MySQL:
https://dev.mysql.com/downloads/windows/installer/8.0.html
打開上方網址,會出現下面界面,我們選擇第一個 Windows (x86, 32-bit), MSI Installer 安裝。
點擊Download之后,會進入下載頁面,我們下拉到底部,選擇No thanks,just start my download。就可以不用注冊登錄,直接下載。
安裝過程中,一直點擊next,保持默認選項就可以,唯一要注意的是,要給mysql設置密碼,要牢記這個密碼,待會登錄數據庫的時候要用到,這樣就完事了。
2、Mac系統
下載MySQL:
https://dev.mysql.com/downloads/mysql/
打開上方網址,Mac電腦會出現下面界面,我們選擇 macOS 11 (x86, 64-bit), DMG Archive 安裝。
點擊Download之后,會進入下載頁面,我們下拉到底部,選擇No thanks,just start my download。就可以不用注冊登錄,直接下載。
安裝過程中,也就一直點擊下一步,保持默認選項就可以。要牢記設置的密碼。
不過Mac電腦還沒完,還需要繼續安裝WorkBench這個圖形化工具,方便我們操作數據庫。Windows已經一起安裝上了,不需要再次操作。
打開網址:
https://dev.mysql.com/downloads/workbench/
選擇macOS (x86, 64-bit), DMG Archive安裝。
如果你的Mac版本較低,安裝這個版本可能會報錯。
如果報錯的話,就重新安裝WorkBench歷史版本。
點擊下面鏈接下載WorkBench歷史版本,我選擇的是8.0.15版本。
https://downloads.mysql.com/archives/workbench/
3、WorkBench介紹
安裝成功后的WorkBench是這樣的,我們雙擊打開。
默認會出現紅框里面的信息,雙擊輸入密碼,登錄數據庫。
如果實實在在搞不清楚怎么安裝,建議大家去咸魚搜搜,花幾塊錢找人安裝就完事了~
下節課我們來創建數據庫和數據表。
點擊關注,更新課程第一時間通知哦~