索性數(shù)據(jù)分析是數(shù)據(jù)科學(xué)模型開發(fā)和數(shù)據(jù)集研究的重要組成部分之一。在拿到一個新數(shù)據(jù)集時首先就需要花費大量時間進(jìn)行EDA來研究數(shù)據(jù)集中內(nèi)在的信息。自動化的EDA軟件包可以用幾行Python代碼執(zhí)行EDA。 在本文中,我們整理了10個可以自動執(zhí)行EDA并生成有關(guān)數(shù)據(jù)的見解的軟件包,看看他們都有什么功能,能在多大程度上幫我們自動化解決EDA的需求。
1) DTale
2) Pandas-profiling
3) sweetviz
4) autoviz
5) dataprep
6) KLib
7) dabl
8) speedML
9) datatile
10) edaviz
D-Tale使用Flask作為后端、React前端并且可以與ipython notebook和終端無縫集成。D-Tale可以支持Pandas的DataFrame, Series, MultiIndex, DatetimeIndex和RangeIndex。
import dtale
import pandas as pd
dtale.show(pd.read_csv("titanic.csv"))
D-Tale庫用一行代碼就可以生成一個報告,其中包含數(shù)據(jù)集、相關(guān)性、圖表和熱圖的總體總結(jié),并突出顯示缺失的值等。D-Tale還可以為報告中的每個圖表進(jìn)行分析,上面截圖中我們可以看到圖表是可以進(jìn)行交互操作的。
Pandas-Profiling可以生成Pandas DataFrame的概要報告。panda-profiling擴(kuò)展了pandas DataFrame df.profile_report(),并且在大型數(shù)據(jù)集上工作的非常好,它可以在幾秒鐘內(nèi)創(chuàng)建報告。
#Install the below libaries before importing
import pandas as pd
from pandas_profiling import ProfileReport
#EDA using pandas-profiling
profile=ProfileReport(pd.read_csv('titanic.csv'), explorative=True)
#Saving results to a HTML file
profile.to_file("output.html")
Sweetviz是一個開源的Python庫,只需要兩行Python代碼就可以生成漂亮的可視化圖,將EDA(探索性數(shù)據(jù)分析)作為一個HTML應(yīng)用程序啟動。Sweetviz包是圍繞快速可視化目標(biāo)值和比較數(shù)據(jù)集構(gòu)建的。
import pandas as pd
import sweetviz as sv
#EDA using Autoviz
sweet_report=sv.analyze(pd.read_csv("titanic.csv"))
#Saving results to HTML file
sweet_report.show_html('sweet_report.html')
Sweetviz庫生成的報告包含數(shù)據(jù)集、相關(guān)性、分類和數(shù)字特征關(guān)聯(lián)等的總體總結(jié)。
Autoviz包可以用一行代碼自動可視化任何大小的數(shù)據(jù)集,并自動生成HTML、bokeh等報告。用戶可以與AutoViz包生成的HTML報告進(jìn)行交互。
import pandas as pd
from autoviz.AutoViz_Class import AutoViz_Class
#EDA using Autoviz
autoviz=AutoViz_Class().AutoViz('train.csv')
Dataprep是一個用于分析、準(zhǔn)備和處理數(shù)據(jù)的開源Python包。DataPrep構(gòu)建在Pandas和Dask DataFrame之上,可以很容易地與其他Python庫集成。
DataPrep的運行速度這10個包中最快的,他在幾秒鐘內(nèi)就可以為Pandas/Dask DataFrame生成報告。
from dataprep.datasets import load_dataset
from dataprep.eda import create_report
df=load_dataset("titanic.csv")
create_report(df).show_browser()
klib是一個用于導(dǎo)入、清理、分析和預(yù)處理數(shù)據(jù)的Python庫。
import klib
import pandas as pd
df=pd.read_csv('DATASET.csv')
klib.missingval_plot(df)
klib.corr_plot(df_cleaned, annot=False)
klib.dist_plot(df_cleaned['Win_Prob'])
klib.cat_plot(df, figsize=(50,15))
klibe雖然提供了很多的分析函數(shù),但是對于每一個分析需要我們手動的編寫代碼,所以只能說是半自動化的操作,但是如果我們需要更定制化的分析,他是非常方便的。
Dabl不太關(guān)注單個列的統(tǒng)計度量,而是更多地關(guān)注通過可視化提供快速概述,以及方便的機器學(xué)習(xí)預(yù)處理和模型搜索。
dabl中的Plot()函數(shù)可以通過繪制各種圖來實現(xiàn)可視化,包括:
import pandas as pd
import dabl
df=pd.read_csv("titanic.csv")
dabl.plot(df, target_col="Survived")
SpeedML是用于快速啟動機器學(xué)習(xí)管道的Python包。 SpeedML整合了一些常用的ML包,包括Pandas,Numpy,Sklearn,Xgboost和Matplotlib,所以說其實SpeedML不僅僅包含自動化EDA的功能。
SpeedML官方說,使用它可以基于迭代進(jìn)行開發(fā),將編碼時間縮短了70%。
from speedml import Speedml
sml=Speedml('../input/train.csv', '../input/test.csv',
target='Survived', uid='PassengerId')
sml.plot.correlate()
sml.plot.distribute()
sml.plot.ordinal('Parch')
sml.plot.continuous('Age')
DataTile(以前稱為Pandas-Summary)是一個開源的Python軟件包,負(fù)責(zé)管理,匯總和可視化數(shù)據(jù)。 DataTile基本上是PANDAS DataFrame describe()函數(shù)的擴(kuò)展。
import pandas as pd
from datatile.summary.df import DataFrameSummary
df=pd.read_csv('titanic.csv')
dfs=DataFrameSummary(df)
dfs.summary()
edaviz是一個可以在Jupyter Notebook和Jupyter Lab中進(jìn)行數(shù)據(jù)探索和可視化的python庫,他本來是非常好用的,但是后來被磚廠(Databricks)收購并且整合到bamboolib 中,所以這里就簡單的給個演示。
在本文中,我們介紹了10個自動探索性數(shù)據(jù)分析Python軟件包,這些軟件包可以在幾行Python代碼中生成數(shù)據(jù)摘要并進(jìn)行可視化。 通過自動化的工作可以節(jié)省我們的很多時間。
Dataprep是我最常用的EDA包,AutoViz和D-table也是不錯的選擇,如果你需要定制化分析可以使用Klib,SpeedML整合的東西比較多,單獨使用它啊進(jìn)行EDA分析不是特別的適用,其他的包可以根據(jù)個人喜好選擇,其實都還是很好用的,最后edaviz就不要考慮了,因為已經(jīng)不開源了。
作者:Satyam Kumar
電路仿真軟件有哪些呢?今天整理了六款常用的電路仿真軟件,推薦給大家。需要下載電路仿真軟件的用戶可以選擇。
Machining
數(shù)控仿真軟件 Machining數(shù)控仿真軟件初學(xué)者通過使用它掌握數(shù)控編程原理與應(yīng)用,在使用過程中用戶可以看到自己的編程結(jié)果從而達(dá)到可視化的效果,對提高數(shù)控學(xué)習(xí)人員學(xué)習(xí)G代碼的編寫和機床的操作有很大的幫助。
Machining數(shù)控仿真軟件功能特色:
1.Machining數(shù)控仿真軟件使數(shù)控學(xué)習(xí)不再枯燥無味。使每一個學(xué)生,對數(shù)控加工建立感性認(rèn)識,可以反復(fù)動手進(jìn)行數(shù)控加工操作,有效解決了因數(shù)控設(shè)備昂貴和有一定危險性,很難做到每位學(xué)生“一人一機”的問題,在培養(yǎng)全面熟練掌握數(shù)控加工技術(shù)的實用型技能人才方面發(fā)揮顯著作用。
2.Machining數(shù)控仿真軟件針對數(shù)控加工初學(xué)者,在初學(xué)者使用數(shù)控加工仿真軟件熟悉數(shù)控加工的過程從而降低數(shù)控機床加工實訓(xùn)環(huán)節(jié)易出事故\機床損耗嚴(yán)重等風(fēng)險\降低了費用高等特點。
3.Machining數(shù)控仿真軟件采用簡化的操作和美觀的界面;采用更加直觀接近真實的刀具選擇和安裝方式,為用戶提供了更好的用戶體驗,無須用戶花費過多的精力在學(xué)習(xí)軟件如何使用上;使用軟件時需要結(jié)合各廠家的機床操作說明書和機床編程說明書使用。
LTspiceIV
LTspiceIV是一款高性能SpiceIII仿真器、電路圖捕獲和波形觀測器,并為簡化開關(guān)穩(wěn)壓器的仿真提供了改進(jìn)和模型。
我們對Spice所做的改進(jìn)使得開關(guān)穩(wěn)壓器的仿真速度極快,較之標(biāo)準(zhǔn)的Spice仿真器有了大幅度的提高,從而令用戶只需區(qū)區(qū)幾分鐘便可完成大多數(shù)開關(guān)穩(wěn)壓器的波形觀測。
這里可下載的內(nèi)容包括用于80%的凌力爾特開關(guān)穩(wěn)壓器的Spice和MacroModel,200多種運算放大器模型以及電阻器、晶體管和MOSFET模型。
multisim
multisim NIMultisim10用軟件的方法虛擬電子與電工元器件,虛擬電子與電工儀器和儀表,實現(xiàn)了“軟件即元器件”、“軟件即儀器”。NIMultisim10是一個原理電路設(shè)計、電路功能測試的虛擬仿真軟件。NIMultisim10的元器件庫提供數(shù)千種電路元器件供實驗選用,同時也可以新建或擴(kuò)充已有的元器件庫,而且建庫所需的元器件參數(shù)可以從生產(chǎn)廠商的產(chǎn)品使用手冊中查到,因此也很方便的在工程設(shè)計中使用。
NIMultisim10的虛擬測試儀器儀表種類齊全,有一般實驗用的通用儀器,如萬用表、函數(shù)信號發(fā)生器、雙蹤示波器、直流電源;而且還有一般實驗室少有或沒有的儀器,如波特圖儀、字信號發(fā)生器、邏輯分析儀、邏輯轉(zhuǎn)換器、失真儀、頻譜分析儀和網(wǎng)絡(luò)分析儀等。
NIMultisim10具有較為詳細(xì)的電路分析功能,可以完成電路的瞬態(tài)分析和穩(wěn)態(tài)分析、時域和頻域分析、器件的線性和非線性分析、電路的噪聲分析和失真分析、離散傅里葉分析、電路零極點分析、交直流靈敏度分析等電路分析方法,以幫助設(shè)計人員分析電路的性能。
NIMultisim10可以設(shè)計、測試和演示各種電子電路,包括電工學(xué)、模擬電路、數(shù)字電路、射頻電路及微控制器和接口電路等。可以對被仿真的電路中的元器件設(shè)置各種故障,如開路、短路和不同程度的漏電等,從而觀察不同故障情況下的電路工作狀況。在進(jìn)行仿真的同時,軟件還可以存儲測試點的所有數(shù)據(jù),列出被仿真電路的所有元器件清單,以及存儲測試儀器的工作狀態(tài)、顯示波形和具體數(shù)據(jù)等。NIMultisim10有豐富的Help功能,其Help系統(tǒng)不僅包括軟件本身的操作指南,更要的是包含有元器件的功能解說,Help中這種元器件功能解說有利于使用EWB進(jìn)行CAI教學(xué)。
另外,NIMultisim10還提供了與國內(nèi)外流行的印刷電路板設(shè)計自動化軟件Protel及電路仿真軟件PSpice之間的文件接口,也能通過Windows的剪貼板把電路圖送往文字處理系統(tǒng)中進(jìn)行編輯排版。支持VHDL和VerilogHDL語言的電路仿真與設(shè)計。
利用NIMultisim10可以實現(xiàn)計算機仿真設(shè)計與虛擬實驗,與傳統(tǒng)的電子電路設(shè)計與實驗方法相比,具有如下特點:設(shè)計與實驗可以同步進(jìn)行,可以邊設(shè)計邊實驗,修改調(diào)試方便;設(shè)計和實驗用的元器件及測試儀器儀表齊全,可以完成各種類型的電路設(shè)計與實驗;可方便地對電路參數(shù)進(jìn)行測試和分析;可直接打印輸出實驗數(shù)據(jù)、測試參數(shù)、曲線和電路原理圖;實驗中不消耗實際的元器件,實驗所需元器件的種類和數(shù)量不受限制,實驗成本低,實驗速度快,效率高;設(shè)計和實驗成功的電路可以直接在產(chǎn)品中使用。
NIMultisim10易學(xué)易用,便于電子信息、通信工程、自動化、電氣控制類專業(yè)學(xué)生自學(xué)、便于開展綜合性的設(shè)計和實驗,有利于培養(yǎng)綜合分析能力、開發(fā)和創(chuàng)新的能力。
ProteusPro
ProteusPro Proteus軟件是英國LabCenterElectronics公司出版的EDA工具軟件。它不僅具有其它EDA工具軟件的仿真功能,還能仿真單片機及外圍器件。它是目前比較好的仿真單片機及外圍器件的工具。雖然目前國內(nèi)推廣剛起步,但已受到單片機愛好者、從事單片機教學(xué)的教師、致力于單片機開發(fā)應(yīng)用的科技工作者的青睞。
Proteus是英國著名的EDA工具(仿真軟件),從原理圖布圖、代碼調(diào)試到單片機與外圍電路協(xié)同仿真,一鍵切換到PCB設(shè)計,真正實現(xiàn)了從概念到產(chǎn)品的完整設(shè)計。是目前世界上唯一將電路仿真軟件、PCB設(shè)計軟件和虛擬模型仿真軟件三合一的設(shè)計平臺,其處理器模型支持8051、HC11、PIC10/12/16/18/24/30/DsPIC33、AVR、ARM、8086和MSP430等,2010年又增加了Cortex和DSP系列處理器,并持續(xù)增加其他系列處理器模型。在編譯方面,它也支持IAR、Keil和MPLAB等多種編譯器。
ElectronicWorkbench
ElectronicWorkbench是一款電子電路仿真軟件,可以進(jìn)行各種電路工作演示,模擬各種電子電路,縮放顯示的波形。ElectronicWorkbench是一款經(jīng)典小巧,好用的模擬數(shù)字電路仿真軟件。
有了ElectronicWorkbench,你不用購買昂貴的全套電子儀器,這里有:函數(shù)發(fā)生器、頻譜儀、示波器、數(shù)字萬用表……只要先畫好電路,連好電路與儀器的接線,設(shè)置好各儀器的參數(shù),設(shè)好電源電壓,接通電源即可。它可以進(jìn)行各種電路工作演示,可模擬各種電子電路,電路的工作點,如:波形、頻率、周期、有效值等。
CadenceAllegro
可以縮放顯示的波形,可仿真數(shù)字電路、模擬(線性)電路及數(shù)字電路與模擬(線性)混合
CadenceAllegro Cadence是世界上最大的電子設(shè)計技術(shù)和配套服務(wù)的EDA供貨商之一。Cadence?Allegro?則是Cadence推出的先進(jìn)PCB設(shè)計布線工具。Allegro提供了良好且交互的工作接口和強大完善的功能,和它前端產(chǎn)品Capture的結(jié)合,為當(dāng)前高速、高密度、多層的復(fù)雜PCB設(shè)計布線提供了最完美解決方案。
Allegro擁有完善的Constraint設(shè)定,用戶只須按要求設(shè)定好布線規(guī)則,在布線時不違反DRC就可以達(dá)到布線的設(shè)計要求,從而節(jié)約了煩瑣的人工檢查時間,提高了工作效率!更能夠定義最小線寬或線長等參數(shù)以符合當(dāng)今高速電路板布線的種種需求。
【聲明】本內(nèi)容源自網(wǎng)絡(luò),轉(zhuǎn)載僅供學(xué)習(xí),如有侵權(quán),請聯(lián)系刪除!