工欲善其事,必先利其器,了解一些基礎的知識對R的學習是非常有必要的;其中,在使用時適當的使用快捷鍵有助于提高編程效率。編程的東西要多練、多實踐,然后自然而然就能對其“名詞”有更直觀的理解了。
的快捷鍵可在百度中搜索到,針對win平臺的用得很頻繁的快捷鍵如下:
A.控制臺清屏命令 Ctrl+L
B.注釋/取消注釋當前行 Ctrl+Shift+C
C.重新注釋 Ctrl+Shift+/
D.自動補全 Tab or Ctrl+Space(在使用發現已被輸入法占用)
一、課程概覽
二、數據結構是什么
類比蓋房子
1、房子設計 ——架構師(搞清楚用戶需求)
2、蓋房子的區域——R環境
3、準備材料——數據結構(放數據的一個容器)
4、組合材料——算法(分析和展示)
蓋房子=材料+整合材料
程序=數據結構+算法
三、的使用
R是運行環境(R是地基)
是集成開發工具IDE(為了方便開發而產生的)
四、數據結構
1、常用數據結構:向量、矩陣、數組、數據框、列表、因子(暫不介紹)
2、如何定義一個數據結構
3、如何使用一個數據結構
4、向量:相同數據類型的容器(數值或字符串,必須一致)
向量的長度:()
訪問向量中的某個元素:name[1]
5、矩陣
6、數組:多維度
array(,數組中的元素
,各維度元素個數
);各維度名稱
7、數據框
定義:
查找:age1
計算個數:
選出部分:
type1
新增加行:
新增加列:
8、列表:集合各個數據結構
list(name1=,name2=,name3=,…)
五、實踐 (文字 轉自 小熊貓 ·的專欄 )
練習:將excel數據導入到R中,并選取其中的內容
1、導入
我先按照書中載入xlsx包的方法走了一遍,后來又自己搜索了幾種方法,最簡單的是直接用File, ,From Excel,窗口選擇文件即可,這種太簡單,后續就不說了。
1.1 書本方法
書中的方法是安裝xlsx包,但由于xlsx是依賴于和RJava包存在的,因此三個包都要安裝并載入。
首先,安裝xlsx包數據結構基礎教程,通過中安裝xlsx包,在安裝過程中會提示需要安裝和RJava包,確認即可;安裝命令為:.("xlsx");
在使用過程中要記得載入
>
>
>
執行這一串代碼之后,順利導入excel,但讀取到的全是亂碼,如下圖
后來,易成凡同學出手相助,給出了一個解決中文亂碼問題的方法:在括號內加入='UTF-8',完美解決了問題。
如上圖,亂碼問題就不見啦。再次感謝易成凡同學!
1.2 使用粘貼板導入
首先,先復制excel中想要導入的內容,
然后,在中敲入如下代碼
read.table("clipboard",header=T)
如上圖數據結構基礎教程,完美呈現,而且非常方便,想選哪里選哪里。
1.3 安裝 “"包
這種方法也是我喜歡的,可以跨平臺、無依賴的讀取xls,xlsx中的表格數據。
在使用菜單 導入excel時如果沒有安裝“"包或版本過舊 也會有相應提示
不過,文件的名字是亂碼的,好處是可以選擇數據的形式——char、數值、或日期等。但名字的亂碼并不影響內容的獲取。
> .("")
> ()
> ("data")
如上圖,也導入了excel的結果。但要注意data所在的位置必須是工作目錄,如果不是就用setwd進行修改。
2、使用表格中的內容
如果要使用表格中的內容,上述介紹的后兩種方法就直接定義成數據框,然后再在數據框中選擇。如下圖所示,兩種方法定義了和兩個數據框。
然后,以為例進行操作,選擇age列,選擇部分列,顯示行數
在選取具有某些特征的數據時發現一個很容易忽略的錯誤,一個逗號。比如,選擇患有1型糖尿病的病人。
正確代碼應該是:
但我第一次不小心少些了最后一個逗號,于是結果就變成了:
對照了半天才發現其中的差距,R語言果然是實踐的課程。
這確實是一門實踐的課程,用輸出倒逼輸入可以更有效率的學習,以上筆記套用了 小熊貓 ·的筆記框架并直接引用了他的部分筆記,再此特別注明和感謝。