今天我们来聊一下如何在R语言中读入数据和导出存储数据?对于在文件中进行的读取和写入工作,R使用工作目录来完成。
如果一个文件不在工作目录里则必须给出它的路径。用setwd()设置工作路径,用getwd()查看目前的工作路径。工作目录的设定也可以通过“文件”菜单的“改变当前目录。。。”来完成。
设置好工作路径后,接下来要做的就是读取数据,那么不同类型的数据,读取方法也是不同的。
1、读取表格格式数据的函数常用read.table()和read.csv()。他们是R里读取数据最常用的函数,用来读取以行和列形式存储的文本数据,并且在R中返回数据框。
2、readLines()函数可以逐行读取文本文件,并且在R中返回字符向量。
3、source()是读取R代码的重要函数,如果你有保存成文本文件的R代码,例如函数,你就可以用source()函数来把代码读进R里。
4、dget()函数也可以读取R代码文件。
5、load()和unseralize()函数能把二进制文件读取到R中。
6、R还可以读取网络数据,其他统计软件的数据,因为他们仅对R高级应用有用,这里不细说。
相应的存储函数有:
1、write.table() 2、writeLines() 3、dump() 4、dput() 5、save() 6、seralize()
那么这么多函数,作为基础,我们重点只要先弄清楚最常见的数据类型怎么读入R中。
一、读取txt数据,使用read.table,它们的分隔符是一样的。
常见格式:
- read.table(file, header = FALSE, sep = "", quote = ""'",dec = ".", skip = 0,
- strip.white = FALSE, blank.lines.skip = TRUE,comment.char = "#")
包含的这些参数分别代表什么意思?
举例:
二、读取csv数据,可以使用read.table()也可以使用read.csv()函数。
还可以使用read.csv(),它默认是***行是标题栏。所以不用再写
header=T。而且read.csv()分隔符是逗号,和csv是一样的。
三、如何读取excel文件?
CSV读入的速度较快,笔者这边整理的是一种EXCEL VBA把xlsx先转换为csv,然后利用read.csv导入的办法。因为excel的读入非常麻烦,依赖其他包。比如RODBC扩展包,xlsx包,XLConnect包。
四、如何读取网络数据?
url建立一个指向网站的连接。例如: