R语言怎么读取xlsx文件

发布时间:2021-09-14 18:13 来源:亿速云 阅读:0 作者:chen 栏目: 服务器

本篇内容介绍了“R语言怎么读取xlsx文件”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!



关于R语言读取Excel文件,比较麻烦,我从来都反对直接读取xlsx文件,因为爬虫数据时,一般保存的格式都是csv文件,或者直接保存到数据库里面,没有谁会保存到Excel文件里面。不管是txt文本文件,还是csv逗号分割符文件,都是可用R自带函数读取的,即使对于一般不太大的文件,我们可以将其打开另存为csv文件,当然了,Excel对于超过100万条的数据,也不一定是100万条,这与每一行数据量多少还是有关的,我是没有见过几百万条的Excel文件的,xlsx表格文件一般是拿来做商务报表的,应该没有几百万行的数据吧!



R语言读取csv文件

废话不多说,这里还是介绍一下怎么读写xlsx文件吧,毕竟很多人都有强迫症,非要直接读取xlsx文件,尤其是学习数学的,意志力很坚强!

R语言想要处理xlsx文件,需要第三方包xlsx包,而xlsx包又依赖rJava包,因为写xlsx包的这个大牛不想重复造轮子,直接调用了rJava包中的函数,而rJava包需要java环境,所以总结起来需要完成以下三步:

  • 安装jdk提供java语言的开发和运行环境,其实只需要运行环境jre就行了;

  • 安装rJava包;

  • 安装xlsx包

安装jdk

1、去java官网下载jdk安装包,网址:www.java.com或者www.oracle.com都是可以的,java与jdk的关系可以理解为C语言与VC++的关系,我就这样解释。有了安装包,就可以安装了,根据安装向导安装即可

2、配置java环境变量

为什么需要配置环境变量,需要让系统运行R语言需要java时能够找到java环境。

我的jdk版本是jdk1.8.0_144

比如我的jdk安装路径是:D:\Program Files\Java\jdk1.8.0_144\bin

右键我的电脑==>属性==>高级系统设置==>环境变量

新建系统变量(用户变量也行)JAVA_HOME=D:\Program Files\Java\jdk1.8.0_144

在path变量开头加入%JAVA_HOME%\bin;,记得打分号,养成习惯,这样bin目录下面的二进制java.exe可执行文件就被系统知道,win+R组合键输入cmd,进入命令行,然后输入java -version显示jdk版本,表明java环境配置成功!

安装rjava包

安装xlsx包

总结:只要java环境配置成功,安装rJava、xlsx这两个包是肯定成功的,屡试不爽,不同系统,我都整过好几次,没有出过意外的。就是这么简单。

安装好了之后,我们就可以开心的操作xlsx文件了。

导入包

这个xlsxjars包是会随着xlsx包的自动下载导入同时进行的,不用担心。

我D盘根目录下面有一个xlsx文件,把它读取一下:

第一个参数表示文件名,第二个表示要读取的SheetIndex,因为有的xlsx表可能有多个sheet表,就像这样:

据需要制定要读取第几张表,因为第二个参数就是指定表的参数,所以不需要这样写:

> dat <- read.xlsx('test.xlsx',sheetIndex = 1)

这样写的话,参数位置不需要一一对应,因为你指定了参数名称,如果省略了,就需要与默认参数位置一一对应。

写入数据:

> write.xlsx(dat,'test2.xlsx')

就在工作空间D:\\下面产生了一个test2.xlsx文件,内容就是dat的数据内容。

还是打开看一下:

关于R语言读取xlsx文件,就是这么多,我是强烈不赞成直接读取的,强迫症,耗人力、耗时间、耗内存资源!

建议:读取xlsx文件,还是这么做吧:

1)、xlsx文件另存为csv文件;

2)、R读取csv文件即可,read.csv(path,header) 

免责声明:本站发布的内容(图片、视频和文字)以原创、来自本网站内容采集于网络互联网转载等其它媒体和分享为主,内容观点不代表本网站立场,如侵犯了原作者的版权,请告知一经查实,将立刻删除涉嫌侵权内容,联系QQ:712375056。