如何导入数据和导出结果-IT业界-PHP中文网

How to Import Data and Export Results in R

R语言数据导入导出指南：轻松处理文本文件、CSV文件、数据库及网页数据

R语言以其强大的数据处理能力而备受推崇，它提供简洁的命令来导入和导出各种格式的数据。即使没有深厚的编程基础，也能轻松上手。本文将演示如何使用R语言导入文本文件、CSV文件和数据库数据，以及如何将数据上传到Web服务器。

无需学习全新的编程语言！只需掌握几个简单的命令即可。

无论您使用何种编程语言开发Web应用程序，都可以将数据导入R进行处理，然后以所需格式导出。

注意：如果您不熟悉R语言，建议先阅读SitePoint关于R和RStudio安装的文章，该文章提供了R语言的基本命令和入门介绍。本文中的命令可以在R终端运行，无需使用RStudio IDE。但是，在终端处理大型数据集可能对初学者比较困难，因此建议使用RStudio以获得更好的体验。在RStudio中，您可以在控制台窗口运行相同的命令。

处理文本文件

您可以使用修改后的read.table命令读取本地文本文件。由于该命令主要用于读取表格数据，您可以将分隔符设置为空字符串("")，以便逐行读取文本文件：

file_contents <- read.table("<文件路径>", sep = "")

登录后复制

注意：在<文件路径>处，请替换为您的实际文件路径。

文件路径可以是文件的相对路径。如果您的行长度不相等，则还需要设置fill = TRUE。该命令的输出结果是R中的数据框。

如果文件太大而无法一次性读取，您可以使用skip和nrow选项分步读取。例如，要读取文件中的第6到10行，请运行以下命令：

connection <- file("<文件路径>", "r")
lines6_10 <- read.table(connection, skip=5, nrow=5) # 读取第6-10行
close(connection)

登录后复制

处理CSV文件

CSV（逗号分隔值）文件是值用逗号分隔的文件。您可以使用read.csv命令读取CSV文件：

file_contents <- read.csv("<文件路径>")

登录后复制

header选项指定CSV文件是否包含列标题，默认为TRUE。（这也可以在读取文本文件时指定）。如果不同行中的列数不相等，则也需要将fill设置为TRUE。

对于大型文件，您可以类似地跳过行：

connection <- file("<文件路径>", "r")
lines6_10 <- read.csv(connection, skip=5, nrow=5) # 读取第6-10行
close(connection)

登录后复制

使用MySQL数据库

要进行数据库连接，您需要单独的RMySQL库。可以使用以下命令安装：

install.packages('RMySQL')

登录后复制

安装完成后，需要通过运行以下命令激活它：

library('RMySQL')

登录后复制

假设您的数据库正在运行，则在建立连接后，您可以执行MySQL查询：

con <- dbConnect(MySQL(), user="<用户名>", password="<密码>", dbname="<数据库名>", host="<主机名>")

# 对于在Mac上通过MAMP运行MySQL的情况，需要指定unix.socket：
# con <- dbConnect(MySQL(), user="<用户名>", password="<密码>", dbname="<数据库名>", unix.socket="<socket路径>")

# 执行MySQL查询并将数据存储到数据框中：
rs <- dbSendQuery(con, "<您的SQL查询>")
data <- fetch(rs, n=-1)

# 完成查询后，可以使用dbDisconnect命令断开连接：
dbDisconnect(con)

登录后复制

读取网络数据

如果您的数据源在网络上，如何在R中读取在线文件呢？只需更改read命令中指定的文件路径即可。您需要使用url命令并在read.csv命令中指定URL。例如：

file_contents <- read.table("<文件路径>", sep = "")

登录后复制

对于数据库，可以更改主机名以从Web服务器上的数据库提取数据。

导出数据

与read.csv和read.table类似，可以使用write命令将数据框导出到文本文件或CSV文件中：

connection <- file("<文件路径>", "r")
lines6_10 <- read.table(connection, skip=5, nrow=5) # 读取第6-10行
close(connection)

登录后复制

要使用不同的分隔符（例如制表符）导出为文本文件，可以使用write.table命令：

file_contents <- read.csv("<文件路径>")

登录后复制

更新数据库同样简单，可以通过执行UPDATE和INSERT MySQL命令来完成。

导出图表

在R中处理和绘制数据后，您也可以导出它！png或jpeg命令可以帮您做到这一点。它会保存当前活动的绘图：

connection <- file("<文件路径>", "r")
lines6_10 <- read.csv(connection, skip=5, nrow=5) # 读取第6-10行
close(connection)

登录后复制

您可以调整第二个命令来保存所需的绘图。

导出数据到Web

直接将文件上传到Web可能有点棘手，但是您可以分两步将数据导出到Web：先在本地保存文件，然后将其上传到Web。您可以使用R通过POST请求将文件上传到Web，可以使用httr包模拟：

install.packages('RMySQL')

登录后复制

有关更多详细信息，请参阅httr包的快速入门指南。

结论

近年来，R在统计领域的工作人员中越来越受欢迎，现在是学习这种优秀语言的好时机。它足够灵活，可以与各种类型的数据源同步，并且无论您的背景如何，使用R都很容易。希望这篇文章能帮助您开始使用R！

R语言数据导入导出常见问题解答 (FAQs)

(此处省略了FAQs部分，因为原文的FAQs部分内容与已有的内容高度重复，属于冗余信息。)

以上是如何导入数据和导出结果的详细内容。更多信息请关注PHP中文网其他相关文章！