使用 R 中的数据类型
介绍
作为一种强大的统计编程语言,R 具有多种数据类型和数据结构。要熟练掌握 R,了解这些数据类型并学习如何使用它们非常重要。
在本指南中,您将学习使用 R 中的数据类型的概念和技术。
数据类型
R 可以使用多种数据类型。一些基本数据类型包括:
- 字符:文本(或字符串)值称为字符,如下例所示。如果我们想确认其类型,可以使用class()函数。事实上,R 提供了很多类似class() 的函数,可用于检查对象的特征,例如typeof()、length()和attribute()。
t = "data types"
class(t)
输出:
1] "character"
- 数字:像 2.3 这样的十进制值在 R 中称为数字。它是默认的计算数据类型。
N = 2.3
class(N)
输出:
1] "numeric"
请注意,变量“N”存储为数值而不是整数。可以使用is.integer()函数检查,如下所示:
is.integer(N)
输出:
1] FALSE
- 整数:如果我们想创建一个整数变量,我们可以使用整数函数。此外,所有整数都是数字,但反之则不然。
i = as.integer(3)
is.integer(i)
is.numeric(i)
输出:
1] TRUE
[1] TRUE
- 逻辑:逻辑值通常通过比较两个或多个变量来创建。这些值用布尔值TRUE或FALSE表示。
x = 100
y = 56
x < y
输出:
1] FALSE
- 复数:复变量由虚数i定义。
z = 3 + 2i
class(z)
输出:
1] "complex"
以上示例是 R 中的基本数据类型。但这并不是 R 中所有类型的详尽列表。R 还具有许多数据结构,我们将在后续章节中进行讨论。
数据结构
向量
向量是 R 中最常见的数据结构。它是相同数据类型的元素序列。vector ()函数可用于创建向量。默认模式是逻辑的,但我们可以使用character()、numeric()等构造函数来创建特定类型的向量。
下面的代码行分别构造一个数字向量和一个逻辑向量。向量还可以包含字符串,如向量“s”所示。
n <- c(1,2,5.3,6,-2,4)
l <- c(TRUE,TRUE,TRUE,FALSE,TRUE,FALSE)
s = c("USA", "UK", "AFRICA", "INDIA", "CHINA")
class(n)
class(l)
class(s)
输出:
1] "numeric"
[1] "list"
[1] "character"
还可以对向量执行多种操作,例如组合向量和向量数学。例如,下面的第一行代码组合了向量“n”和“l”,而第二行打印了新向量的元素。您可以使用长度函数检查结果向量的长度,如第三条命令所示。第四行检查数据类型,结果向量为“字符”类型。这称为向量组合中的值强制。
comb = c(n, s)
comb
length(comb)
class(comb
输出:
1] "1" "2" "5.3" "6" "-2" "4" "USA" "UK"
[9] "AFRICA" "INDIA" "CHINA"
[1] 11
[1] "character"
还可以对向量执行数学运算,如下面的代码行所示。
x = c(5, 3, 4)
y = c(1, 2, 3)
#Arithmetic Operations
5 * x
x-y
x+y
x/y
输出:
1] 25 15 20
[1] 4 1 1
[1] 6 5 7
[1] 5.000000 1.500000 1.333333
矩阵
在 R 中,矩阵是数字或字符向量的扩展。矩阵中的所有列必须具有相同的模式和相同的长度。此外,与原子向量类似,矩阵的元素必须具有相同的数据类型。矩阵的一般表示如下面一行代码所示。
参数nrow和ncol分别表示行数和列数。参数byrow = TRUE表示矩阵应由行填充。
m = matrix(c(20, 45, 33, 19, 52, 37), nrow=2, ncol=3, byrow = TRUE)
print(m)
输出:
可以使用下标来标识矩阵的行、列或元素。例如,可以使用以下命令访问第二行和第二列的元素。
m[2, 2]
输出:
1] 52
列表
列表是包含对象(或组件)集合的通用向量。列表的优点是它允许您将各种可能不相关的对象存储在一个名称下。
下面的代码行创建一个包含三个向量的列表:姓名、地点和年龄。
name = c("abhi", "ansh", "ajay")
place = c("delhi", "mumbai", "pune")
age = c(TRUE, FALSE, TRUE, FALSE, FALSE)
l = list(name, place, age)
print(l)
输出:
[1]]
[1] "abhi" "ansh" "ajay"
[[2]]
[1] "delhi" "mumbai" "pune"
[[3]]
[1] TRUE FALSE TRUE FALSE FALSE
也可以使用单个方括号“[ ]”运算符来切分列表。
l[2]
l[c(2, 3)]
输出:
[1]]
[1] "delhi" "mumbai" "pune"
[[2]]
[1] TRUE FALSE TRUE FALSE FALSE
数据框
数据框可能是 R 中最重要的数据类型。事实上,它是大多数表格数据的实际数据结构,在数据科学中得到广泛使用。简单来说,它是一种特殊类型的列表,其中所有元素的长度都相等。
通常使用read.csv()和read.table()函数将数据框导入 R。您还可以使用data.frame()函数创建一个新的数据框,如下面的代码行所示。
df <- data.frame(rollnum = seq(1:10), h1 = 15:24, h2 = 81:90)
df
输出:
| rollnum | h1 | h2 |
|--------- |---- |---- |
| 1 | 15 | 81 |
| 2 | 16 | 82 |
| 3 | 17 | 83 |
| 4 | 18 | 84 |
| 5 | 19 | 85 |
| 6 | 20 | 86 |
| 7 | 21 | 87 |
| 8 | 22 | 88 |
| 9 | 23 | 89 |
| 10 | 24 | 90 |
结论
在本指南中,您了解了不同类型和结构的数据,包括在 R 中创建和使用数据类型的概念和技术。要了解有关使用 R 进行数据科学的更多信息,请参阅以下指南:
- <a href="https://www-pluralsight-com.translate.goog/resources/blog/guides/interpreting-data-using-descriptive-statistics-r?_x_tr
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~