使用 R 中的数据类型

2019-11-06 08:00:00 · 飞浪

介绍作为一种强大的统计编程语言，R具有多种数据类型和数据结构。要熟练掌握R，了解这些数据类型并学习如何使用它们非常重要。在本指南中，您将学习使用R中的数据类型的概念和技术。

介绍

作为一种强大的统计编程语言，R 具有多种数据类型和数据结构。要熟练掌握 R，了解这些数据类型并学习如何使用它们非常重要。

在本指南中，您将学习使用 R 中的数据类型的概念和技术。

数据类型

R 可以使用多种数据类型。一些基本数据类型包括：

字符：文本（或字符串）值称为字符，如下例所示。如果我们想确认其类型，可以使用class()函数。事实上，R 提供了很多类似class() 的函数，可用于检查对象的特征，例如typeof()、length()和attribute()。

      t = "data types"
class(t)
    

输出：

      1] "character"

数字：像 2.3 这样的十进制值在 R 中称为数字。它是默认的计算数据类型。

      N = 2.3
class(N)
    

输出：

      1] "numeric"

请注意，变量“N”存储为数值而不是整数。可以使用is.integer()函数检查，如下所示：

      is.integer(N)

输出：

      1] FALSE

整数：如果我们想创建一个整数变量，我们可以使用整数函数。此外，所有整数都是数字，但反之则不然。

      i = as.integer(3)
is.integer(i)

is.numeric(i)
    

输出：

      1] TRUE

[1] TRUE

逻辑：逻辑值通常通过比较两个或多个变量来创建。这些值用布尔值TRUE或FALSE表示。

      x = 100
y = 56
x < y
    

输出：

      1] FALSE

复数：复变量由虚数i定义。

      z = 3 + 2i 
class(z)
    

输出：

      1] "complex"

以上示例是 R 中的基本数据类型。但这并不是 R 中所有类型的详尽列表。R 还具有许多数据结构，我们将在后续章节中进行讨论。

数据结构

向量

向量是 R 中最常见的数据结构。它是相同数据类型的元素序列。vector ()函数可用于创建向量。默认模式是逻辑的，但我们可以使用character()、numeric()等构造函数来创建特定类型的向量。

下面的代码行分别构造一个数字向量和一个逻辑向量。向量还可以包含字符串，如向量“s”所示。

      n <- c(1,2,5.3,6,-2,4) 
l <- c(TRUE,TRUE,TRUE,FALSE,TRUE,FALSE) 
s = c("USA", "UK", "AFRICA", "INDIA", "CHINA") 

class(n)
class(l)
class(s)
    

输出：

      1] "numeric"

[1] "list"

[1] "character"

还可以对向量执行多种操作，例如组合向量和向量数学。例如，下面的第一行代码组合了向量“n”和“l”，而第二行打印了新向量的元素。您可以使用长度函数检查结果向量的长度，如第三条命令所示。第四行检查数据类型，结果向量为“字符”类型。这称为向量组合中的值强制。

      comb = c(n, s)
comb

length(comb)
class(comb
    

输出：

      1] "1"      "2"      "5.3"    "6"      "-2"     "4"      "USA"    "UK"    
 [9] "AFRICA" "INDIA"  "CHINA"

[1] 11

[1] "character"

还可以对向量执行数学运算，如下面的代码行所示。

      x = c(5, 3, 4) 
y = c(1, 2, 3)

#Arithmetic Operations
5 * x
x-y
x+y
x/y
    

输出：

      1] 25 15 20

[1] 4 1 1

[1] 6 5 7

[1] 5.000000 1.500000 1.333333

矩阵

在 R 中，矩阵是数字或字符向量的扩展。矩阵中的所有列必须具有相同的模式和相同的长度。此外，与原子向量类似，矩阵的元素必须具有相同的数据类型。矩阵的一般表示如下面一行代码所示。

参数nrow和ncol分别表示行数和列数。参数byrow = TRUE表示矩阵应由行填充。

      m = matrix(c(20, 45, 33, 19, 52, 37), nrow=2, ncol=3, byrow = TRUE)    
print(m)
    

输出：

可以使用下标来标识矩阵的行、列或元素。例如，可以使用以下命令访问第二行和第二列的元素。

      m[2, 2]

输出：

      1] 52

列表

列表是包含对象（或组件）集合的通用向量。列表的优点是它允许您将各种可能不相关的对象存储在一个名称下。

下面的代码行创建一个包含三个向量的列表：姓名、地点和年龄。

      name = c("abhi", "ansh", "ajay") 
place = c("delhi", "mumbai", "pune") 
age = c(TRUE, FALSE, TRUE, FALSE, FALSE) 

l = list(name, place, age)   
print(l)
    

输出：

      [1]]
[1] "abhi" "ansh" "ajay"

[[2]]
[1] "delhi"  "mumbai" "pune"  

[[3]]
[1]  TRUE FALSE  TRUE FALSE FALSE
    

也可以使用单个方括号“[ ]”运算符来切分列表。

      l[2] 

l[c(2, 3)]

输出：

      [1]]
[1] "delhi"  "mumbai" "pune"  

[[2]]
[1]  TRUE FALSE  TRUE FALSE FALSE
    

数据框

数据框可能是 R 中最重要的数据类型。事实上，它是大多数表格数据的实际数据结构，在数据科学中得到广泛使用。简单来说，它是一种特殊类型的列表，其中所有元素的长度都相等。

通常使用read.csv()和read.table()函数将数据框导入 R。您还可以使用data.frame()函数创建一个新的数据框，如下面的代码行所示。

      df <- data.frame(rollnum = seq(1:10), h1 = 15:24, h2 = 81:90)
df
    

输出：

      | rollnum 	| h1 	| h2 	|
|---------	|----	|----	|
| 1       	| 15 	| 81 	|
| 2       	| 16 	| 82 	|
| 3       	| 17 	| 83 	|
| 4       	| 18 	| 84 	|
| 5       	| 19 	| 85 	|
| 6       	| 20 	| 86 	|
| 7       	| 21 	| 87 	|
| 8       	| 22 	| 88 	|
| 9       	| 23 	| 89 	|
| 10      	| 24 	| 90 	|
    

结论

在本指南中，您了解了不同类型和结构的数据，包括在 R 中创建和使用数据类型的概念和技术。要了解有关使用 R 进行数据科学的更多信息，请参阅以下指南：

<a href="https://www-pluralsight-com.translate.goog/resources/blog/guides/interpreting-data-using-descriptive-statistics-r?_x_tr

_{免责声明：本内容来源于第三方作者授权、网友推荐或互联网整理，旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有，其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况，请与我们取得联系，我们将尽快进行相关处理与修改。感谢您的理解与支持！}

_查看原文

技术指南

R语言

阅读全文

使用 R 中的数据类型

杭州电子商务研究院

6年前 · 面向社会、服务行业、政产学研结合、整合资源、和谐发展

| rollnum | h1 | h2 | |--------- |---- |---- | | 1 | 15 | 81 | | 2 | 16 | 82 | | 3 | 17 | 83 | | 4 | 18 | 84 | | 5 | 19 | 85 | | 6 | 20 | 86 | | 7 | 21 | 87 | | 8 | 22 | 88 | | 9 | 23 | 89 | | 10 | 24 | 90 |