R Datu rāmis: kā izveidot, pievienot, atlasīt un apakškopu

Kas ir datu rāmis?

TO datu rāmis ir vienāda garuma vektoru saraksts. Matricā ir tikai viena veida dati, savukārt datu rāmī tiek pieņemti dažādi datu veidi (skaitliski, rakstzīmes, koeficienti utt.).

Šajā apmācībā jūs uzzināsit-

Kā izveidot datu rāmi

Mēs varam izveidot datu rāmi R, nododot mainīgo a, b, c, d funkcijā data.frame (). Mēs varam R izveidot datu rāmi un nosaukt kolonnas ar nosaukumu () un vienkārši norādīt mainīgo nosaukumu. | _+_ |

Argumenti :

  • df : Tā var būt matrica, ko pārvērst par datu rāmi, vai mainīgo kolekcija, kurai pievienoties
  • stīgasAsFaktori : Pēc noklusējuma pārveidot virkni par koeficientu

Mēs varam izveidot datu rāmi R mūsu pirmajai datu kopai, apvienojot četrus vienāda garuma mainīgos. | _+_ |

Izeja:

data.frame(df, stringsAsFactors = TRUE) 

Mēs redzam, ka kolonnu galvenēm ir tāds pats nosaukums kā mainīgajiem. Mēs varam mainīt kolonnas nosaukumu R ar funkciju nosaukumiem (). Pārbaudiet R izveides datu rāmja piemēru zemāk: | _+_ |

Izeja:

 # Create a, b, c, d variables a <- c(10,20,30,40) b <- c('book', 'pen', 'textbook', 'pencil_case') c <- c(TRUE,FALSE,TRUE,FALSE) d <- c(2.5, 8, 10, 7) # Join the variables to create a data frame df <- data.frame(a,b,c,d) df 
 ## a b c d ## 1 1 book TRUE 2.5 ## 2 2 pen TRUE 8.0 ## 3 3 textbook TRUE 10.0 ## 4 4 pencil_case FALSE 7.0 

Izeja:

 # Name the data frame names(df) <- c('ID', 'items', 'store', 'price') df 

Pēc noklusējuma datu rāmis kā faktoru atgriež virknes mainīgos.

Šķēles datu rāmis

Ir iespējams SLICE datu rāmja vērtības. Mēs izvēlamies rindas un kolonnas, kuras atgriezt iekavās, pirms datu rāmja nosaukuma.

Datu rāmis sastāv no rindām un kolonnām, df [A, B]. A apzīmē rindas un B kolonnas. Mēs varam sagriezt šķēles, norādot rindas un/vai kolonnas.

No 1. attēla kreisā daļa attēlo rindas, un labā daļa ir kolonnas . Ņemiet vērā, ka simbols: nozīmē uz . Piemēram, 1: 3 plāno atlasīt vērtības no 1 uz 3.

Zemāk redzamajā diagrammā mēs parādām, kā piekļūt dažādām datu rāmja izvēlēm:

  • Dzeltenā bultiņa izvēlas rinda 1 collas sleja 2
  • Zaļā bultiņa izvēlas rindas 1 līdz 2
  • Sarkanā bultiņa izvēlas sleja 1
  • Zilā bultiņa izvēlas rindas 1 līdz 3 un kolonnas 3 līdz 4

Ņemiet vērā: ja kreiso daļu atstāsim tukšu, izvēlēsies R visas rindas . Pēc analoģijas, ja mēs atstāsim labo daļu tukšu, R izvēlēsies visas kolonnas .

Mēs varam palaist kodu konsolē: | _+_ |

Izeja:

 ## ID items store price ## 1 10 book TRUE 2.5 ## 2 20 pen FALSE 8.0 ## 3 30 textbook TRUE 10.0 ## 4 40 pencil_case FALSE 7.0
 # Print the structure str(df) 

Izeja:

 ## 'data.frame': 4 obs. of 4 variables: ## $ ID : num 10 20 30 40 ## $ items: Factor w/ 4 levels 'book','pen','pencil_case',..: 1 2 4 3 ## $ store: logi TRUE FALSE TRUE FALSE ## $ price: num 2.5 8 10 7 
## Select row 1 in column 2 df[1,2]

Izeja:

## [1] book ## Levels: book pen pencil_case textbook
 ## Select Rows 1 to 2 df[1:2,]

Izeja:

 ## ID items store price ## 1 10 book TRUE 2.5 ## 2 20 pen FALSE 8.0

Ir iespējams arī atlasīt slejas ar to nosaukumiem. Piemēram, zemāk esošais kods iegūst divas slejas: ID un veikals. | _+_ |

Izeja:

## Select Columns 1 df[,1]

Pievienojiet datu rāmim kolonnu

Datu rāmim varat pievienot arī kolonnu. Jums ir jāizmanto simbols $, lai pievienotu datu rāmja mainīgo R un datu kolonnai pievienotu kolonnu R. | _+_ |

Izeja:

## [1] 10 20 30 40

Piezīme. Vektora elementu skaitam jābūt vienādam ar datu rāmja elementu skaitu. Izpildot šo paziņojumu, lai datu rāmim R pievienotu kolonnu

## Select Rows 1 to 3 and columns 3 to 4 df[1:3, 3:4]

Rāda kļūdu:

 ## store price ## 1 TRUE 2.5 ## 2 FALSE 8.0 ## 3 TRUE 10.0

Atlasiet datu rāmja kolonnu

Dažreiz mums ir jāsaglabā datu rāmja kolonna turpmākai lietošanai vai jāveic darbība ar kolonnu. Mēs varam izmantot zīmi $, lai atlasītu kolonnu no datu rāmja. | _+_ |

Izeja:

# Slice with columns name df[, c('ID', 'store')]

Apakškopa datu rāmi

Iepriekšējā sadaļā mēs izvēlējāmies visu kolonnu bez nosacījumiem. Ir iespējams apakškopa pamatojoties uz to, vai kāds nosacījums bija patiess.

Mēs izmantojam funkciju apakškopa (). | _+_ |

Mēs vēlamies atgriezt tikai tās preces, kuru cena pārsniedz 10, un mēs varam: | _+_ |

Izeja:

 ## ID store ## 1 10 TRUE ## 2 20 FALSE ## 3 30 TRUE ## 4 40 FALSE