Funksioni unik() në programimin R


Funksioni unik() në R përdoret për të eliminuar ose fshirë vlerat e kopjuara ose rreshtat e pranishëm në vektor, matricë gjithashtu.

Funksioni unik() e gjeti rëndësinë e tij në EDA (Analiza e të dhënave eksploruese) pasi identifikon drejtpërdrejt dhe eliminon vlerat e dyfishta në të dhëna.

Në këtë artikull, ne do të zbulojmë aplikimin e ndryshëm të funksionit unike() në programimin R. Le të rrotullohemi!!!

Ideja për të marrë vlera unike

Epo, para se të hyni në temë, është mirë të dini idenë që qëndron pas saj. Në këtë rast, janë vlera unike. Funksioni unik do të kthejë vlerat unike duke eliminuar numërimin e kopjuar.

Diagrami ju tregon se funksioni unik do të kërkojë dublikatë dhe e eliminon atë për të kthyer vlerat unike. Ka shumë ilustrime që vijnë përpara në seksionet e mëposhtme për të mësuar diçka të mirë.

Sintaksa e funksionit Unique() në R

Unik: Funksioni unik() përdoret për të identifikuar dhe eliminuar numërimet e kopjuara të pranishme në të dhëna.

unique(x)

Ku:

X=Mund të jetë një vektor, një kornizë e të dhënave ose një matricë.

Një shembull i thjeshtë i funksionit unik() në R

Nëse keni një vektor që ka vlera të dyfishta, atëherë me ndihmën e funksionit unike() mund t'i eliminoni lehtësisht ato duke përdorur një rresht të vetëm kodi.

Le të shohim se si funksionon…

#An input vector having duplicate values
df<-c(1,2,3,2,4,5,1,6,8,9,8,6)

#elimnates the duplicate values in the vector 
unique(df)
Output = 1 2 3 4 5 6 8 9

Në ilustrimin e mësipërm mund të vëreni se vektori i hyrjes ka shumë vlera të dyfishta.

Pasi e kaluam atë vektor në funksion unik, ai eliminon të gjitha vlerat e kopjuara dhe kthen vetëm vlerat unike siç tregohet më sipër.

Gjetja e vlerave unike në një matricë

Tani, ne do të gjejmë vlera të dyfishta të pranishme në një matricë dhe do t'i eliminojmë ato duke përdorur funksionin unik.

Për këtë, fillimisht duhet të krijojmë një matricë të rreshtave dhe kolonave 'n' që kanë vlera të dyfishta.

Për të krijuar një matricë, ekzekutoni kodin e mëposhtëm.

#creates a 6 x 4 matrix having 24 elements 
df<-matrix(rep(1:20,length.out=24),nrow = 6,ncol=4,byrow = T)
      [,1] [,2] [,3] [,4]
[1,]    1    2    3    4
[2,]    5    6    7    8
[3,]    9   10   11   12
[4,]   13   14   15   16
[5,]   17   18   19   20
[6,]    1    2    3    4

Siç mund ta vëreni lehtësisht se, rreshti i fundit është krejtësisht i dyfishuar. E tëra çfarë ju duhet të bëni është duke përdorur funksionin unike(), të eliminoni këto vlera të kopjuara.

#removes the duplicate values
unique(df)
       [,1] [,2] [,3] [,4]
[1,]    1    2    3    4
[2,]    5    6    7    8
[3,]    9   10   11   12
[4,]   13   14   15   16
[5,]   17   18   19   20

PO!

Ti e bëre! Të gjitha vlerat dublikatë të pranishme në matricë u hoqën nga funksioni unik dhe ai ktheu një matricë që kishte vetëm vlera unike.

Gjetja e vlerave unike në kornizën e të dhënave

Deri më tani, ne kemi punuar në vektorët dhe matricat për të nxjerrë vlerat unike duke eliminuar numërimin e kopjuar.

Në këtë seksion, le të përqendrohemi në marrjen e vlerave unike të pranishme në kornizën e të dhënave.

Për të krijuar një kornizë të dhënash, ekzekutoni kodin e mëposhtëm.

#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))

#dataframe
Class_data
   Student Age Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male
4   Naman  22   Male
5    Megh  23  Female
6    Mark  24   Male

Kjo është korniza e të dhënave që ka numërimin e kopjuar siç tregohet më sipër. Le të zbatojmë funksionin unik për të hequr qafe vlerën e kopjuar të pranishme këtu.

unique(Class_data)
   Student Age  Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male

Uau! Funksioni unik ktheu të gjitha vlerat unike të pranishme në kornizën e të dhënave duke eliminuar vlerat e kopjuara.

Ashtu si kjo, duke përdorur funksionin unike() në R, mund të merrni lehtësisht vlerat unike të pranishme në të dhëna.

Gjetja e vlerave unike të një kolone të caktuar

Po, çka nëse ju kërkohet të merrni vlerat unike nga një kolonë specifike në vend të grupit të të dhënave?

Mos u shqetësoni, duke përdorur funksionin unike() ne gjithashtu mund të marrim vlerat unike nga kolona e veçantë siç tregohet më poshtë.

#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))

#dataframe
Class_data
   Student Age Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male
4   Naman  22   Male
5    Megh  23  Female
6    Mark  24   Male

Në rregull, po marr të njëjtën kornizë të të dhënave që kemi përdorur në seksionet e fundit për t'u kuptuar më lehtë.

Le të përdorim funksionin unik për të hequr qafe vlerat e kopjuara.

unique(Class_data$Student)
Output = "Naman" "Megh"  "Mark" 

Në të njëjtën mënyrë, ne mund të marrim edhe vlerat unike në kolonat Mosha ose Gjinia.

unique(Class_data$Gender)
"Male"   "Female"

Gjetja e gjatësisë së vlerave unike

Në këtë seksion, ne do të marrim numërimin e vlerave unike në të dhëna. Ky aplikacion është më i dobishëm për të njohur më mirë të dhënat tuaja dhe për t'i përgatitur për analiza të mëtejshme.

#importing the dataset
datasets::BOD
    Time  demand
1    1     8.3
2    2    10.3
3    3    19.0
4    4    16.0
5    5    15.6
6    7    19.8

mirë, ne po përdorim grupin e të dhënave BOD këtu. Le të gjejmë fillimisht vlerat unike të cilat do të pasohen nga numërimi.

#returns the unique value
unique(BOD$demand)
Output = 8.3  10.3 19.0  16.0  15.6  19.8

Në rregull, tani kemi vlerat unike të pranishme në kolonën e kërkesës në grupin e të dhënave BOD.

Tani, ne jemi mirë të shkojmë për të gjetur numërimin e vlerave unike.

#returns the length of unique values
length(unique(BOD$demand))
Output =  6

Përfundimi

Epo, funksioni unik() në R është një funksion shumë i vlefshëm kur bëhet fjalë për EDA (Analiza e të dhënave eksploruese).

Kjo ju ndihmon të kuptoni më mirë të dhënat tuaja së bashku me numërime të veçanta.

Ky artikull ju tregon për aplikacionet e shumta dhe rastet e përdorimit të funksionit unike(). Gëzuar analizimin!!!

Lexo më shumë: Dokumentacioni R