Funksioni unik() në programimin R
Funksioni unik() në R përdoret për të eliminuar ose fshirë vlerat e kopjuara ose rreshtat e pranishëm në vektor, matricë gjithashtu.
Funksioni unik() e gjeti rëndësinë e tij në EDA (Analiza e të dhënave eksploruese) pasi identifikon drejtpërdrejt dhe eliminon vlerat e dyfishta në të dhëna.
Në këtë artikull, ne do të zbulojmë aplikimin e ndryshëm të funksionit unike() në programimin R. Le të rrotullohemi!!!
Ideja për të marrë vlera unike
Epo, para se të hyni në temë, është mirë të dini idenë që qëndron pas saj. Në këtë rast, janë vlera unike. Funksioni unik do të kthejë vlerat unike duke eliminuar numërimin e kopjuar.
Diagrami ju tregon se funksioni unik do të kërkojë dublikatë dhe e eliminon atë për të kthyer vlerat unike. Ka shumë ilustrime që vijnë përpara në seksionet e mëposhtme për të mësuar diçka të mirë.
Sintaksa e funksionit Unique() në R
Unik: Funksioni unik() përdoret për të identifikuar dhe eliminuar numërimet e kopjuara të pranishme në të dhëna.
unique(x)
Ku:
X=Mund të jetë një vektor, një kornizë e të dhënave ose një matricë.
Një shembull i thjeshtë i funksionit unik() në R
Nëse keni një vektor që ka vlera të dyfishta, atëherë me ndihmën e funksionit unike() mund t'i eliminoni lehtësisht ato duke përdorur një rresht të vetëm kodi.
Le të shohim se si funksionon…
#An input vector having duplicate values
df<-c(1,2,3,2,4,5,1,6,8,9,8,6)
#elimnates the duplicate values in the vector
unique(df)
Output = 1 2 3 4 5 6 8 9
Në ilustrimin e mësipërm mund të vëreni se vektori i hyrjes ka shumë vlera të dyfishta.
Pasi e kaluam atë vektor në funksion unik, ai eliminon të gjitha vlerat e kopjuara dhe kthen vetëm vlerat unike siç tregohet më sipër.
Gjetja e vlerave unike në një matricë
Tani, ne do të gjejmë vlera të dyfishta të pranishme në një matricë dhe do t'i eliminojmë ato duke përdorur funksionin unik.
Për këtë, fillimisht duhet të krijojmë një matricë të rreshtave dhe kolonave 'n' që kanë vlera të dyfishta.
Për të krijuar një matricë, ekzekutoni kodin e mëposhtëm.
#creates a 6 x 4 matrix having 24 elements
df<-matrix(rep(1:20,length.out=24),nrow = 6,ncol=4,byrow = T)
[,1] [,2] [,3] [,4]
[1,] 1 2 3 4
[2,] 5 6 7 8
[3,] 9 10 11 12
[4,] 13 14 15 16
[5,] 17 18 19 20
[6,] 1 2 3 4
Siç mund ta vëreni lehtësisht se, rreshti i fundit është krejtësisht i dyfishuar. E tëra çfarë ju duhet të bëni është duke përdorur funksionin unike(), të eliminoni këto vlera të kopjuara.
#removes the duplicate values
unique(df)
[,1] [,2] [,3] [,4]
[1,] 1 2 3 4
[2,] 5 6 7 8
[3,] 9 10 11 12
[4,] 13 14 15 16
[5,] 17 18 19 20
PO!
Ti e bëre! Të gjitha vlerat dublikatë të pranishme në matricë u hoqën nga funksioni unik dhe ai ktheu një matricë që kishte vetëm vlera unike.
Gjetja e vlerave unike në kornizën e të dhënave
Deri më tani, ne kemi punuar në vektorët dhe matricat për të nxjerrë vlerat unike duke eliminuar numërimin e kopjuar.
Në këtë seksion, le të përqendrohemi në marrjen e vlerave unike të pranishme në kornizën e të dhënave.
Për të krijuar një kornizë të dhënash, ekzekutoni kodin e mëposhtëm.
#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))
#dataframe
Class_data
Student Age Gender
1 Naman 22 Male
2 Megh 23 Female
3 Mark 24 Male
4 Naman 22 Male
5 Megh 23 Female
6 Mark 24 Male
Kjo është korniza e të dhënave që ka numërimin e kopjuar siç tregohet më sipër. Le të zbatojmë funksionin unik për të hequr qafe vlerën e kopjuar të pranishme këtu.
unique(Class_data)
Student Age Gender
1 Naman 22 Male
2 Megh 23 Female
3 Mark 24 Male
Uau! Funksioni unik ktheu të gjitha vlerat unike të pranishme në kornizën e të dhënave duke eliminuar vlerat e kopjuara.
Ashtu si kjo, duke përdorur funksionin unike() në R, mund të merrni lehtësisht vlerat unike të pranishme në të dhëna.
Gjetja e vlerave unike të një kolone të caktuar
Po, çka nëse ju kërkohet të merrni vlerat unike nga një kolonë specifike në vend të grupit të të dhënave?
Mos u shqetësoni, duke përdorur funksionin unike() ne gjithashtu mund të marrim vlerat unike nga kolona e veçantë siç tregohet më poshtë.
#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))
#dataframe
Class_data
Student Age Gender
1 Naman 22 Male
2 Megh 23 Female
3 Mark 24 Male
4 Naman 22 Male
5 Megh 23 Female
6 Mark 24 Male
Në rregull, po marr të njëjtën kornizë të të dhënave që kemi përdorur në seksionet e fundit për t'u kuptuar më lehtë.
Le të përdorim funksionin unik për të hequr qafe vlerat e kopjuara.
unique(Class_data$Student)
Output = "Naman" "Megh" "Mark"
Në të njëjtën mënyrë, ne mund të marrim edhe vlerat unike në kolonat Mosha ose Gjinia.
unique(Class_data$Gender)
"Male" "Female"
Gjetja e gjatësisë së vlerave unike
Në këtë seksion, ne do të marrim numërimin e vlerave unike në të dhëna. Ky aplikacion është më i dobishëm për të njohur më mirë të dhënat tuaja dhe për t'i përgatitur për analiza të mëtejshme.
#importing the dataset
datasets::BOD
Time demand
1 1 8.3
2 2 10.3
3 3 19.0
4 4 16.0
5 5 15.6
6 7 19.8
mirë, ne po përdorim grupin e të dhënave BOD këtu. Le të gjejmë fillimisht vlerat unike të cilat do të pasohen nga numërimi.
#returns the unique value
unique(BOD$demand)
Output = 8.3 10.3 19.0 16.0 15.6 19.8
Në rregull, tani kemi vlerat unike të pranishme në kolonën e kërkesës në grupin e të dhënave BOD.
Tani, ne jemi mirë të shkojmë për të gjetur numërimin e vlerave unike.
#returns the length of unique values
length(unique(BOD$demand))
Output = 6
Përfundimi
Epo, funksioni unik() në R është një funksion shumë i vlefshëm kur bëhet fjalë për EDA (Analiza e të dhënave eksploruese).
Kjo ju ndihmon të kuptoni më mirë të dhënat tuaja së bashku me numërime të veçanta.
Ky artikull ju tregon për aplikacionet e shumta dhe rastet e përdorimit të funksionit unike(). Gëzuar analizimin!!!
Lexo më shumë: Dokumentacioni R