Featured image

R lengoaiaren bidezko programazioa (aurreratua)

Ikastaro hau "R lengoaiako programazioaren hastapenak" ikastaroaren jarraipena da.

R lengoaiaren bidezko programazio aurreratuaren inguruko alderdiak landu nahi dituzten profesional eta ikertzaileentzako ikastaroa. R lengoaia asko erabiltzen da programazio estatistikoan, ikasketa automatikoan eta datu-zientzian.

 

Helburua

Ikastaroaren helburua da software libreko tresna horrek datuak erabiltzeko zer aukera eta zer abantaila dituen ikastea, besteak beste datuak biltegiratzeko, berreskuratzeko, datu-egiturak sortzeko, eta taula eta grafiko estatistikoak egiteko, eta, horretaz gain, R lengoaia erabiliz txostenak, artikuluak eta aurkezpenak egiteko.

 

Norentzat

R programa ezagutzeko eta tresna hori programazioan, estatistikan eta matematikan erabiltzeko interesa duten hainbat arlotako profesional eta ikertzaileentzat. Estatistika deskriptiboari buruz zerbait jakitea komeni da.

 

Gomendioa

Aldez aurretik sarrerako ikastarora joatea: R lengoaiako programazioaren hastapenak.

 

Egitaraua

Taulak bateratzea:

  • Antzekoak diren taulak bertikalki nahiz horizontalki bateratzea.
  • Taula bat beste bateko informazioarekin osatzea.
  • Taula bat baino gehiagotako elementu komunak hautatzea.
  • Taula bat baino gehiagotako elementu komunak eta ez-komunak hautatzea.

Iragazkiak erabiltzea:

  • Zenbakizkoak ez diren aldagaien bidezko iragazki sinpleak.
  • Zenbakizko aldagaien bidezko iragazki sinpleak.
  • Zenbakizko aldagaiak eta zenbakizkoak ez direnak erabiliz egindako iragazkiak.
  • Aldagai-klasearen araberako iragazkiak.
  • Aldagai bateko elementu desberdinen kopuruaren araberako iragazkiak.
  • Bikoiztuak ezabatzea.
  • Beste taula bateko aldagaiak erabiliz iragaztea.
  • Beste taula bateko errenkadak erabiliz iragaztea.
  • Beste taula bateko elementuak erabiliz iragaztea.
  • Balio esklusiboak.

Datuen tratamendu aurreratua:

  • Data bateko elementuak erauztea.
  • Asteko eguna gehitzea.
  • Aldagaiak beste aldagai batzuen arabera aldatzea.
  • Datu-gehitze sinpleak.
  • Zenbait aldagairen bidez datuak gehitzea.
  • Datu-gehitzeen grafiko aurreratuak.
  • Gehitze bat baino gehiago bateratzea.
  • Aldagaiekin egindako eragiketak.
  • Aldagaietako karaktereak aldatzea.
  • Taulen normalizazio sinplea.
  • Taulen normalizazio konposatua.
  • Normalizazioak zuzentzea.
  • Taulen bertikalizazioa.

Muturreko datuak:

  • Definizioa.
  • Ez tratatzeagatik sortzen diren arazoak.
  • Muturreko datuak detektatzea: Grafikoen bidez. Muturreko datuak erauztea. Muturreko datuak barnean hartzen dituzten behaketak zehaztea. Muturreko datuen balioak erauztea.
  • Muturreko datuak tratatzea: Behaketak ezabatzea. NA bihurtzea. Dummy aldagai berriak modu masiboan sortzea. Banakako tratamendua.
  • Galdutako balioak.
  • Galdutako balioen kuantifikazioa: Totala. Aldagaien araberakoa. Behaketen araberakoa.
  • Galdutako balioen analisi grafikoa.
  • Galdutako balioak aldagaiaren arabera ezabatzea.
  • Galdutako balioak masiboki ezabatzea.
  • Galdutako balio asko dituzten aldagaiak ezabatzea.
  • Balio estatistikoen araberako egozpena (media, moda, mediana).
  • Egozpen anizkoitzeko metodoak
  • Egozpen-modeloak sortzea.

Valores perdidos:

  • Cuantificación de los valores perdidos: Total, Por variables, Por observaciones.
  • Análisis gráfico de los valores perdidos.
  • Eliminación de los valores perdidos variable por variables.
  • Eliminación masiva de los valores perdidos.
  • Eliminación de variables con alto porcentaje de valores perdidos.
  • Imputación por valores estadísticos (media, moda, mediana)
  • Métodos de imputación múltiple.
  • Creación de modelos para la imputación.

Aurreko edizioak »»