SAS apmācība iesācējiem: kas ir un programmēšanas piemērs

Kas ir SAS?

SAS ir komandu vadīts statistikas programmatūras komplekts, ko plaši izmanto statistikas datu analīzei un vizualizācijai. SAS pilna forma ir statistiskās analīzes programmatūra. Tas ļauj izmantot kvalitatīvas metodes un procesus, kas palīdz uzlabot darbinieku produktivitāti un biznesa peļņu. SAS tiek izmantots arī progresīvai analīzei, piemēram, biznesa izlūkošanai, noziegumu izmeklēšanai un prognozējošai analīzei. SAS izrunā kā “SaaS”.

SAS dati tiek iegūti un klasificēti, kas palīdz identificēt un analizēt datu modeļus. Tas ir programmatūras komplekts, kas ļauj veikt uzlabotas analīzes, biznesa informācijas, paredzamās analīzes, datu pārvaldības, lai efektīvi darbotos konkurētspējīgos un mainīgos biznesa apstākļos. Turklāt SAS ir neatkarīga no platformas, kas nozīmē, ka jūs varat palaist SAS jebkurā operētājsistēmā vai nu Linux, vai Windows.

Salīdzinot ar citiem BI rīki , SAS sniedz plašu atbalstu, lai programmatiski pārveidotu un analizētu datus, izņemot vilkšanas un nomešanas saskarnes izmantošanu. Tas nodrošina ļoti detalizētu datu manipulācijas un analīzes kontroli, kas ir tās USP.

Šajā SAS apmācībā iesācējiem jūs uzzināsit

Kāpēc mums vajag SAS?

Sapratīsim SAS nepieciešamību ar vienkāršu piemēru:

Apsveriet e-komercijas uzņēmumu, kurš, pamatojoties uz vēsturiskiem datiem, vēlas uzzināt savu klientu pirkšanas modeļus. Uzņēmumam būs jāapsver tūkstošiem vairāku klientu ierakstu, lai iegūtu vispārīgu ieskatu.

Uzņēmumam var nebūt visu šo analīzei nepieciešamo datu. Piemēram, ja klients nepirka jaku, tad kādi faktori liedza jaku iegādāties? Šie trūkstošie dati var radīt kļūdas analīzē. Kā jūs varat atbrīvoties no šīm problēmām? Kā mēs varam apstrādāt šāda veida datus?

Ja tas tiek veikts manuāli, šim darbam būs nepieciešami simtiem analītiķu un tūkstošiem cilvēkstundu. Izmantojot SAS analīzes rīku, jūs varat veikt to pašu analīzi dažu stundu laikā ar vienu analītiķi. SAS rīks ļauj novērst nevajadzīgus datus un optimizēt attiecīgo informāciju. Tas ļaus jums prognozēt rezultātu pat tad, ja trūkst datu. SAS ļauj pieņemt labākus lēmumus.

Alternatīvi SAS rīki

R: Tā ir atvērtā pirmkoda programmatūra. R ir viegli iemācīties, jo tas ir labi dokumentēts. Tā piedāvā spēcīgas statistikas iespējas.

Python ir vēl viena populāra atvērtā koda skriptu valoda. Tā atbalsta tādas bibliotēkas kā Numpy, Scipy un MatPlotLib. Izmantojot šīs bibliotēkas, varat veikt jebkuru statistisku darbību vai izveidot jebkuru modeli.

SAS: Tas ir plaši izmantots analītiskais rīks komerciālās analīzes tirgū. Ar statistikas funkciju pārpilnību un labu GUI.

Šajā SAS programmēšanas apmācībā mēs apspriedīsim statistiskās analītiskās sistēmas un to, kā to var izmantot mūsu problēmu risināšanai.

SAS vēsture

  • SAS izstrādāja Džims Goodnits un Džons Šals 1970. gadā N.C. universitātē
  • Sākotnēji tas tika izstrādāts lauksaimniecības pētījumiem.
  • Vēlāk tas tika paplašināts līdz virknei rīku, iekļaujot cita starpā paredzamo analīzi, datu pārvaldību, BI.
  • Šobrīd 98 no pasaules vadošajiem uzņēmumiem, kuriem ir bagātība 400, izmanto SAS datu analīzes rīku Datu analīze.

Tālāk šajā SAS valodas apmācībā mēs uzzināsim par SAS funkcijām.

SAS funkcijas

SAS galvenās iezīmes ir šādas:

  • Viegli piekļūstiet neapstrādātu datu failiem un datiem no ārējas datu bāzes. Lasiet un rakstiet gandrīz jebkuru datu formātu!
  • Pārvaldiet datus, izmantojot rīkus datu ievadīšanai, rediģēšanai, izgūšanai, formatēšanai un konvertēšanai
  • Analizējiet datus, izmantojot aprakstošos, statistikas, daudzfaktoru paņēmienus, prognozēšanu, modelēšanu, lineāro programmēšanu
  • Uzlabotā analītika palīdz veikt izmaiņas un uzlabot uzņēmējdarbības praksi.
  • Atskaišu veidošana ar perfektiem grafikiem
  • Operāciju izpēte un projektu vadība
  • Datu atjaunināšana un modificēšana
  • Spēcīga datu apstrādes valoda
  • Lieliskas datu tīrīšanas funkcijas
  • Mijiedarboties ar vairākām saimniekdatoru sistēmām

Tālāk šajā SAS iesācējiem apmācībā mēs uzzināsim par SAS produktu komplektu.

SAS produktu komplekts

Tirgū ir pieejami daudzi SAS produkti. Tālāk ir saraksts ar populārākajiem.

VārdsApraksts
SAS bāzeBase SAS programmatūra piedāvā aparatūras veiklību un integrējas visa veida skaitļošanas vidē.
SAS / GRAFIKAŠis rīks palīdz strukturētos datus attēlot diagrammās.
SAS / STATŠis rīks palīdz veikt dažāda veida regresiju, statistiskās analīzes dispersiju, regresiju un psihometrisko analīzi.
SAS / ETSTo izmanto prognozēšanai. Palīdz veikt laikrindu analīzi.
SAS / IMLInteraktīvā matricas valoda ir pazīstama kā IML. Šis rīks palīdz tulkot matemātiskās formulas inovatīvā programmā.
SAS EBIRīks biznesa izlūkošanas lietojumprogrammām
SAS režģa vadītājsTā ir galvenā sastāvdaļa, kas piedāvā datu pārvaldības iespējas un programmēšanas valodu datu analīzei
SAS/VAIDarbības izpētes rīks
SAS/QCIzmantojiet kvalitātes kontrolei
SAS / Enterprise MinerDatu ieguve
SAS / PHKlīnisko pētījumu analīze
SAS / AFTā piedāvā lietojumprogrammu iespēju
Uzņēmuma ceļvedisTas ir uz GUI balstīts kodu redaktors un projektu vadītājs

Tālāk šajā SAS apmācību rokasgrāmatā mēs uzzināsim par SAS arhitektūru.

SAS arhitektūra

SAS arhitektūra

SAS arhitektūra galvenokārt ir sadalīta trīs daļās:

  • Klienta līmenis
  • Vidējais līmenis
  • Atpakaļ

Klienta līmenis:

Klienta līmenis ir vieta, kur lietojumprogramma ir instalēta mašīnā, kur lietotājs sēž. Tas sastāv no komponentiem, kas tiek izmantoti, lai apskatītu portālu un tā saturu. Tas ietver arī standarta tīmekļa pārlūkprogrammu, ko izmanto, lai mijiedarbotos ar portālu, izmantojot standarta HTTP vai HTTPS protokolu. Tas arī palīdz jums padarīt SAS tīmekļa lietojumprogrammu ugunsmūri draudzīgu.

Vidējais līmenis:

Vidējais līmenis piedāvā centralizētu piekļuves punktu uzņēmuma informācijai. Visu piekļuvi saturam apstrādā šī līmeņa sastāvdaļas. Biznesa loģikas nošķiršana no displeja loģikas palīdz jums izmantot vidējā līmeņa loģiku. Turklāt centralizēti piekļuves punkti atvieglo drošības noteikumu izpildi, portāla administrēšanu un koda izmaiņu pārvaldību.

Vidējā līmenī ir šādas funkcijas:

SAS informācijas piegādes portāla tīmekļa lietojumprogramma: Tā ir JSP, Java servletu, JavaBeans un citu klašu un resursu kolekcija. Šie komponenti palīdz piekļūt uzņēmuma direktorijā saglabātajai informācijai, lai lietotājam izveidotu pielāgojamu saskarni.

Serveta dzinējs: Servera dzinēju sauc arī par servleta konteineru. Tā ir atbildīga par SAS informācijas piegādes portāla tīmekļa lietojumprogrammas pārvaldību. Serveta dzinējs piedāvā darba laika vidi. Tas nodrošina vienlaicīgumu, izvietošanu, dzīves cikla pārvaldību utt.

Tīmekļa serveris: Web serveris piedāvā servleta dzinēja pakalpojumus, kurus var izmantot vietnes mitināšanai. Tam vajadzētu piekļūt, izmantojot portālu.

Aizmugurējais līmenis:

Aizmugurējais līmenis ir apgabals, kurā darbojas datu un aprēķinu serveri un kurā var būt biznesa objekti. Tas ir uzņēmuma direktoriju serveris. Uzņēmuma direktoriju serveris uztur metadatus par saturu, kas atrodas visā uzņēmumā.

Kā lejupielādēt un instalēt SAS

Vietējā lejupielāde jūsu ierīcē

1. solis) Lejupielādējiet SAS no norādītās saites

Dodieties uz šo saiti https://www.sas.com/en_in/software/university-edition.html un noklikšķiniet uz Iegūt bezmaksas programmatūru.

2. solis) Izvēlieties operētājsistēmu

Izvēlieties operētājsistēmu atbilstoši savai sistēmai.

3. solis) Lejupielādējiet un instalējiet virtualizācijas programmatūru

Pirms SAS instalēšanas ir jāinstalē virtualizācijas programmatūra, piemēram, VirtualBox. Šeit ir detalizētas darbības

Lai instalētu SAS, izpildiet ekrānā minētās darbības. VirtualBox un vietējās instalēšanas ieviešana dažkārt var būt sarežģīta. Mēs iesakām instalēt AWS

AWS uzstādīšana

Jūs varat izvietot SAS AWS. Tas ir piemērots bezmaksas līmenim.

1. darbība) Iet uz https://aws.amazon.com/marketplace/pp/B00WH10IKW . Noklikšķiniet uz 'Turpināt abonēt'

2. darbība) Šajā nākamajā ekrānā piekrītiet noteikumiem.

3. darbība) Abonēšanas apstiprināšana gaida 10 minūtes. Jūs redzēsit šādu ekrānu.

4. darbība) Atsvaidziniet lapu, un abonements tiks apstiprināts. Noklikšķiniet uz Turpināt konfigurāciju

5. darbība) Saglabājiet iestatījumus pēc noklusējuma un noklikšķiniet uz Turpināt, lai palaistu.

6. darbība) Pārskatiet konfigurācijas lapu. Ievadiet atslēgu un vērtību pāri. Atpūtas iestatījumiem jābūt noklusējuma iestatījumiem. Noklikšķiniet uz Palaist

7. darbība) Iet uz https://aws.amazon.com/marketplace/library/ un noklikšķiniet uz Skatīt gadījumus.

8. darbība) Uznirstošajā logā

  1. Ievērojiet instances ID. Šī ir jūsu parole
  2. Noklikšķiniet uz Piekļuves programmatūra

9. darbība) Uznirstošajā logā tas parādās pēc noklikšķināšanas 8. darbībā

  1. Ievadiet lietotāja akreditācijas datus. Id: sasdemo parole: instances ID, kas atzīmēts 8. darbībā
  2. Noklikšķiniet uz Pierakstīties

10. darbība) Jūs redzēsit sveiciena ekrānu.

Traucējummeklēšana

Ja nevarat izveidot savienojumu, dodieties uz https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId un ienākošie/izejošie noteikumi visiem

Kā lietot SAS?

Lai efektīvi izmantotu SAS programmatūru, jums jāveic četras darbības: Piekļuves dati, Pārvaldības dati, Analīze, Pašreizējais

Kā lietot SAS

Piekļuves dati:

SAS ļauj piekļūt datiem jebkurā vēlamajā formātā.

Jūs varat piekļūt datiem, kas tiek glabāti jebkur, neatkarīgi no tā, vai tie ir jūsu sistēmas failā, vai datiem, kas tiek glabāti citā datu bāzes sistēmā. Tas var būt Oracle fails, SAS datu bāzes fails, Raw Database fails vai vienkāršs XLS /CSV fails. Tas palīdzēs jums viegli piekļūt šiem datiem.

Pārvaldīt datus:

SAS piedāvā lieliskas datu pārvaldības iespējas. Jūs varat apakškopēt/sagriezt datus, pamatojoties uz noteiktiem nosacījumiem, izveidot mainīgus, tīrus un apstiprināt datus. Ir arī citi rīki, kas ļauj veikt vienu un to pašu uzdevumu. Tomēr SAS palīdz jums viegli veikt šo darbu.

SAS ir labi definētas bibliotēkas un procesi, kas atvieglo programmēšanas procesu. Turklāt mainīgu vai apakškopu datu izveide ir tikai viens solis. Tas ietaupa jūs no sarežģītu algoritmu rakstīšanas, izmantojot tikai vienu koda rindu.

Analizēt:

Izmantojot SAS, varat veikt dažāda veida analīzi:

  • Tas pārbauda vidējā aprēķina biežumu
  • Regresija un prognozēšana
  • Lēmumu koks

Visas šīs analīzes var viegli veikt ar SAS. Tas ir labākais instruments precīzai prognozēšanai.

Klāt:

Ja jūs pareizi vizualizējat datus, auditorijai ir bez piepūles tos saistīt. Ir svarīgi, lai jūsu rīks sniegtu datus piemērotā veidā. Tas ir tas, ko SAS dara jūsu labā. Tam ir lieliskas prezentācijas iespējas.

Jūs varat:

1. Sarakstiet pārskatus

2. Kopsavilkuma ziņojumi

3. Grafiku atskaites

4. Drukāt atskaites

SAS programmas piemērs

SAS programma sastāv no trim nepieciešamajiem soļiem:

  • Datu solis
  • Proc solis
  • Izvades solis

DATU solis:

Datu solis ielādē nepieciešamo datu kopu SAS atmiņā un atrod pareizos datu kopas mainīgos. Tas arī fiksē ierakstus. Mēs varam izmantot datu darbības, lai:

  • Ievadiet datus SAS datu kopās
  • Aprēķiniet vērtības
  • Pārbaudiet vai izlabojiet datus
  • Izveidojiet jaunas datu kopas

DATA paziņojuma sintakse ir šāda:

Sintakse

 DATA data_set_name; #Give a name to the dataset INPUT var1,var2,var3; #Declare variables in the dataset. NEW_VAR; #Define new variables. LABEL; #Give variables a label DATALINES; #Provide data RUN; 

Piemērs:

Šis piemērs parāda, kā definēt mainīgo, nosaukt datu kopu, izveidot jaunus mainīgos un ievadīt datus. Šajā piemērā varat redzēt, ka virknes mainīgā beigās ir $, un skaitliskās vērtības ir bez tā. | _+_ |

Piezīme: Lai izpildītu SAS paziņojumu, jānorāda komanda RUN.

PROC solis

Tā veic īpašu analīzi vai funkcijas, lai iegūtu rezultātus un ziņojumus.

Sintakse

 INPUT ID $ NAME $ SALARY DEPARTMENT $; comm = SALARY*1.50; LABEL ID = 'Emp_ID' comm = 'COMMISION'; DATALINES; 1 Tom 5000 IT 2 Harry 6000 Operations 3 Michelle 7000 IT 4 Dick 8000 HR 5 John 9000 Finance ; RUN; 

Piemērs

Šajā piemērā tiek izmantota LĪDZEKĻI procedūru, lai izdrukātu datu kopas skaitlisko mainīgo vidējās vērtības. | _+_ |

Izejas solis

Jūs varat parādīt datus no datiem, izmantojot nosacījuma izvades paziņojumus.

Sintakse | _+_ |

Katrai SAS programmai ir jāveic visas iepriekš minētās darbības, lai nolasītu ievades datus, analizētu datus un sniegtu analīzes rezultātus. The RUN paziņojums katra soļa beigās pabeidz šī soļa izpildi.

Pilnīga SAS programma

Tālāk ir sniegts pilnīgs katras iepriekš minētās darbības kods.

Izeja:

Kur tiek izmantots SAS?

Tālāk ir norādītas dažas svarīgas SAS lietojumprogrammas:

RūpniecībaLietošana
FarmācijasStatistiskā analīze, ziņošana
TelekomETL, ziņošana, datu ieguve, prognozēšana
FinansesETL, ziņošana, datu ieguve, finanšu izpēte
Prognozējošā modelēšanaDBMārketings, uz darbību balstīta pārvaldība
Veselības aprūpeETL, ziņošana, datu ieguve

SAS vs. R

SASR
SAS ir komerciāla programmatūra, tāpēc tai nepieciešami finanšu ieguldījumi.R ir atvērtā koda programmatūra. Tāpēc ikviens to var izmantot.
SAS ir visvieglāk apgūstamais analītiskais rīks. Pat cilvēki ar ierobežotām SQL zināšanām to var ātri apgūt.R prasa rakstīt sarežģītus un garus kodus.
SAS ir ļoti vēlama izvēle lieliem uzņēmumiem, un tā ir tehniski progresīva un lietotājam draudzīga.R ir strauji attīstoša programmatūra; tomēr jums ir jāturpina to uzlabot.
SAS ir labs grafiskais atbalsts, bet nepiedāvā nekādas pielāgošanas iespējas.R rīka grafiskais atbalsts ir ļoti vājš.

SAS priekšrocības

  • SAS ir vienkārša sintakse, kuru var apgūt bez jebkādām programmēšanas zināšanām
  • Spēja viegli apstrādāt lielu datu bāzi
  • SAS ir ļoti saprotama valoda, kuru var viegli atkļūdot
  • Logā “žurnāls” ir skaidri norādīta kļūda, kas palīdz viegli atkļūdot kodu
  • SAS palīdz jums rūpīgi pārbaudīt un analizēt algoritmu
  • SAS ir pilnībā aizsargāta, tāpēc birojā nevar iegūt bez licences
  • Atvieglo statistisko skaitļošanu lietotājiem, kuri neprogrammē
  • Efektīvi apstrādā liela izmēra datu bāzi.

SAS trūkumi

  • Izmaksas ir augstas, jo indivīds vai organizācija nevar izmantot visas lietojumprogrammas bez atbilstošas ​​licences
  • SAS nav atvērtā pirmkoda, tāpēc SAS izmantotie algoritmi nav pieejami kopējai lietošanai
  • Teksta ieguve SAS ir ļoti apgrūtinošs un grūts process.

Kopsavilkums

  • SAS programmatūra, kas nozīmē statistiskās analīzes programmatūru, ko izmanto datu analīzei
  • R un Python ir divi plaši izmantoti alternatīvi SAS rīki.
  • SAS izstrādāja Džims Goodnight un John Shall 1970. gadā N.C. Universitātē
  • SAS ļauj piekļūt neapstrādātu datu failiem un datiem jebkura veida ārējā datu bāzē
  • SAS arhitektūra galvenokārt ir sadalīta trīs daļās 1) Klienta līmenis 2) Vidējais līmenis 3) Atpakaļ
  • Lai izmantotu SAS programmatūru, jums jāveic četras darbības: 1) piekļuves dati, 2) pārvaldība 3) datu analīze, 4) prezentācija
  • SAS programma sastāv no trim pamata posmiem: datu posms, Proc solis un izvades solis
  • SAS datu analīzes rīks tiek plaši izmantots tādās nozarēs kā farmācija, telekomunikācijas, finanses, paredzamā modelēšana un veselības aprūpe
  • SAS ir komerciāla programmatūra, savukārt R ir atvērtā koda programmatūra
  • Lielākais SAS programmētāja rīka ieguvums ir tas, ka tam ir vienkārša sintakse, kuru var apgūt bez jebkāda veida programmēšanas zināšanām.
  • Viens no SAS modeļa trūkumiem ir tas, ka tas nav atvērtā koda rīks. Tātad SAS procedūrās izmantotie algoritmi nav pieejami kopējai lietošanai.