Apache Spark och Scala-kurs – Klassrum
22.500,00 SEK
- 24 hours
Lås upp den fulla potentialen i big data genom att bemästra Apache Spark med Scala – en av de mest kraftfulla kombinationerna inom modern data engineering. Den här praktiskt inriktade kursen är utformad för att hjälpa dig att bearbeta, analysera och få insikter ur enorma datamängder med hjälp av Sparks snabba, minnesbaserade beräkningskapacitet. Du lär dig att bygga skalbara datapipelines, utföra realtidsanalys och implementera maskininlärningsmodeller – samtidigt som du utvecklar starka programmeringskunskaper i Scala.
Viktiga funktioner
Språk
Kursmaterial på engelska
Nivå
Nybörjar- till mellannivå
24 timmars instruktörsledd, praktisk utbildning
50+ timmars rekommenderad studietid
3 verkliga projekt för praktisk tillämpning
Över 70 timmars quiz, uppgifter och övningsmaterial
Praktiska labbar med verkliga dataset
Behandling av verktyg i Spark-ekosystemet som Spark SQL, MLlib och Streaming
Praktisk erfarenhet av programmering i Scala
Experthandledning och vägledning under hela kursen
Be om datumbekräftelse!
Intyg om genomförd utbildning ingår

Lärandemål
I slutet av det här programmet kommer du att kunna:
Grunderna i big data
Utveckla en gedigen förståelse för big data-koncept, nyckelkomponenter och ramverk, inklusive Hadoop-arkitektur och dess driftlägen.
Introduktion till Scala
Lär dig grunderna i Scala-programmering, inklusive dess centrala syntax och koncept som krävs för att arbeta med Apache Spark.
Introduktion till Spark
Förstå de grundläggande principerna i Apache Spark och hur du bygger och kör Spark-applikationer.
Spark-ramverk och distribution
Utforska ramverket Spark på djupet, inklusive dess arkitektur och olika sätt att distribuera det.
Spark-datastrukturer
Arbeta med Sparks interna datastrukturer som RDD:er och använd API:er och Scala-funktioner för att skapa och transformera data.
Spark-ekosystemet
Få praktisk erfarenhet av viktiga komponenter i Spark-ekosystemet, inklusive Spark SQL, Streaming, MLlib, GraphX och mer.

Kursöversikt
Introduktion till Big Data, Hadoop och Spark
Lektion 1
- Big data-koncept och verkliga användningsfall
- Hadoop-ekosystemet och HDFS
- Klusterarkitektur och YARN
- Batchbearbetning vs realtidsbearbetning
- Introduktion till Spark och dess fördelar
Introduktion till Scala
Lektion 2
- Grunder i Scala och REPL
- Variabler, styrstrukturer och funktioner
- Samlingar (Array, Map, Listor, Tupler)
- Scala i big data-ekosystem
Objektorienterad och funktionell programmering i Scala
Lektion 3
- Klasser, objekt och paket
- Egenskaper och arv
- Funktionella programmeringskoncept
- Funktioner av högre ordning och felhantering
Scala Collections-API:er
Lektion 4
- Samlingstyper och hierarkier
- Prestandaegenskaper
- Java-interoperabilitet
- Använda implicita värden i Scala
Introduktion till Spark och RDD:er
Lektion 5
- Spark-arkitektur och konfiguration
- Spark-applikationer och Spark-skal
- RDD (Resilient Distributed Datasets)
- Datatransformeringar och åtgärder
- Caching och persistens
- Laddar och sparar data
Spark SQL och databehandling
Lektion 6
- Spark SQL-arkitektur
- DataFrames och Datasets
- Att arbeta med JSON och Parquet
- Användardefinierade funktioner (UDF:er)
- Integration med Hive
Maskininlärning med Spark MLlib
Lektion 7
- Introduktion till maskininlärningskoncept
- MLlib-funktioner och verktyg
- Övervakade och oövervakade algoritmer
- Linjär regression, beslutsträd, slumpskogar
- Klustringstekniker
Strömning med Kafka och Flume
Lektion 8
- Begrepp inom realtidsdatabehandling
- Kafka-arkitektur och klusteruppsättning
- Datainhämtning och strömningspipelines

Vem bör anmäla sig till det här programmet?
Förutsättningar
- Grundläggande förståelse för SQL och databaser
- Vana vid programmering (Python, Java eller Scala rekommenderas)
- Grundläggande kunskaper i Linux/Unix (hjälpsamt men inte obligatoriskt)
- Erfarenhet av Hadoop-koncept är en fördel men inget krav
Data scientists och dataingenjörer
Dataanalytiker och BI-specialister
Programvaruutvecklare och arkitekter
Forskningsproffs som arbetar med data
Uttalanden
Licensiering och ackreditering
Kursen erbjuds i enlighet med Partnerprogramavtalet och uppfyller kraven i Licensavtalet.
Likabehandlingspolicy
Kandidater uppmuntras att kontakta AVC för vägledning och stöd under hela processen för att ordna anpassningar.
Vanliga frågor

Behöver du företagslösningar eller LMS-integration?
Hittade du inte kursen eller programmet som skulle passa för ditt företag? Behöver du LMS-integration? Skriv till oss! Vi löser det!
