Apache Spark och Scala-kurs – Klassrum

22.500,00 SEK

  • 24 hours
Live Virtuellt Klassrum
På plats / Inom företaget
Nästa omgång:May 11, 2026
+ 13 dagar kvar

Lås upp den fulla potentialen i big data genom att bemästra Apache Spark med Scala – en av de mest kraftfulla kombinationerna inom modern data engineering. Den här praktiskt inriktade kursen är utformad för att hjälpa dig att bearbeta, analysera och få insikter ur enorma datamängder med hjälp av Sparks snabba, minnesbaserade beräkningskapacitet. Du lär dig att bygga skalbara datapipelines, utföra realtidsanalys och implementera maskininlärningsmodeller – samtidigt som du utvecklar starka programmeringskunskaper i Scala.

Viktiga funktioner

Språk

Kursmaterial på engelska

Nivå

Nybörjar- till mellannivå

24 timmars instruktörsledd, praktisk utbildning

50+ timmars rekommenderad studietid

3 verkliga projekt för praktisk tillämpning

Över 70 timmars quiz, uppgifter och övningsmaterial

Praktiska labbar med verkliga dataset

Behandling av verktyg i Spark-ekosystemet som Spark SQL, MLlib och Streaming

Praktisk erfarenhet av programmering i Scala

Experthandledning och vägledning under hela kursen

Be om datum­bekräftelse!

Intyg om genomförd utbildning ingår

Hero

Lärandemål

I slutet av det här programmet kommer du att kunna:

Grunderna i big data

Utveckla en gedigen förståelse för big data-koncept, nyckelkomponenter och ramverk, inklusive Hadoop-arkitektur och dess driftlägen.

Introduktion till Scala

Lär dig grunderna i Scala-programmering, inklusive dess centrala syntax och koncept som krävs för att arbeta med Apache Spark.

Introduktion till Spark

Förstå de grundläggande principerna i Apache Spark och hur du bygger och kör Spark-applikationer.

Spark-ramverk och distribution

Utforska ramverket Spark på djupet, inklusive dess arkitektur och olika sätt att distribuera det.

Spark-datastrukturer

Arbeta med Sparks interna datastrukturer som RDD:er och använd API:er och Scala-funktioner för att skapa och transformera data.

Spark-ekosystemet

Få praktisk erfarenhet av viktiga komponenter i Spark-ekosystemet, inklusive Spark SQL, Streaming, MLlib, GraphX och mer.

Hero

Kursöversikt

  1. Introduktion till Big Data, Hadoop och Spark

    Lektion 1

    • Big data-koncept och verkliga användningsfall
    • Hadoop-ekosystemet och HDFS
    • Klusterarkitektur och YARN
    • Batchbearbetning vs realtidsbearbetning
    • Introduktion till Spark och dess fördelar
  2. Introduktion till Scala

    Lektion 2

    • Grunder i Scala och REPL
    • Variabler, styrstrukturer och funktioner
    • Samlingar (Array, Map, Listor, Tupler)
    • Scala i big data-ekosystem
  3. Objektorienterad och funktionell programmering i Scala

    Lektion 3

    • Klasser, objekt och paket
    • Egenskaper och arv
    • Funktionella programmeringskoncept
    • Funktioner av högre ordning och felhantering
  4. Scala Collections-API:er

    Lektion 4

    • Samlingstyper och hierarkier
    • Prestandaegenskaper
    • Java-interoperabilitet
    • Använda implicita värden i Scala
  5. Introduktion till Spark och RDD:er

    Lektion 5

    • Spark-arkitektur och konfiguration
    • Spark-applikationer och Spark-skal
    • RDD (Resilient Distributed Datasets)
    • Datatransformeringar och åtgärder
    • Caching och persistens
    • Laddar och sparar data
  6. Spark SQL och databehandling

    Lektion 6

    • Spark SQL-arkitektur
    • DataFrames och Datasets
    • Att arbeta med JSON och Parquet
    • Användardefinierade funktioner (UDF:er)
    • Integration med Hive
  7. Maskininlärning med Spark MLlib

    Lektion 7

    • Introduktion till maskininlärningskoncept
    • MLlib-funktioner och verktyg
    • Övervakade och oövervakade algoritmer
    • Linjär regression, besluts­träd, slump­skogar
    • Klustringstekniker
  8. Strömning med Kafka och Flume

    Lektion 8

    • Begrepp inom realtidsdatabehandling
    • Kafka-arkitektur och klusteruppsättning
    • Datainhämtning och strömningspipelines
Kurs i Apache Spark och Scala

Vem bör anmäla sig till det här programmet?

Förutsättningar

  • Grundläggande förståelse för SQL och databaser
  • Vana vid programmering (Python, Java eller Scala rekommenderas)
  • Grundläggande kunskaper i Linux/Unix (hjälpsamt men inte obligatoriskt)
  • Erfarenhet av Hadoop-koncept är en fördel men inget krav



Data scientists och dataingenjörer

Dataanalytiker och BI-specialister

Programvaruutvecklare och arkitekter

Forskningsproffs som arbetar med data

Starta kursen nu

Uttalanden

Licensiering och ackreditering

Kursen erbjuds i enlighet med Partnerprogramavtalet och uppfyller kraven i Licensavtalet.

Likabehandlingspolicy

Kandidater uppmuntras att kontakta AVC för vägledning och stöd under hela processen för att ordna anpassningar.

Vanliga frågor

Contact background

Behöver du företagslösningar eller LMS-integration?

Hittade du inte kursen eller programmet som skulle passa för ditt företag? Behöver du LMS-integration? Skriv till oss! Vi löser det!