Napredne baze podataka
Važne obavijesti
- Termin predavanja i vježbi je PETAK, 9-12, u dvorani 001
- Predavanja se odvijaju u živo, gdje su moguće i konzultacije i dogovori o aktualnostima na predmetu.
- Materijali za nastavu, predavanje i ocjenjivanje zadaća i projekata se obavljaju kroz Merlin.
U Merlinu će kolegij biti automatski dostupan onim studentima koji ga imaju upisanog u ISVU.
- Predavanja će biti dostupna na Merlinu unaprijed, a važne obavijesti o zadaćama i sl. šaljemo mailom.
- Ako niste sigurni je li ovaj kolegij za vas, poslušajte uvodno predavanje. Preduvjet je položen kolegij Baze podataka, a također biste trebali znati i nešto isprogramirati (u bilo kojem jeziku).
Osnovni podaci o kolegiju
- Izborni kolegij na diplomskim studijima matematike.
- Predaje se jedan semestar (ljetni).
- Satnica: 2 sata predavanja i 1 sat vježbi tjedno.
- ECTS bodovi: 5.
Ciljevi kolegija
Studente osposobiti za:
- prepoznavanje uloge nerelacijskih baza i skladišta podataka u pohrani i analizi velike količine podataka
- rad sa nerelacijskim bazama podataka te skladištima podataka
- razumijevanje naprednih mogućnosti relacijskih baza podataka
- kritičko promišljanje o načinima pohrane i rada s podacima
- razumijevanje mogućnosti analiza velikih količina podataka
- Stjecanje osnovnih znanja o relacijskim bazama podataka.
Svrha kolegija
- U modernom softverskom inženjerstvu, pohrana i analiza podataka se podrazumijevaju. Pri tom se ne ograničavamo samo na relacijske baze podataka, nego i na
druge načine pohrane podataka. Osim toga, količina strojno generiranih podataka je sve veća,
pa se i ukupna količina podataka koji se proizvode u svijetu drastično povećava.
- U ovom kolegiju radimo kritički osvrt na mogućnosti relacijskih baza podataka, NoSQL baza podataka i distribuiranih
datotečnih sustava za pohranu i rad s podacima. Također se upoznajemo s konceptom i izradom skladišta podataka
te s drugim paradigmama za analize velikih količina podataka.
Sadržaj predavanja i vježbi
- Relacijske baze podataka: Ponavljanje. Model podataka. Ograničenja. Transakcije. Okidači i pohranjene procedure.
Složeni tipovi podataka u relacijskim bazama podataka (liste, skupovi, vremenski podaci, prostorno-vremenski podaci).
Načini distribucije RDB, protokoli za pomirenje podataka.
- Skladišta podataka: Uvod. Modeli skladišta podataka. OLAP sustavi. Postupak modeliranja skladišta. ETL proces.
- NoSQL: Uvod. Razlozi nastanka NoSQL baza. Agregatni modeli. Distribucija podataka. Usporedbe s RDB.
Sheme, nedostatak shema i migracija shema. ACID vs BASE. Konzistencija i CAP teorem. Key-value DB. Column-family DB. Document DB. Graph DB.
- Map-reduce: Uvod. Algoritam. Primjeri. M/R u NoSQL bazama. M/R i AFP u MongoDB.
- Hibridni modeli: Hibridni modeli informacijskih sustava. Polyglot persistance. NoSQL proširenja RDMBS.
- Distribuirani FS i Big Data: Uvod. Big Data paradigma. Google FS. HDFS. Hadoop. Spark.
Literatura
- Pramod J. Sadalage, Martin Fowler, NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence, Addison Wesley, 2012
- R. Kimball, M. Ross, The Data Warehouse Toolkit – The Complete Guide to Dimensional Modeling, 2nd edition. John Wiley & Sons, 2002.
- Eric Redmond, Jim Wilson, Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement, Pragmatic Bookshelf, 2012
- Alex Holmes, Hadoop in practice, Manning, 2012
Obveze studenata
- Sudjelovanje u nastavi
- Izrada domaćih zadaća
- Izrada timskog projekta
- Kratki završni razgovor
Nastavni materijali i drugi dokumenti
- Nastavni materijali i svi drugi dokumenti (zadaće, projekti) se pojavljuju na Merlinu tijekom semestra.
Predavanja i vježbe
Konzultacije
- U živo: prije, u pauzi ili nakon predavanja
- Mailom: pišite u svako doba, odgovaram čim stignem
- Video poziv: zamolite termin mailom (grupne konzultacije su također moguće)