AW
Tillbaka till projekt

Datapipeline: Gapminder

Interaktiv demo av ett datapipeline-flöde: från rådata till insikter i 4 steg. Byggt med SQL-transformeringar och data från Gapminder.org.

Teknikstack

SQL
React
TypeScript
Recharts
Tailwind CSS

Översikt

En interaktiv visualisering av ett typiskt datapipeline-flöde med riktig data från Gapminder.org. Demonstrerar hela kedjan från rådataingestion, datarensning (duplicerade rader, null-värden, ogiltiga poster), transformation och aggregering per kontinent, till slutlig rapportering med diagram. Varje steg visar den SQL-kod som används och det resulterande datasetet.

Huvudfunktioner

  • 4-stegs interaktiv pipeline-visualisering
  • Riktig data från Gapminder.org (livslängd, BNP, population)
  • SQL-kod vid varje steg som visar transformeringarna
  • Datarensning med sammanfattning av borttagna rader
  • Aggregering per kontinent med scatter plot och stapeldiagram

Utmaningar & lärdomar

Att presentera ett datapipeline-flöde interaktivt på ett pedagogiskt sätt krävde en balans mellan att visa tillräckligt med teknisk detalj (SQL-kod, radantal, rensningsregler) utan att överväldiga användaren. Lösningen blev en stepper-komponent där varje steg visar kod, data och sammanfattning sida vid sida.