Kiejtés

  • IPA: [ ˈɒdɒtːaːrɦaːz]

Főnév

adattárház

  1. (informatika) Az adattárház (Data Warehouse) egy olyan központosított adatbázis, amely nagy mennyiségű strukturált adat tárolására, kezelésére és elemzésére szolgál, jellemzően hosszú távon. Az adattárházak célja, hogy különböző forrásokból származó adatokat integráljanak egyetlen rendszerbe, így lehetővé téve az adatok gyors és hatékony elemzését, amely segíti az üzleti intelligencia (BI) folyamatokat és a stratégiai döntéshozatalt.

Főbb jellemzők:

  1. Integráció különböző adatforrásokból: Az adattárházak többféle forrásból származó adatokat gyűjtenek össze, mint például tranzakciós rendszerek, CRM rendszerek, ERP rendszerek, webes elemzési eszközök és külső adatok. Ezeket az adatokat egyesítik és strukturálják, hogy később egyszerűbb legyen az elemzésük.
  2. Történeti adatok tárolása: Az adattárházak jellemzően nagy mennyiségű történeti adatot tárolnak, így lehetővé téve a hosszabb időszakokat felölelő elemzéseket és trendvizsgálatokat. Ez különösen fontos a vállalatok számára, hogy megértsék az időbeli változásokat és hosszú távú mintákat.
  3. Strukturált adatok: Az adattárházakban az adatok strukturáltak és rendezettek, jellemzően táblákban tárolják őket. Az adatok átalakításon és tisztításon mennek keresztül, mielőtt bekerülnének az adattárházba, hogy biztosítsák az adatminőséget és a konzisztenciát.
  4. Optimalizálás az elemzési lekérdezésekre: Az adattárházak olyan módon vannak tervezve, hogy támogassák a nagy volumenű adatlekérdezéseket és az üzleti intelligenciához szükséges gyors elemzéseket. Az adattárházak OLAP (Online Analytical Processing) rendszerekkel működnek együtt, amelyek lehetővé teszik a többdimenziós adatelemzést.

Adattárházak folyamatainak fő lépései:

  1. Adatgyűjtés: Az adatok összegyűjtése különféle forrásokból, mint például tranzakciós rendszerek, külső adatforrások vagy szenzorok.
  2. ETL folyamatok (Extract, Transform, Load): Az adatok kinyerése (Extract), átalakítása (Transform) és betöltése (Load) az adattárházba. Az átalakítás során az adatok tisztításra, normalizálásra és egységesítésre kerülnek, hogy kompatibilisek legyenek az adattárház struktúrájával.
  3. Adattárolás: Az átalakított adatok az adattárházba kerülnek, ahol készen állnak a lekérdezésekre és az elemzésre.
  4. Adatlekérdezés és elemzés: Az üzleti intelligencia eszközök, például OLAP rendszerek és adatelemzési szoftverek segítségével az adattárházból adatokat lehet lekérdezni, és jelentéseket, elemzéseket készíteni. Ez támogatja az üzleti döntéshozatalt és előrejelzéseket készít.

Adattárházak előnyei:

  1. Egységesített adatforrás: Az adattárházak összefoglalják és rendszerezik az adatokat különböző forrásokból, ezáltal biztosítják, hogy a döntéshozók hozzáférjenek a teljes képet adó, konzisztens adatokhoz.
  2. Gyors elemzési teljesítmény: Az adattárházak optimalizáltak a nagy mennyiségű adatok gyors lekérdezésére és elemzésére, lehetővé téve, hogy a vállalatok időben hozzanak stratégiai döntéseket.
  3. Történeti adatok elemzése: A hosszú távú adatok tárolása lehetőséget biztosít arra, hogy a vállalatok trendeket, mintázatokat és hosszabb időszakokra vonatkozó változásokat elemezzenek.
  4. Jobb üzleti döntéshozatal: Az adattárházak támogatják az üzleti intelligencia folyamatokat, amelyek segítik a vezetőket és az elemzőket a pontos és megalapozott döntéshozatalban.

Adattárházak használati esetek:

  1. Pénzügyi elemzések: Az adattárházak kiválóak pénzügyi adatok tárolására és elemzésére, segítve a vállalatokat a költségek optimalizálásában, a bevételek nyomon követésében és a pénzügyi trendek elemzésében.
  2. Értékesítési jelentések: Az adattárházak lehetővé teszik az értékesítési adatok elemzését, az értékesítési teljesítmény nyomon követését, valamint a piaci trendek és ügyfélviselkedések mélyebb megértését.
  3. Ellátási lánc és logisztika: Az adattárházak segítenek az ellátási lánc és logisztikai adatok elemzésében, például a raktárkészlet kezelésében, szállítási időkre vonatkozó trendek elemzésében és a folyamatok optimalizálásában.
  4. Ügyfélviselkedés elemzése: Az ügyféladatok tárolása és elemzése az adattárházakban lehetővé teszi a vásárlói szokások, preferenciák és trendek vizsgálatát, amely segíthet célzott marketingkampányok tervezésében.

Példák adattárház megoldásokra:

  • Amazon Redshift: Az Amazon felhőalapú adattárháza, amely gyors adatlekérdezést biztosít nagy adathalmazokon.
  • Google BigQuery: A Google felhőalapú adattárháza, amely lehetővé teszi a nagy mennyiségű adatok gyors elemzését.
  • Snowflake: Egy független felhőalapú adattárház-megoldás, amely egyszerű adatkezelést és elemzést biztosít különböző adatforrásokból.
  • Microsoft Azure Synapse Analytics: A Microsoft Azure platformjának része, amely lehetővé teszi az adatok integrálását, elemzését és jelentéskészítését nagy skálán.

Az adattárházak tehát alapvető eszközökké váltak az adatvezérelt üzleti folyamatok támogatásában, különösen akkor, amikor nagy mennyiségű adat kezelésére és elemzésére van szükség, hogy stratégiai döntéseket lehessen hozni.