Technology

पावर बीआई एकत्रीकरण के लिए अंतिम गाइड

kamalsaklani@rediffmail.com13/11/202501 mins

Latest Technology, (लेटेस्ट टेक न्यूज़) Gadget (गैजेट्स) …

Power BI में एक कंपोजिट मॉडल सुविधा का उपयोग करते हुए, आपने पहले ही एक और अत्यंत महत्वपूर्ण और शक्तिशाली अवधारणा – एकत्रीकरण के बारे में सुना होगा! ऐसा इसलिए है क्योंकि कई परिदृश्यों में, विशेष रूप से एंटरप्राइज़-स्केल मॉडल के साथ, एकत्रीकरण समग्र मॉडल का एक प्राकृतिक “घटक” है।

हालाँकि, चूंकि समग्र मॉडल सुविधा का लाभ एकत्रीकरण के बिना भी उठाया जा सकता है, इसलिए मैंने सोचा कि एकत्रीकरण अवधारणा को एक अलग लेख में समझाना उचित होगा।

इससे पहले कि हम बताएं कि पावर बीआई में एकत्रीकरण कैसे काम करता है और कुछ विशिष्ट उपयोग मामलों पर एक नज़र डालें, आइए पहले निम्नलिखित प्रश्नों के उत्तर दें:

हमें सबसे पहले एकत्रीकरण की आवश्यकता क्यों है? मॉडल में समान डेटा वाली दो तालिकाएँ रखने का क्या लाभ है?

इससे पहले कि हम इन दो बिंदुओं को स्पष्ट करें, यह ध्यान रखना महत्वपूर्ण है कि पावर बीआई में दो अलग-अलग प्रकार के एकत्रीकरण हैं।

उपयोगकर्ता-परिभाषित एकत्रीकरण कुछ वर्ष पहले तक, Power BI में एकमात्र एकत्रीकरण प्रकार थे। यहां, आप एकत्रीकरण को परिभाषित करने और प्रबंधित करने के प्रभारी हैं, भले ही Power BI बाद में क्वेरी निष्पादित करते समय स्वचालित रूप से एकत्रीकरण की पहचान करता है।
स्वचालित एकत्रीकरण Power BI में नवीनतम सुविधाओं में से एक है। स्वचालित एकत्रीकरण सुविधा सक्षम होने पर, आप कॉफी पी सकते हैं, बैठ सकते हैं और आराम कर सकते हैं, क्योंकि मशीन लर्निंग एल्गोरिदम आपकी रिपोर्ट में सबसे अधिक बार चलने वाले प्रश्नों के बारे में डेटा एकत्र करेगा और उन प्रश्नों का समर्थन करने के लिए स्वचालित रूप से एकत्रीकरण बनाएगा।

इन दो प्रकारों के बीच महत्वपूर्ण अंतर, निश्चित रूप से इस तथ्य के अलावा कि स्वचालित एकत्रीकरण के साथ आपको अपने किरायेदार में इस सुविधा को चालू करने के अलावा कुछ भी करने की आवश्यकता नहीं है, लाइसेंसिंग सीमाएं हैं। जबकि उपयोगकर्ता-परिभाषित एकत्रीकरण प्रीमियम और प्रो दोनों के साथ काम करेगा, इस समय स्वचालित एकत्रीकरण के लिए प्रीमियम लाइसेंस की आवश्यकता होती है।

अब से, हम केवल उपयोगकर्ता-परिभाषित एकत्रीकरण के बारे में बात करेंगे, बस इसे ध्यान में रखें।

ठीक है, यहां एकत्रीकरण और पावर बीआई में उनके काम करने के तरीके का संक्षिप्त विवरण दिया गया है। यहाँ परिदृश्य है: आपके पास एक बड़ी, बहुत बड़ी तथ्य तालिका है, जिसमें सैकड़ों लाखों, या यहाँ तक कि अरबों पंक्तियाँ भी हो सकती हैं। तो, आप इतनी बड़ी मात्रा में डेटा पर विश्लेषणात्मक अनुरोधों को कैसे संभालते हैं?

आप बस समग्र तालिकाएँ बनाएँ! वास्तव में, यह एक बहुत ही दुर्लभ स्थिति है, या मान लें कि यह एक नियम से अधिक अपवाद है, कि विश्लेषणात्मक आवश्यकता व्यक्तिगत लेनदेन, या व्यक्तिगत रिकॉर्ड को विवरण के निम्नतम स्तर के रूप में देखना है। अधिकांश परिदृश्यों में, आप सारांशित डेटा पर विश्लेषण करना चाहते हैं: जैसे, किसी विशिष्ट दिन पर हमारा कितना राजस्व था? या, उत्पाद X की कुल बिक्री राशि क्या थी? इसके अलावा, ग्राहक X ने कुल कितना खर्च किया?

इसके अतिरिक्त, आप कई विशेषताओं पर डेटा एकत्र कर सकते हैं, जो आमतौर पर होता है, और किसी विशिष्ट तिथि, ग्राहक और उत्पाद के आंकड़ों को सारांशित कर सकते हैं।

यदि आप सोच रहे हैं कि डेटा एकत्र करने का क्या मतलब है… तो, अंतिम लक्ष्य पंक्तियों की संख्या को कम करना है और परिणामस्वरूप, पहले से डेटा तैयार करके, समग्र डेटा मॉडल आकार को कम करना है।

इसलिए, यदि मुझे वर्ष की पहली तिमाही में उत्पाद Y पर ग्राहक X द्वारा खर्च की गई कुल बिक्री राशि देखने की आवश्यकता है, तो मैं इस डेटा को पहले से ही संक्षेप में प्रस्तुत करने का लाभ उठा सकता हूं।

कुंजी “घटक” – पावर बीआई को एकत्रीकरण के बारे में “जागरूक” बनाएं!

ठीक है, यह कहानी का एक पक्ष है। अब और दिलचस्प हिस्सा आता है. आपकी Power BI रिपोर्ट को तेज़ करने के लिए स्वयं एकत्रीकरण बनाना पर्याप्त नहीं है – आपको Power BI को एकत्रीकरण के बारे में जागरूक करने की आवश्यकता है!

आगे बढ़ने से पहले बस एक टिप्पणी: एकत्रीकरण जागरूकता एक ऐसी चीज़ है जो केवल तभी काम करेगी, और केवल तभी जब मूल तथ्य तालिका DirectQuery स्टोरेज मोड का उपयोग करती है। हम जल्द ही बताएंगे कि एकत्रीकरण को कैसे डिज़ाइन और प्रबंधित किया जाए और अपनी तालिकाओं का उचित भंडारण मोड कैसे सेट किया जाए। इस समय, बस यह ध्यान रखें कि मूल तथ्य तालिका DirectQuery मोड में होनी चाहिए।

आइए अपना एकत्रीकरण बनाना शुरू करें!

जैसा कि आप ऊपर दिए गए चित्रण में देख सकते हैं, हमारा मॉडल काफी सरल है – जिसमें एक तथ्य तालिका (FactOnlineSales) और तीन आयाम (DimDate, DimStore, और DimProduct) शामिल हैं। सभी तालिकाएँ वर्तमान में DirectQuery संग्रहण मोड का उपयोग कर रही हैं।

चलिए और दो अतिरिक्त तालिकाएँ बनाते हैं जिन्हें हम एकत्रित तालिकाओं के रूप में उपयोग करेंगे: पहला दिनांक और उत्पाद पर डेटा को समूहीकृत करेगा, जबकि दूसरा समूहीकरण के लिए दिनांक और स्टोर का उपयोग करेगा:

/*Table 1: Agg Data per Date & Product */
SELECT DateKey
       ,ProductKey
       ,SUM(SalesAmount) AS SalesAmount
       ,SUM(SalesQuantity) AS SalesQuantity 
FROM FactOnlineSales 
GROUP BY DateKey
        ,ProductKey

/*Table 2: Agg Data per Date & Store */
SELECT DateKey
       ,StoreKey
       ,SUM(SalesAmount) AS SalesAmount
       ,SUM(SalesQuantity) AS SalesQuantity 
FROM FactOnlineSales 
GROUP BY DateKey
        ,StoreKey