Data Mining Process In Hindi.

हेलो दोस्तों आज के इस ब्लॉग पोस्ट(Data Mining Process In Hindi) में हम आपको Data mining के process के बारे में हिंदी में बताने जा रहे है |

Data mining के दौरान हम बहुत सारी process को एक्सेक्यूटे करके एक लार्ज डाटा सेट से valuable इनफार्मेशन को निकालते है |Data Mining Process In Hindi|

कहने का मतलब यह है कि डाटा माइनिंग में कई सारे steps होते है जैसे कि डाटा कलेक्शन करना, फिर उस डाटा का visualization करना और फिर उस डाटा में से जरुरी इनफार्मेशन को निकालना |Data Mining Process In Hindi|

जैसा कि हमने ऊपर describe किया है डाटा माइनिंग तकनीक का उपयोग हम एक लार्ज डाटा सेट से description और prediction generate करने के लिए करते है |Data Mining Process In Hindi|

Data scientists जो है वो अपने pattern के observation की मदद से, association , और correlation की मदद से डाटा को describe करते है |

और वे cluster Data को भी classify करते है classification और regression मेथड के जरिये| और वे use case के लिए outlier को भी identify करते है जैसे कि spam detection |

Data Mining Process In Hindi:

Data mining में मुख्य रूप से चार तरह के steps होते है |

Setting objectives
Data gathering and preparation
applying Data mining algorithm
evaluating results

Set the business objectives:

यह steps जो है वो Data mining का सबसे कठिन स्टेप हो सकता है फिर भी बहुत से आर्गेनाइजेशन इस स्टेप्स को बहुत कम टाइम प्रोवाइड करते है |

इसके लिए Data scientisits और stakeholders का साथ में काम करके बिज़नेस प्रॉब्लम को identify करना बहुत ही जरुरी है जिससे कि किसी भी प्रोजेक्ट के लिए डाटा questions को identify करना बहुत ही आसान हो जाता है |

और इसके लिए जो डाटा एनालिस्ट होते है वो कुछ एडिशनल रिसर्च कर सकते है जिससे कि वे बिज़नेस context को और अच्छे से समझ सके |

Data preparation:

एक बार जब प्रॉब्लम के स्कोप को डिफाइंड कर लिया जाता है तब डाटा साइंटिस्ट्स के लिए यह बहुत ही आसान हो जाता है कि कौन सा डाटा सेट जो है वो बिज़नेस के pertient questions के लिए हेल्पफुल रहेगा |

एक बार जब रिलेवेंट डाटा को कलेक्ट कर लिए जाता है तब उस डाटा को क्लीन किया जाता है और उसमे से noisy डाटा को रिमूव किया जाता है जैसे कि duplicates , मिसिंग वैल्यूज, और outliers |

डाटासेट को ध्यान में रखकर हम कुछ एडिशनल स्टेप्स ले सकते है जिससे कि हम कुछ dimensions के नंबर को कम कर सके| क्योकि कई सारे फीचर्स जो है वो computation की स्पीड को स्लो डाउन कर सकते है |

इसलिए डाटा साइंटिस्ट्स जो है वो most important predictors को retain करने की कोशिश करते है जिससे कि किसी भी मॉडल के लिए optimal accuracy को maintain किया जा सके |

Model building and pattern mining:

analysis types के basis पर डाटा साइंटिस्ट जो है वो कोई भी इंटरेस्टिंग डाटा को investigate कर सकते है जैसे कि sequential patterns , association rules , अथवा correlation |

जबकि हाई फ्रीक्वेंसी पैटर्न्स जो है वो काफी ब्रॉड application रखते है , कभी कभी डाटा deviation बहुत इंटरेस्टिंग हो जाता है, potential फ्रॉड के एरिया को हाईलाइट करना|

avialable डाटा के आधार पर डाटा सेट को classify अथवा क्लस्टर करने के लिए deep learning algorithm को भी अप्लाई कर सकते है | अगर इनपुट डाटा जो है वो labelled है तो फिर डाटा categorization के लिए हम classification मॉडल का उपयोग कर सकते है |

या फिर अल्टरनेटिव के तौर पर regression को भी अप्लाई कर सकते है किसी भी particular असाइनमेंट के likelihood को predict करने के लिए |

और अगर डाटा जो है वो labelled नहीं है तो फिर individual डाटा जो कि ट्रेनिंग सेट को पॉइंट करता है उसे compare किया जाता है किसी दूसरे से जिससे कि underlying similarities को identify किया जा सके और characteristics के बेस पर उन्हें cluster किया जा सके |

Evaluation of results and implementation of knowledge:

एक बार जब डाटा को aggregated कर लिया जाता है तब सिर्फ रिजल्ट को evaluate और interpret करने की जरुरत होती है | और जब रिजल्ट को finalize किया जाता है तब वह valid हो, useful हो और उसे समझा जा सके|

और जब यह criteria फुलफिल होता है तब आर्गेनाइजेशन जो है वो इस नॉलेज को नयी स्ट्रेटेजीज इम्प्लीमेंट करने के लिए use कर सकती है और अपने objectives को achieve कर सकती है |

इस ब्लॉग(Data Mining Process In Hindi) को लेकर आपके मन में कोई भी प्रश्न है तो आप हमें इस पते [email protected]पर ईमेल लिख सकते है|

आशा करता हूँ, कि आपने इस पोस्ट(Data Mining Process In Hindi) को खूब एन्जॉय किया होगा|

आप स्वतंत्रता पूर्वक अपना बहुमूल्य फीडबैक और कमेंट यहाँ पर दे सकते है|

आपका समय शुभ हो|

Anurag

I am a blogger by passion, a software engineer by profession, a singer by consideration and rest of things that I do is for my destination.