IPS है सूचना पुनर्प्राप्ति प्रणाली का उद्देश्य और कार्य
IPS है सूचना पुनर्प्राप्ति प्रणाली का उद्देश्य और कार्य

वीडियो: IPS है सूचना पुनर्प्राप्ति प्रणाली का उद्देश्य और कार्य

वीडियो: IPS है सूचना पुनर्प्राप्ति प्रणाली का उद्देश्य और कार्य
वीडियो: इलेक्ट्रिक लोकोमोटिव कैसे काम करता है? | WAP7 कार्य फ़ंक्शन | इलेक्ट्रिक लोकोमोटिव कार्य फ़ंक्शन 2024, नवंबर
Anonim

एक आधुनिक व्यक्ति के लिए इंटरनेट के बिना जीवन की कल्पना करना और सूचना स्रोतों तक लगभग तात्कालिक पहुंच की कल्पना करना कठिन है। उपयोगकर्ता शायद ही कभी सोचता है कि नेटवर्क पर वांछित सामग्री की खोज कैसे की जाती है। लेकिन यह बहुत दिलचस्प है।

एक सूचना पुनर्प्राप्ति प्रणाली (आईपीएस) एक जटिल सॉफ्टवेयर और हार्डवेयर प्रणाली है जो उपयोगकर्ता के अनुरोध पर जानकारी का चयन करती है। सूचनाओं को सर्वरों पर डिजिटल रूप में संग्रहीत किया जाता है, क्योंकि पुस्तकें पुस्तकालयों की अलमारियों पर हुआ करती थीं। सिस्टम में कई सबसिस्टम होते हैं। प्रत्येक उपयोगकर्ता के अनुरोध को संसाधित करने और उसे पाठ या ध्वनि रूप में जानकारी प्रदान करने की प्रक्रिया में अपना कार्य करता है। हल किए जाने वाले कार्यों की बहुलता आधुनिक सूचना पुनर्प्राप्ति प्रणाली (सूचना पुनर्प्राप्ति प्रणाली का संक्षिप्त नाम) की वास्तुकला की जटिलता को निर्धारित करती है। एक प्रकार का "ब्लैक बॉक्स": इनपुट पर - अनुरोध का टेक्स्ट, अंदर क्या है - अज्ञात है, आउटपुट पर - व्यापक जानकारी।

वास्तविक जीवन में कार्ड फ़ाइल
वास्तविक जीवन में कार्ड फ़ाइल

इनपुट स्ट्रीम

जानकारी के लिए अनुरोध जो एक व्यक्ति अपने गैजेट की स्क्रीन पर टेक्स्ट के रूप में बनाता है,खोज इंजन द्वारा संसाधित किए गए अनुरोधों का एक छोटा सा हिस्सा बनता है। खोज प्रश्नों की मुख्य सरणियाँ रोबोट द्वारा बनाई जाती हैं जो मानव अनुरोध को स्वीकार करते हैं और उपयोगकर्ता के साथ बहु-चरणीय खोज और प्रतिक्रिया करते हैं। सूचना पुनर्प्राप्ति प्रणालियों में प्रसिद्ध Google, यांडेक्स और अन्य शामिल हैं, जो प्रतिदिन लाखों अनुरोधों को संसाधित करते हैं।

स्रोत खोज ऑब्जेक्ट

खोज के लिए रुचि की प्रारंभिक वस्तुओं का सेट दस्तावेज़, रिकॉर्ड, वीडियो, चित्र और बहुत कुछ है। वे आईपीएस के बाहर बनाए गए हैं। सामान्य सूचना भंडारण और पुनर्प्राप्ति प्रणाली में एक अंतर्निहित ग्रंथ सूची प्रणाली होनी चाहिए - एक प्रकार की सूची जो आपको किसी भी प्रकार की वस्तुओं की खोज करने की अनुमति देती है।

वस्तुएं या उनके डिजिटल परिवर्तन IPS में "प्रवेश संसाधन" बन जाते हैं। उनमें से यह है कि उपयोगकर्ता को आवश्यक जानकारी का चयन किया जाता है।

जानकारी के लिए खोजे
जानकारी के लिए खोजे

बाहरी स्रोत

सूचना चयन दृश्य बाहरी ज्ञान स्रोतों का उपयोग करता है। यह वह जानकारी है जिसकी उपयोगकर्ता तलाश कर रहा है। फ़िल्म का शीर्षक, किताब का एक उद्धरण, और बहुत कुछ। एक कंप्यूटर खोज के लिए, इस जानकारी को एक एल्गोरिथम भाषा में एक क्वेरी में अनुवादित किया जाना चाहिए। IPS में, यह प्रश्नों को बनाने, अनुक्रमित करने और विकसित करने के लिए ब्लॉक का उपयोग करके किया जाता है।

आदर्श रूप से, इन तीन प्रक्रियाओं-प्रतिनिधित्व, अनुक्रमण, और क्वेरी विकास- को ज्ञान के समान स्रोतों पर निर्भर होना चाहिए, लेकिन व्यवहार में, यह प्राप्त करने योग्य नहीं है।

ज्ञान स्रोतों की लगातार समीक्षा और अद्यतन किया जाना चाहिए, और अद्यतन समान होना चाहिए औरसमकालिक। और ज्ञान का एक बाहरी स्रोत हमेशा कालानुक्रमिक रूप से किसी क्वेरी के लिए खोज इंजन में इसके उपयोग से पहले होता है, कभी-कभी कई वर्षों तक।

सूचना पुनर्प्राप्ति प्रणाली
सूचना पुनर्प्राप्ति प्रणाली

प्रदर्शन

मूल वस्तुओं के प्रतिनिधित्व कुछ संयोजन में इनपुट डेटा से बने होते हैं या किसी विशेष सूचना पुनर्प्राप्ति प्रणाली के नियमों और एल्गोरिदम के अनुसार रूपांतरित होते हैं।

दृश्य मूल खोज वस्तु की कमोबेश रूपांतरित प्रतियाँ हैं। असंपादित पूर्ण ग्रंथों के संग्रह में, प्रत्येक पाठ का अपना प्रतिनिधित्व है। संग्रहालय की वस्तुओं और कलाकृतियों के संग्रह में, प्रतिनिधित्व वस्तु का उसकी छवि के साथ एक रूपांतरित विवरण हो सकता है। कुछ मामलों में, प्रतिनिधित्व आंशिक रूप से मूल वस्तु से और आंशिक रूप से विवरण से प्राप्त किया जा सकता है: ग्रंथ सूची खोज इंजन में, प्रतिनिधित्व वस्तु से प्राप्त होते हैं - उदाहरण के लिए, शीर्षक, लेखक का नाम काम के एनोटेशन के साथ जोड़ा जाएगा।

आपको जो चाहिए वो ढूँढना
आपको जो चाहिए वो ढूँढना

खोज योग्य अनुक्रमणिका

चूंकि सूचना पुनर्प्राप्ति प्रणाली में जानकारी एक प्रतिनिधित्व के रूप में संग्रहीत की जाती है, यह मान लेना तर्कसंगत है कि खोज प्रतिनिधित्व के अनुसार की जाती है और चयन के बाद, उपयोगकर्ता को दी जाती है। व्यवहार में ऐसा नहीं है। उदाहरण के लिए, वर्तमान ऑनलाइन लाइब्रेरी कैटलॉग आमतौर पर खोजों को कुछ क्षेत्रों तक सीमित रखते हैं: लेखक, शीर्षक, और उपशीर्षक एक दृश्य के भीतर जिसमें अन्य फ़ील्ड शामिल होते हैं जिन्हें खोजा नहीं जाता है। यह पर्याप्त कारण है कि अंतर करना क्यों आवश्यक हैएक दृश्य और एक खोजने योग्य अनुक्रमणिका, जो दृश्य का खोज भाग है। यह सब कुछ परिभाषित करता है जिसे खोजा जाना चाहिए। खोज योग्य अनुक्रमणिका, जैसे दृश्य और स्रोत वस्तु, को अधिक सटीक, लक्षित खोज प्रदान करने के लिए अलग उप-अनुक्रमणिका में विभाजित किया जा सकता है

सर्च इंजन में आमतौर पर मान्य खोज परिणामों के मिलान के लिए आंतरिक रूप से एक सिंथेटिक संरचना होती है। यह संरचना खोजने योग्य अनुक्रमणिका का दूसरा घटक है।

प्रक्रियात्मक रूप से, अनुक्रमण प्रक्रिया को विभिन्न तरीकों से कार्यान्वित किया जा सकता है: एक खोज योग्य अनुक्रमणिका प्राप्त की जा सकती है:

  • सचमुच खोज योग्य प्रतिनिधित्व की नकल करना;
  • दृश्य विवरण की प्रतिलिपि बनाकर। यह उन विचारों का हिस्सा या सभी हो सकता है जो भौतिक रूप से केवल टुकड़ों के रूप में मौजूद हैं, खोज के लिए एक इंडेक्स बनाने के नियमों के अनुसार वितरित किए जाते हैं, जिन्हें आवश्यक होने पर एकत्र किया जाएगा।
खोज प्रबंधन
खोज प्रबंधन

अनुरोध डिजाइन नियम और औपचारिक अनुरोध

क्वेरी इंजीनियरिंग एक ऐसा फंक्शन है जो यूजर क्वेरी और औपचारिक क्वेरी के बीच मध्यस्थता करता है। यह उपयोगकर्ता की क्वेरी को बदल देता है, इसे पुनर्प्राप्ति कमांड डिक्शनरी, इंडेक्स विनिर्देश, और पुनर्प्राप्ति से पहले इंडेक्स से मेल खाता है। आईपीएस के विकास की शुरुआत में, यह भूमिका पारंपरिक रूप से योग्य आईटी विशेषज्ञों को सौंपी गई थी।

ऐसे कंप्यूटर प्रश्नों को विकसित करना जो डिक्शनरी क्वेरीज़ को खोज योग्य इंडेक्स सिस्टम में मिला सकते हैं, आमतौर पर "डिक्शनरी इनपुट" मॉड्यूल के रूप में जाना जाता है।इस फ़ंक्शन का स्वचालन आशाजनक है और विशेषज्ञ और संभाव्य खोज विधियों के लिए अवसर प्रदान करता है।

उपयोगकर्ता के अनुरोध को परिवर्तित करने के बाद औपचारिक अनुरोध औपचारिक अनुरोध बन जाता है। इस तरह के औपचारिक परिवर्तनों के उदाहरणों में कंप्यूटर आईपीएस (डिक्रिप्शन - सूचना पुनर्प्राप्ति प्रणाली) के "आंतरिक" प्रतिनिधित्व में "बाहरी" प्रतिनिधित्व के छंटनी, प्रतिस्थापन, सामान्यीकरण, वेक्टरकरण और अन्य परिवर्तन शामिल हैं।

निकाले गए दस्तावेज़ लिंक सेट

सूचना स्रोतों का परिणामी सेट तार्किक रूप से खोज योग्य अनुक्रमणिका द्वारा औपचारिक क्वेरी पर लागू मिलान नियमों द्वारा बनाए गए विचारों का एक सबसेट है।

आमतौर पर, लेकिन जरूरी नहीं कि सूचना के बरामद सेट के लिए एक अलग छँटाई प्रक्रिया है। ऑनलाइन लाइब्रेरी कैटलॉग आमतौर पर प्रदर्शित होने से पहले लेखक द्वारा वर्णानुक्रम में प्राप्त सेटों को पुन: व्यवस्थित करते हैं। सख्त रैंकिंग देने वाली सूचना पुनर्प्राप्ति प्रणालियों में, रैंकिंग क्रम किसी भी पुन: क्रम से पहले होता है।

डेटा विश्लेषण
डेटा विश्लेषण

आउटपुट स्ट्रीम

खोज परिणामों का आउटपुट पारंपरिक रूप से प्रदर्शन पर किया जाता है, अधिक बार वस्तुओं की एक धारा के रूप में कहीं और या किसी अन्य उद्देश्य के लिए उपयोग किया जाता है, मुख्य खोज लूप को पूरा करता है। ऐसी धाराओं को विज़ुअलाइज़ेशन उपकरणों पर भेजा जा सकता है, आगे की प्रक्रिया के लिए भंडारण, या अन्य चयन सेवाओं के लिए इनपुट स्ट्रीम के रूप में उपयोग करें।

सूचना पुनर्प्राप्ति प्रणाली से प्रतिक्रिया की अनुमति मिलती हैकिसी भी चयन प्रक्रिया का परिणाम। किसी भी प्रक्रिया का आउटपुट अन्य प्रक्रियाओं का फीडबैक हो सकता है। फीडबैक किसी भी स्तर पर विशेषज्ञ निर्णय के लिए आधार प्रदान कर सकता है।

सिफारिश की:

संपादकों की पसंद

MTZ-132: समीक्षा, फोटो, निर्देश

सखालिन-2 एलएनजी संयंत्र: निर्माण का इतिहास, व्यवसाय की रेखा

स्पंज आयरन: संपत्ति, प्राप्त करने के तरीके, आवेदन

मरम्मत करने वाले का नौकरी विवरण 5, 6 श्रेणी

एक इलेक्ट्रीशियन का नौकरी विवरण: कार्यात्मक कर्तव्य, अधिकार, जिम्मेदारी

ऋण एकाग्रता अनुपात। इष्टतम संतुलन संरचना

गाय की लाल स्टेपी नस्ल: विशेषताएं, तस्वीरें, प्रजनन विशेषताएं

कार्बन अमोनियम लवण: विवरण, संरचना, दायरा

कुचिंस्की की सालगिरह मुर्गियां। मांस मुर्गियां। मुर्गियों के अंडे की नस्लें

एडलर सिल्वर मुर्गियाँ। प्रजनन और रख-रखाव

घरों पर टैक्स। व्यक्तियों के लिए अचल संपत्ति कर की गणना

रिव्निया में कितने रूबल? सही मुद्रा बोली

रूबल को रिव्निया में कैसे बदलें? यूक्रेनी के लिए रूसी धन के आदान-प्रदान की विशेषताएं और इसके विपरीत

वीसा और मास्टरकार्ड में क्या अंतर है और क्या चुनना बेहतर है?

मुद्रा रूपांतरण - यह क्या है?