رفتن به مطلب

بازیابی اطلاعات با رویکرد فازی


ارسال های توصیه شده

گذری اجمالی بر بازیابی اطلاعات مبتنی بر مدل فازی

 

مقدمه :

انسان همواره برای ارتباط با محیط و سایرین اطلاعاتی را رد و بدل می کند و بر اساس این اطلاعات دریافت شده و پردازش آن نسبت به اخذ تصمیم خود اقدام می کند . در قرون گذشته اساس منطق انسان بر دو رکن بودن و نبودن استوار بود که به منطق ارسطویی ، دودویی یا دوارزشی معروف است. به عنوان مثال در این منطق در خصوص تناقض بین دو رنگ ، آن یا سیاه است یا سفید و حالت بینابین وجود ندارد . این منطق اساس ریاضیات کلاسیک را تشکیل می دهد و بر همین اساس قواعدی ثابت پی ریزی شده و بعنوان سنگ محک سنجش درستی یا نادرستی پدیده های اطراف استفاده می شد . به عبارتی می توان گفت منطق ارسطویی منطقی دو ارزشی است که در آن گزاره یا درست است یا غلط ، اگر گزاره های صحیح را با 1 و گزاره های نادرست را با 0 نشان دهیم در این صورت ارزش پدیده ها یا صفر هستند و یا یک و حالت بین این دو عدد وجود نخواهد داشت .

با گذشت زمان و گسترش اندیشه بشریت ، این باور کمرنگ تر شده و انسان بر این واقعیت که حالتی بین درست و غلط نیز وجود داشته و بخش عمده ای از جهان را تشکیل می دهد پی برد ، لذا بدین ترتیب ابراز کرد که ابهام در ماهیت واقعیت پدیده های طبیعی است چرا که بین رنگ سیاه و سفید ، رنگ خاکستری با شدت و حدت مختلف وجود دارد . به عنوان مثال اگر رنگ سیاه را صفر و رنگ سفید را یک در نظر بگیریم رنگ خاکستری عددی نزدیک به صفر خواهد بود . از نظر علمی برای شفاف سازی این پدیده از آن به عنوان پدیده های فازی یاد می شود .

" فازی " در لغت به معانی زیر آمده است : نامعلوم ، گنگ و نا مفهوم ، نا آشکار و .. ، در علم نیز ، ریاضیات فازی یك فرا مجموعه از منطق بولی است كه بر مفهوم درستی نسبی، دلالت می‌كند.

در پی این اندیشه ها و تلاش برای سیستماتیک کردن پدیده فازی ، اولین بار پروفسور لطف علی عسگر زاده که در جامعه علمی جهانی به نام لطفی زاده معروف است ، "سیستم های فازی " را مطرح کرده و با استقبال جوامع علمی جهانی مواجه شد هر چند نظرات مخالفی نیز در این خصوص از سوی برخی علما مطرح شد. پروفسور لطفی زاده معتقد بود که ابهام در ماهیت علم است ؛ وی معتقد بود به جای دقیق تر کردن تقریب ها جهت دستیابی به بهروه وری بالا بایستی ابهام را به عنوان پدیده ای مداخله گر در بخشی از مدل سیستم طراحی کرد.

 

ماهیت منطق فازی :

مهمترین و جامع ترین تعریفی که از منطق فازی شده این است که تئوری یا منطق فازی روش های نتیجه گیری توسط مغز بشر را جایگزین می کند . به عنوان مثال احساس داغ بودن یا سرد بودن آب توسط انسان نیازی به دانستن دمای دقیق آب ندارد بلکه مغز انسان بر اساس پردازش های درونی و دریافت حرارت و دمای آب از طریق حسگرهای عصبی پوست ، پردازش لازم در خصوص تنظیم دمای آب توسط انسان را انجام می دهد ، چه بسا این دما ( تعریف میزان داغ بودن ) در افراد مختلف متفاوت بوده و قطعیت نداشته باشد . لذا پروفسور لطفی زاده این ماهیت را چنین بیان می کند که انسان به دریافت مدخل های دقیق نیاز ندارد بلکه حتی با دریافت اطلاعاتی مبهم می تواند با قدرت تطبیقی بالا به پردازش اطلاعات بپردازد ، پس اگر بتوان بازخورد ( فیدبک ) را در سیستم ها طوری طراحی کرد که با دریافت اطلاعات مبهم نیز بتواند عمل پردازش مؤثر اطلاعات را انجام دهد موجب افزایش بهره وری خواهد شد ، این پدیده به صورت منطق فازی می تواند به شکل زیر تعریف شود :

IF x and y Then z.

در مثالی دیگر می توان تشخیص شباهت چهره دو فرد را ذکر کرد ، که یک فرد با مقایسه ذهنی شاخصه های مشترک بین دو فرد به میزان شباهت آن دو پی می برد حال آنکه ممکن است ملاک های سنجش و ترتیب آن ها در ذهن افراد مختلف متفاوت باشد اما در نهایت به یک نتیجه منجر خواهد شد و آن شباهت یا عدم شباهت دو فرد به یکدیگر است .

در حقیقت همه این تلاش ها در جهت فرموله کردن پدیده های دارای ابهام است . برای انجام این کار لازم بود تا با استفاده از متد و ابزارهای زبان شناختی رویکردی بیانی به پدیده ها اطلاق می شد و با استفاده از آن وارد سیستم فازی شده و تحلیل ها انجام می گرفت . پروفسور لطفی زاده با ارائه سیستم های فازی به این روش دست یافت . بدین ترتیب که ابتدا اطلاعات مبهم و فازی وارد سیستم شده و در آن جا به صورت پارامترهای فازی مجرا تفکیک شده ، تحلیل انجام شده و نتیجه به صورت یک شاکله و مدل فازی منسجم دارای معنی ارائه می شود .

 

کاربردهای منطق فازی در موارد مختلف :

منطق فازی در صنایع و علوم بسیاری کاربرد دارد از آن جمله صنایع لوازم خانگی مانند یخچال ، لباسشویی ، ایرکاندیشن های اتوماتیک و نیز مدیریت اطلاعات است.

بیشترین و بارزترین کاربرد منطق فازی برای ساخت كنترل كننده‌های لوازم خانگی از قبیل ماشین رختشویی (برای تشخیص حداكثر ظرفیت ماشین، مقدار مواد شوینده، تنظیم چرخ‌های شوینده) و یخچال استفاده شده است . به بیان دیگر كاربرد اساسی آن ، تشخیص حوزه متغیرهای پیوسته است. برای مثال یك وسیله اندازه‌گیری دما برای جلوگیری از قفل شدن یك عایق ممكن است چندین عضو مجزای تابعی داشته باشد تا بتواند حوزه دماهایی را كه نیاز به كنترل دارد به طور صحیح تعریف نماید. هر تابع، یك ارزش دمایی مشابه كه حوزه آن بین صفر و یك است را اختیار می‌كند. از این ارزش‌های داده شده برای تعیین چگونگی كنترل یك عایق استفاده می‌شود. مثلا سرد بودن، گرم بودن و داغ بودن، توابعی برای مقایسه درجه حرارت هستند و هر نقطه‌ای روی این خطوط می‌تواند دارای یكی از سه ارزش بالا باشد. به عنوان مثال برای یك درجه حرارت خاص كه در شكل با یك خط نشان داده شده است، می‌توان گفت: «مقداری سرد است»، «اندكی گرم است»یا «اصلا داغ نیست» .

حال با مثال دیگری اهمیت این علم را بیشتر درك می‌نماییم: یك انسان در نور كافی قادر به درك میلیون‌ها رنگ می‌باشد. ولی یك روبوت چگونه می‌تواند این تعداد رنگ را تشخیص دهد؟

حال اگر بخواهیم روباتی طراحی كنیم كه قادر به تشخیص رنگها باشد از منطق فازی كمك می‌گیریم و با اختصاص اعدادی به هر رنگ آن را برای روبوت طراحی شده تعریف می‌كنیم.

 

بازیابی اطلاعات :

با افزایش روزافزون اطلاعات و حجم داده های ذخیره شده در محامل مختلف اطلاعاتی و منابع گوناگون فرایند بازیابی و استخراج اطلاعات مورد نیاز از اهمیت ویژه ای برخوردار شده است . آنچه در بازیابی اطلاعات مهم و حیاتی است میزان صحت اطلاعات یافته شده منطبق با نیاز اطلاعاتی مورد جستجو است . به همین منظور ، نخستین گام در جهت طراحی سیستم های بازیابی اطلاعات تعریف مدلی جهت توصیف ، تعین میزان مشابهت بین اطلاعات موجود و سوال مطرح شده از سوی فرد یا پدیده است .

در پست بعدی کاربرد مدل فازی در بازیابی اطلاعات توضیح داده می شود.

لینک به دیدگاه

کاربرد مدل فازی در بازیابی اطلاعات و نحوه کار آن :

نزدیک به 12 سال است که مدل فازی وارد علوم کتابداری و اطلاع رسانی شده و از آن زمان تاکنون مقالات و پژوهش های بسیاری در این زمینه نگارش و انجام یافته است . با توجه به رکوردهای به ثبت رسیده در lisa ، عمده ترین بحث ها و کاربردهای مدل فازی در علوم اطلاع رسانی مربوط به بحث بازیابی اطلاعات می باشد . ( مکتبی فرد ، 1386 )

در جریان جستجو و بازیابی اطلاعات از یک بانک اطلاعاتی ، رکوردهایی بازیابی می شوند که نمی توان آن ها را به طور قطع مرتبط و یا نا مرتبط با مورد جستجو تلقی کرد ، بدین ترتیب دو مبحث ربط و منطق فازی در تعامل و مکمل یکدیگر در امر بازیابی هستند و می توان گفت مفهوم ربط نیز فازی است چرا که قطعیت و عدم قطعیت مطلق در آن وجود ندارد . مثال دیگر از ارتباط منطق فازی با سازماندهی اطلاعات در علم کتابداری ، نمایه سازی کتابهاست که در زیر به توضیح اجمالی آن در قالب دو منطق کلاسیک و فازی می پردازیم .

 

بازیابی اطلاعات در منطق کلاسیک :

1- ایندکس کردن کتاب ها واطلاعات بگونه ای که کلمات کلیدی آن موضوع استخراج شود .

2- قرار دادن موضوعات به هم وابسته در یک پایگاه داده به گونه ای که اگر در مورد یک موضوع سوالی مطرح شود سایر موضوعات وابسته در پاسخ بیاید .

3- زمانی که در پایگاه داده به دنبال یک موضوع مشخص می گردیم عملاً به دنبال عضویت متن مورد نظر خود در یک مجموعه تعیین شده می گردیم که با منطق کلاسیک فقط می توان پاسخ 1 به آن به معنی عضو بودن در مجموعه و یا صفر به معنی عدم عضویت در مجموعه را داد.

 

مثال: فرض کنید می خواهیم «آلاینده های طبیعت» را که در یک کتاب یا یک منبع اطلاعاتی دیگر به آن اشاره شده وارد پایگاه داده کنیم .در این صورت می توان با قرار دادن مجموعه زیر در پایگاه داده به جواب مورد نظر رسید:

 

{زباله اتمی، گازوییل، گاز،بنزین، نفت، آلاینده های طبیعت }

{وایتکس ، آب ، صابون، ریکا، شوما، ضد آلاینده}

{کوه، درخت، آب، خاک، هوا، طبیعت}

( جدول 1)

آلاینده های طبیعت:{زباله اتمی، گازوییل، گاز،بنزین، نفت، آلاینده های طبیعت }

ضد آلاینده: {وایتکس ، آب ، صابون، ریکا، شوما، ضد آلاینده}

طبیعت : {کوه، درخت، آب، خاک، هوا، طبیعت}

 

در جدول 1 از جدول پایگاه داده ، اگر با کلمه آلاینده های طبیعت جستجو شود همه عناوین ذکر شده ظاهر خواهد شد ودر غیر اینصورت هیچ نتیجه ای در بر نخواهد داشت .

اگر با واژه هایی همچون آلودگی یا آلودگی طبیعت یا آلایش طبیعت یا آلایش جستجو انجام شود چون چنین واژه ای عضو مجموعه بیان شده در پایگاه داده نیست به همین دلیل این جستجو نتیجه ای را برای بازیابی در بر ندارد زیرا تابع عضویت آن ، مقدار 0 را دارد. پس بدین ترتیب بهتر است موضوعات بر اساس اهمیت و ارتباط موضوع با کلمات جستجو شده ظاهر شوند یعنی همان چیزی که در موتورهای جستجویی همچون گوگل دیده می شود.

در پست بعد بازیابی اطلاعات در منطق فازی گفته خواهد شد.

لینک به دیدگاه

بازیابی اطلاعات در منطق فازی :

- ایندکس کردن کتاب ها واطلاعات به گونه ای که کلمات کلیدی آن موضوع استخراج شود.

- قرار دادن موضوعات به هم وابسته در یک پایگاه داده به گونه ای که اگر در مورد یک موضوع سوالی مطرح شود سایر موضوعات وابسته در پاسخ بیاید.

- زمانی که در پایگاه داده به دنبال یک موضوع مشخص می گردیم عملا به دنبال عضویت متن مورد نظر خود در یک مجموعه تعیین شده هستیم که با منطق فازی می توان پاسخ 0.1,0.25,0.5,0.6,1 به آن به معنی عضو بودن کامل و یا نسبی در مجموعه و یا صفر به معنی عدم عضویت در مجموعه را داد.

اگر با واژه هایی همچون آلودگی یا آلودگی طبیعت یا آلایش طبیعت یا آلایش جستجو انجام شود چون چنین واژه ای با یک احتمال و تابع عضویت مشخص عضو مجموعه بیان شده در پایگاه داده است به همین دلیل این جستجو نتیجه داشته وفقط در صورتی پاسخ وجود نخواهد داشت که هیچ ترکیبی از آلودن و طبیعت در جستجودر نظر گرفته نشده باشد.

در سیستم های بازیابی اطلاعاتی سنتی و بر پایه مدل های کلاسیک ، منطق غالب ، جبر بولی بوده است که معمولاً بیش از 90% کاربرانی که از سیستم های بازیابی اطلاعات استفاده کرده اند بدون شک از عملگرهای معروف بولی یعنی and ، or و یا not و گاه ترکیبی از این عملگرها بهره جسته اند که به هنگام جستجو و بر اساس تعاریف مشخص شده توسط عملگرهای مذکور ، اطلاعات بازیابی می شود .

در مدل فازی ، وقتی اطلاعات یا مدرکی به سیستم افزوده می شود ، مجموعه ای از اصطلاحات به این مدرک نسبت داده می شود و به هنگام جستجو ، براساس وزنی که به هر اصطلاح داده می شود درجه وابستگی آن اصطلاح نسبت به مدرک سنجیده می شود محاسبه وزن اصطلاح بدین ترتیب است که از طریق تابع عضویت یک عنصر در یک مجموعه به میزان درجه عضویت آن پی برده می شود که به آن « معیار دقت » گفته می شود . نحوه محاسبه معیار دقت را چنین می توان بیان داشت :

تعداد مستندات بازیابی شده کاملاً مرتبط

 

کل مستندات بازیابی شده

 

= معیار دقت ( جامعیت )

 

تعداد مستندات بازیابی شده کاملاً مرتبط

 

کل مستندات مرتبط موجود در مجموعه

 

= معیار بازخوانی ( مانعیت )

 

 

مجموعه ای از عناصر که در آن ، هر عنصری محدوده مدرک را توصیف می کند ذاتاً مجموعه فازی است . به بیان دیگر عمليات اصلي اشتراك، اجتماع، و متمم كه اساس منطق بولي را تشكيل مي دهد، در مجموعه­هاي فازي به اين صورت بيان شده است: اشتراك از حداقل دو تابع عضويت و اجتماع از حداكثر دو تابع عضويت كه براي يك عنصر تعريف شده است، استفاده مي­كند.

مدرکی که درباره کتاب های کودک و نوجوان است ممکن است راجع به روانشناسی کودک و نوجوان نیز سخن گفته باشد ، حال قرار دادن روانشناسی کودک به عنوان عنصری از مجموعه درست نیست اما نادیده انگاشتن آن ممکن است موجب فاصله گرفتن از دقت لازم شود به عبارت دیگر یک عنصر عضوی از مجموعه به حساب نمی آید بلکه تابعی است از آن مجموعه.

تابع عضویت در منطق فازی :

به صورت قرار دادی می توان پدیده C را با حفظ مشخصه های آن به عنوان عضوی از مجموعه به صورت C(x) نشان دهیم . اگر U یک مجموعه بزرگ تر دارای خصیصه C باشد می توانیم آن را به صورت زیر بیان کنیم :

C = {x | x Î U and , C(x) = 1}

این حالت نمایانگر وضعیتی از مجموعه C در حالت معمول و غیر مبهم ( کلاسیک ) است . عملکرد شاخصه آن را می توان به شکل زیر نشان داد :

C(x): U à {0, 1}

حال آنکه در مجموعه فازی ، همین پدیده را به شکل زیر نشان خواهیم داد :

F(x): U à [0, 1]

بدین معنی که در مجموعه های فازی ، عملکرد تمام اعداد پیوسته در دامنه بین صفر و یک اِعمال و مد نظر گرفته می شود ولی در مجموعه های غیر فازی فقط ارزش نا پیوسته صفر و یا یک پذیرفته است. شاخصه های مجموعه فازی را که معمولاً تابع عضویت نامیده می شود به شکل m F(x) نشان می دهند .

دو حالت فازی و غیر فازی فوق را با مثالی بررسی می کنیم :

در تعاریف عرفی به افرادی با قد 200 سانتی متر بلند قد و به افرادی با قد 150 سانتی متر کوتاه قد می گوییم . در حقیقت بیان این مطلب در منطق دو ارزشی ارسطویی ، دادن ارزش صفر یا یک به یک خصیصه است. یعنی افراد یا بلند قد هستند که به آن عدد 1 را اطلاق می کنیم و یا کوتاه قد هستند که به آن عدد صفر را اطلاق می کنیم .

بدیهی است در اینگونه محاسبه ، رده های عمده ای بین این دو عدد نادیده و بدون تعریف انگاشته می شوند . با استفاده از منطق فازی تعریف کامل تر بدینگونه بیان می شود که اگر فرض کنیم S مجموعه ی تمام مردم جهان باشد ، درجه ای از عضویت در تابع قد به هر عضو تخصیص داده می شود تا بتوان به زیر مجموعه منطقی در خصوص بلندی قد دست یابیم و به بیان ریاضی به شکل زیر نشان داده می شود :

x عضو مجموعه S است .

اگر ارتفاع (x) > 150 سانتی متر باشد شاخص قد (x) = 0 ( کوتاه )

اگر 200

اگر ارتفاع (x)

که در شکل نموداری میزان درجه عضویت هر عضو را می توان به حالت زیر نشان داد : (شکل1)

 

مزایای مدل سازی فازی :

- توانایی مدل سازی مشکلات بغرنج در عرصه تجارت

- توانایی مدل سازی سیستم های خبره چندگانه با تضمین امنیت حفظ اطلاعات

- کاهش پیچیدگی مدل سیستم

- بهبود درک موقعیت های عدم اطمینان و امکان های سیستم .

مدل فازی در بازیابی اطلاعات :

یک مدل فازی نیز ، همانند سیستم های خبره یا پشتیبانی تصمیم سنتی ، از روند مفهومی ورودی ، پردازش و خروجی پیروی می کند .

مدل فازی دو وجه تفاوت عمده دارد : نوع فرایند ورودی ، پردازش و خروجی ، و کنش دگردیسی بنیادی نمایان شده در فرایند پردازش.

 

نتیجه :

رشد چشمگیر و سریع تکنولوژی ها بر همه ما آشکار و انکار ناشدنی است و چاره ای جز همسانی وهماهنگ شدن با این پیشرفت ها نیست . در این میان منطق فازی می تواند به عنوان ابزاری قدرتمند جهت مدیریت و کنترل این رشد استفاده شود که لازمه آن ترکیب منطق فوق با روش شناسی تحلیلی و تکنیک های استدلال با زبان ماشین است تا بتوان مسائل پیچیده را تجزیه ، فازی سازی و طراحی مدلی جدید بر پایه مدل فازی بر آن احاطه داشته و در جهت بهبود مستمر پدیده ها بهره جسته شود .

نمود مدل فازی در بازیابی اطلاعات را می توان در موتورهای جستجوی مختلف از قبیل گوگل مشاهده کرد. بدین ترتیب که ربات نرم افزاری جستجو گر در پایگاه های ایندکس شده در وب جهان گستر در مکان های خاص به مقایسه کلیده واژه های وارد شده توسط کاربر پرداخته و بر اساس تخمین وزن اصطلاحات آن ها را به صورت نزولی مرتب کرده و به نمایش در می آورد که اولین رکورد به نمایش در آمده نزدیک ترین و مرتبط ترین رکورد به خواسته کاربر است . در همین راستا نیاز به استانداردسازی پایگاه های اطلاعاتی بیش از پیش احساس می گردد، چرا که موتورهای جستجو اولویت های مکانی برای یافتن کلید واژه ها دارند که با استاندارد سازی و یکسان کردن نمایه سازی در وب ، اطلاعات کمتری از دید کاربران پنهان و بدون استفاده باقی می ماند .

 

منابع :

1) کلارک ، استیو (1382) . مدیریت استراتژیک سیستم های اطلاعاتی.تهران : دفتر پژوهشهای فرهنگی

2) مکتبی فرد ، لیلا . ”مديريت اطلاعات با رويكرد فازي“ . كتابداري و اطلاع رساني ، 42: شماره دوم، جلد 11.

3) جنتی ، روژین . ”بازیابی اطلاعات در مدل منطق فازی“. قابل دسترس در :

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

4) ”ذخیره‌سازی و بازیابی اطلاعات“ . قابل دسترس در :

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

5) "Fuzzy Logic" Available: http://

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

6) "Information Retrieval". Available:

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

لینک به دیدگاه

به گفتگو بپیوندید

هم اکنون می توانید مطلب خود را ارسال نمایید و بعداً ثبت نام کنید. اگر حساب کاربری دارید، برای ارسال با حساب کاربری خود اکنون وارد شوید .

مهمان
ارسال پاسخ به این موضوع ...

×   شما در حال چسباندن محتوایی با قالب بندی هستید.   حذف قالب بندی

  تنها استفاده از 75 اموجی مجاز می باشد.

×   لینک شما به صورت اتوماتیک جای گذاری شد.   نمایش به صورت لینک

×   محتوای قبلی شما بازگردانی شد.   پاک کردن محتوای ویرایشگر

×   شما مستقیما نمی توانید تصویر خود را قرار دهید. یا آن را اینجا بارگذاری کنید یا از یک URL قرار دهید.

×
×
  • اضافه کردن...