پایان نامه ارشد کامپیوتر با موضوع استخراج اتوماتیک اطلاعات بر اساس آنتالورژی

استخراج اتوماتیک اطلاعات

پایان نامه استخراج استخراج اتوماتیک بر اساس آنتالوژی توسط مهدی طالبیان کوچکسرایی و به راهنمایی دکتر فریدون شمس و مشاوره دکتر مهرنوش شمس فرد برای دریافت درجه کارشناسی ارشد مهندسی کامپیوتر گرایش نرم افزار از دانشگاه آزاد اسلامی واحد علوم تحقیقات تهران در سال ۱۳۸۶ تهیه شده است.

چکیده
لازمه توسعه و گسترش وب معنایی ، ازدیاد هر چه بیشتر آنتالوژی ها می باشد . آنتالوژی ها با ایجاد فهم مشترک از مفاهیم موجود در دامنه دانش ، امکان همکاری و تبادل اطلاعات بین ماشین ها را بوجود می آورند . اما ایجاد دستی آنتالوژی ها سخت و طاقت فرسا بوده و احتمال بروز خطای انسانی نیز بسیار زیاد می باشد . از این رو ، استخراج اطلاعات از منابع وب بصورت نیمه اتوماتیک و یا تمام اتوماتیک مورد توجه بسیاری از محققان قرار گرفته است. اولین ایده در استخراج اطلاعات، تهیه برنامه ای بنام Wrapper است که اطلاعات موجود در صفحات وب را در یک قالب ساخت یافته، استخراج می کند . ابزار های متنوعی جهت تولید Wrapper ها بصورت دستی، نیمه اتوماتیک و اتوماتیک مورد پژوهش قرار گرفته اند. برخی از این ابزار ها ابتدا قواعد استخراج را آماده کرده و در هنگام استخراج اطلاعات با آگاهی از محل داده ها، به سرعت اطلاعات مورد نیاز را استخراج می نمایند . برخی دیگر نیز با استفاده از آنتالوژی استخراج، داده های موجود در صفحه وب را پردازش کرده و مفهوم مرتبط با هر مقدار متنی را از آنتالوژی دامنه یافته و در نهایت با توجه به الگوهای موجود، اطلاعات را استخراج می نمایند.
در این تحقیق، روش پیشنهادی ما که منجر به تولید یک سیستم نرم افزاری نیز خواهد شد، توصیف Wrapper با استفاده از زبان نشان گذاری WDML می باشد . این زبان با ترکیب مکانیزم های استخراج مبتنی بر مکان و مبتنی بر آنتالوژی، از مزایای هر دو روش بهره می برد . قواعد استخراج توصیف شده در فایل های WDML بصورت درختی تعریف شده و به آن الگوی استخراج گفته می شود از این رو نسبت به سایر روش ها دارای انعطاف پذیری بسیار بالایی می باشد . همچنین در این تحقیق روشی را جهت تولید اتوماتیک فایل های WDML با استفاده از یک آنتالوژی استخراج ارائه خواهیم کرد.

کلمات کلیدی: وب معنایی، آنتالوژی، استخراج اتوماتیک اطلاعات، Wrapper ،WDML

فهرست مطالب پایان نامه استخراج اتوماتیک اطلاعات بر اساس آنتالورژی

۱- مقدمه
۲- مفاهیم و کلیات
۳- بررسی سوابق مرتبط با تحقیق
۴- معرفی سیستم ONTOBYONTO
۵- تولید اتوماتیک فایل های WDML
۶- ارزیابی و جمع بندی مطالب
۷- منابع
۸- ضمائم

دانلود پایان نامه استخراج اتوماتیک اطلاعات بر اساس آنتالورژی

مقالات، مطالب، طرح ها و پروژه های خود را برای قرارگیری در سایت علمی آموزشی نواندیشان از اینجا بفرستید.

درباره نویسنده

انجمن نوانديشان ، یک انجمن علمی، غیردولتی و مستقل است که در حوزه های علمی و تخصصی مختلف، فعالیت خود را از شهریور 1388 شروع کرد. این انجمن در راستای نیل به کمک در بهبود وضعيت علمي و پژوهشي و تحقيقاتي کشور ایجاد شده است و به دنبال فراهم کردن بستر ارتباطی مناسب میان متخصصین ایرانی جهت آشنایی با همدیگر و گسترش همکاریها و راه هاي رسيدن از علم به عمل است.

مطالب مرتبط

نظر بدهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *