امروز: پنجشنبه 3 خرداد 1397
دسته بندی محصولات
بخش همکاران
بلوک کد اختصاصی

تشخیص¬های تقریباً تکراری در پایگاه¬های داده متنی (دیتابیس) کوتاه در مقیاس بزرگ

تشخیص¬های تقریباً تکراری در پایگاه¬های داده متنی (دیتابیس) کوتاه در مقیاس بزرگ دسته: کامپیوتر
بازدید: 1 بار
فرمت فایل: rar
حجم فایل: 277 کیلوبایت
تعداد صفحات فایل: 9

تکرارهای تقریبی در پایگاه¬های داده متن کوتاه فراوان هستند تشخیص و حذف آنها از اهمیت زیادی برخوردار است SimFinder پیشنهادی در این مقاله یک الگوریتم سریع برای شناسایی تمام تکرارهای تقریبی در مقیاس بزرگ پایگاه داده¬های متن کوتاه می¬باشد طرح وزنی اصطلاح ad hoc برای ارزیابی توانایی متمایز کننده هر عبارت بکار گرفته می¬شود تعداد معینی از اصطلاحات با وزن¬

قیمت فایل فقط 7,000 تومان

خرید

پیشرفت­های  سریع تکنولوژی در اینترنت و مخابرات موجب انفجار اطلاعات دیجیتالی شده­اند. بخش بزرگی از چنین داده­هایی، متن­های کوتاه مانند پیام­های کوتاه تلفن همراه و پیام­های فوری هستند. گزارش شده است که بیش از 58/1 میلیارد پیام­های کوتاه تلفن همراه هر روز در سرزمین اصلی چین ارسال می­شوند [1]. Tencent QQ بیش از 430 میلیون کاربر را به خود جذب کرده­است، و میلیاردها پیام فوری در هر روز ارسال می­شوند [2].

تکرارها در پایگاه داده­های متن کوتاه فراوان هستند. در تحقیق ما، بیش از % 40 پیام­های کوتاه تلفن همراه دارای حداقل یک تکرار یکسان هستند، و حتی بخش بیشتری از آنها تقریباً تکراری هستند. تشخیص و حذف این پیام­های کوتاه تکراری برای پردازش دیگر زبان­های متن کوتاه، مانند خوشه­بندی، تفکر عقلانی، تشخیص موضوع و رویارویی، کشف جامعه از اهمیت زیادی برخوردار است. 

قیمت فایل فقط 7,000 تومان

خرید

برچسب ها : تشخیص¬های تقریباً تکراری در پایگاه¬های داده متنی (دیتابیس) کوتاه در مقیاس بزرگ , تشخیص تکراری، , متن کوتاه، , اصطلاح وزنی , بهینه سازی , simfinder

نظرات کاربران در مورد این کالا
تا کنون هیچ نظری درباره این کالا ثبت نگردیده است.
ارسال نظر