یک رویکرد در حال تکامل برای خوشه بندی جریان داده ها مبتنی بر مفهوم TEDA با استفاده از فاصله ماهالانوبیس
کد مقاله : 1030-AISCH2-FULL
نویسندگان
مهسا مرادی *، مرتضی یوسف صنعتی
گروه آموزشی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه بوعلی سینا، همدان، ایران
چکیده مقاله
چکیده:
AutoCloud یک الگوریتم آنلاین و تک مرحله‌ای بازگشتی برای خوشه بندی جریان داده ها بر مبنای فاصله اقلیدسی است. این الگوریتم بر اساس مفهوم تجزیه‌وتحلیل داده Typicality و Eccentricity است که عمدتاً برای کارهای تشخیص ناهنجاری استفاده می شود. همچنین AutoCloud قادر به مدیریت کردن مشکلات ذاتی در جریان داده ها مانند concept drift و concept evolution است. ولی با توجه به این که دقت انجام عمل در AutoCloud در مورد برخی از دیتاست ها خیلی مناسب نیست، به نظر می رسد که استفاده از انواع فاصله های دیگر، مناسب تر باشد؛ بنابراین در این مقاله سعی شده است با پیاده سازی فاصله ماهالانوبیسی برای این الگوریتم، چک شود که آیا استفاده از این فاصله می تواند منجر به بهبود الگوریتم شود یا خیر. نتایج نشان می دهد که اگر AutoCloud بر مبنای فاصله اقلیدسی باشد، در بیشتر موارد بهتر از فاصله ماهالانوبیسی عمل می کند. به همین دلیل استفاده از فاصله ماهالانوبیسی در AutoCloud خیلی مؤثر نیست. این پژوهش مشخص نمود که استفاده از فاصله ماهالانوبیسی در انجام AutoCloud، نمی تواند در تشخیص ناهنجاری ها کمک شایانی کند.
کلیدواژه ها
تشخیص ناهنجاری، جریان داده، خوشه بندی
وضعیت: پذیرفته شده برای ارائه شفاهی
login