اجزای علم داده در یک قاب

در یک نگاه می‌توان پازل علم داده را به سه بخش هوش مصنوعی، کلان داده و داده‌کاوی تقسیم نمود. ساده‌انگارانه خواهد بود اگر در جستجوی مرز دقیقی بین این بخش‌ها باشیم و از اشتراک آن‌ها غفلت کنیم. لازم است پیش از ورود به این مبحث به این نکته توجه شود که مفاهیم این حوزه به‌طور پیچیده‌ای به یکدیگر گره خورده‌اند و اختلاف نظر زیادی در دسته‌بندی‌ها وجود دارد. از طرفی اگرچه تشریح مستقل مفاهیمی چون هوش مصنوعی، داده‌کاوی و یادگیری ماشین و ... تصویر روشنی در ذهن ایجاد می‌نماید اما بیش از آن باید به رابطه معناداری که در ترکیب این روش‌ها برای کسب نتایج دقیق‌تر شکل می‌گیرد توجه داشت

puzzle

ادامه مطلب

کشف دانش و داده‌کاوی

داده کاوی فرآیند کشف الگوهای موجود در مجموعه‌ی بزرگی از داده‌ها است. داده‌کاوی شامل تکنیک‌هایی است که فصل مشترک یادگیری ماشین، آمار و سیستم‌های پایگاه داده است. هدف اصلی در داده‌کاوی استخراج اطلاعات از داده‌ها و تبدیل آنها به ساختاری قابل فهم برای استفاده در آینده است.
فعالیت اصلی داده کاوی تحلیل نیمه خودکار یا خودکار حجم وسیعی از داده‌ها برای استخراج الگوهای ناشناخته و مورد نظر می-باشد. این الگوها شامل گروه‌های داده‌های گردآوری شده (تحلیل خوشه بندی)، کشف و شناسایی داده‌های پرت و وابستگی و قواعد انجمنی می‌باشد. باید به این نکته توجه داشت که هیچ یک از فعالیت‌های مربوط به جمع‌آوری داده‌ها، آماده سازی آنها، تفسیر نتایج و گزارش دهی بخش‌هایی از مراحل داده کاوی نمی‌باشند. بلکه متعلق به فرآیند "کشف دانش از پایگاه داده" هستند.

data mining

ادامه مطلب

پردازش زبان‌های طبیعی چیست؟

nlp 300x168

پردازش زبان‌های طبیعی زیرشاخه‌ای از هوش مصنوعی است که با توسعه و استفاده از مدل‌های رایانشی برای پردازش زبان سر و کار دارد. در این زمینه، دو حیطه اصلی پژوهش وجود دارد: ادراک، که با فرایندهایی سر و کار دارد که اطلاعات را از زبان استخراج می‌کنند (مانند درک زبان طبیعی، بازیابی اطلاعات) و تولید، که با فرایندهایی سر و کار دارد که با استفاده از زبان به انتقال اطلاعات می‌پردازند. معمولاً کارهای مرتبط با گفتار را تحت عناوین جداگانه تشخیص گفتار و تولید گفتار قرار می‌دهند.

ادامه مطلب

داده‌کاوی چیست؟

data1

امروزه در اكثر سازمان ها، داده‌ها به سرعت در حال جمع آوری و ذخیره شدن می باشند. اما استفاده از این داده ها در اغلب موارد کار راحتی نیست و نمی توان به صورت یکپارچه از این حجم داده ها استفاده نمود، از این رو با استفاده از ترکیب علم آمار و کامپیوتر و بکارگیری تکنیک های یادگیری ماشین، می توان از این داده ها به نحو مطلوب استفاده کرد. در واقع داده کاوی عبارت است از: "استخراج اطلاعات و دانش و كشف الگوهای پنهان از پایگاه داده‌های بسیار بزرگ"

ادامه مطلب

انبار داده چیست؟

data warehouse server

معمولاً در یک انباره داده حجم اطلاعات ده ها و یا صدها گیگابایت می باشد که متشکل از میلیاردها رکورد می‌شود، لذا استفاده از این داده‌ها برای تحلیل یک موضوع با تجارت با روش‌های مرسول دیتابیس و Query های معمولی عملاً غیر ممکن بوده و ممکن است اجرای یک Query ساده به ده‌ها ساعات زمان نیاز داشته باشد، لذا متخصصین در طراحی یک انباره داده باید آن را برای اجرای عملیات و دستورات on-line analytical processing یا OLAP بهینه کنند.

ادامه مطلب

کلان داده چیست؟

data warehouse server

معمولاً در یک انباره داده حجم اطلاعات ده ها و یا صدها گیگابایت می باشد که متشکل از میلیاردها رکورد می‌شود، لذا استفاده از این داده‌ها برای تحلیل یک موضوع با تجارت با روش‌های مرسول دیتابیس و Query های معمولی عملاً غیر ممکن بوده و ممکن است اجرای یک Query ساده به ده‌ها ساعات زمان نیاز داشته باشد، لذا متخصصین در طراحی یک انباره داده باید آن را برای اجرای عملیات و دستورات on-line analytical processing یا OLAP بهینه کنند.

ادامه مطلب

هوش تجاری چیست؟

data3

تغییرات سریع در محیط عملیات شرکت‌ها و سازمان‌ها، آنها را به سوی پشتیبانی رایانه‌ای از عملیاتشان سوق می دهد. بدین معنی که فشارهای خارجی منجر به ایجاد رویکرد پاسخ در سازمان‌ها می شود که با توجه به سرعت محیط، این پاسخ‌ها باید با سرعت همراه باشد؛ چرا که محیط بسیار رقابتی است و لذا برای دستیابی به پاسخ های سریع، لازم است سامانه های رایانه ای به کمک شرکت ها بیایند. سامانه های رایانه ای می توانند فرآیند پاسخ را تسهیل و تسریع نمایند.

ادامه مطلب