• خانه
  • آکادمی
  • یادداشت‌ها

کشف دانش و داده‌کاوی

داده کاوی فرآیند کشف الگوهای موجود در مجموعه‌ی بزرگی از داده‌ها است. داده‌کاوی شامل تکنیک‌هایی است که فصل مشترک یادگیری ماشین، آمار و سیستم‌های پایگاه داده است. هدف اصلی در داده‌کاوی استخراج اطلاعات از داده‌ها و تبدیل آنها به ساختاری قابل فهم برای استفاده در آینده است.
فعالیت اصلی داده کاوی تحلیل نیمه خودکار یا خودکار حجم وسیعی از داده‌ها برای استخراج الگوهای ناشناخته و مورد نظر می-باشد. این الگوها شامل گروه‌های داده‌های گردآوری شده (تحلیل خوشه بندی)، کشف و شناسایی داده‌های پرت و وابستگی و قواعد انجمنی می‌باشد. باید به این نکته توجه داشت که هیچ یک از فعالیت‌های مربوط به جمع‌آوری داده‌ها، آماده سازی آنها، تفسیر نتایج و گزارش دهی بخش‌هایی از مراحل داده کاوی نمی‌باشند. بلکه متعلق به فرآیند "کشف دانش از پایگاه داده" هستند.

data mining

ادامه مطلب

پردازش زبان‌های طبیعی چیست؟

nlp 300x168

پردازش زبان‌های طبیعی زیرشاخه‌ای از هوش مصنوعی است که با توسعه و استفاده از مدل‌های رایانشی برای پردازش زبان سر و کار دارد. در این زمینه، دو حیطه اصلی پژوهش وجود دارد: ادراک، که با فرایندهایی سر و کار دارد که اطلاعات را از زبان استخراج می‌کنند (مانند درک زبان طبیعی، بازیابی اطلاعات) و تولید، که با فرایندهایی سر و کار دارد که با استفاده از زبان به انتقال اطلاعات می‌پردازند. معمولاً کارهای مرتبط با گفتار را تحت عناوین جداگانه تشخیص گفتار و تولید گفتار قرار می‌دهند.

ادامه مطلب

داده‌کاوی چیست؟

data1

امروزه در اكثر سازمان ها، داده‌ها به سرعت در حال جمع آوری و ذخیره شدن می باشند. اما استفاده از این داده ها در اغلب موارد کار راحتی نیست و نمی توان به صورت یکپارچه از این حجم داده ها استفاده نمود، از این رو با استفاده از ترکیب علم آمار و کامپیوتر و بکارگیری تکنیک های یادگیری ماشین، می توان از این داده ها به نحو مطلوب استفاده کرد. در واقع داده کاوی عبارت است از: "استخراج اطلاعات و دانش و كشف الگوهای پنهان از پایگاه داده‌های بسیار بزرگ"

ادامه مطلب

انبار داده چیست؟

data warehouse server

معمولاً در یک انباره داده حجم اطلاعات ده ها و یا صدها گیگابایت می باشد که متشکل از میلیاردها رکورد می‌شود، لذا استفاده از این داده‌ها برای تحلیل یک موضوع با تجارت با روش‌های مرسول دیتابیس و Query های معمولی عملاً غیر ممکن بوده و ممکن است اجرای یک Query ساده به ده‌ها ساعات زمان نیاز داشته باشد، لذا متخصصین در طراحی یک انباره داده باید آن را برای اجرای عملیات و دستورات on-line analytical processing یا OLAP بهینه کنند.

ادامه مطلب

کلان داده چیست؟

data warehouse server

معمولاً در یک انباره داده حجم اطلاعات ده ها و یا صدها گیگابایت می باشد که متشکل از میلیاردها رکورد می‌شود، لذا استفاده از این داده‌ها برای تحلیل یک موضوع با تجارت با روش‌های مرسول دیتابیس و Query های معمولی عملاً غیر ممکن بوده و ممکن است اجرای یک Query ساده به ده‌ها ساعات زمان نیاز داشته باشد، لذا متخصصین در طراحی یک انباره داده باید آن را برای اجرای عملیات و دستورات on-line analytical processing یا OLAP بهینه کنند.

ادامه مطلب

هوش تجاری چیست؟

data3

تغییرات سریع در محیط عملیات شرکت‌ها و سازمان‌ها، آنها را به سوی پشتیبانی رایانه‌ای از عملیاتشان سوق می دهد. بدین معنی که فشارهای خارجی منجر به ایجاد رویکرد پاسخ در سازمان‌ها می شود که با توجه به سرعت محیط، این پاسخ‌ها باید با سرعت همراه باشد؛ چرا که محیط بسیار رقابتی است و لذا برای دستیابی به پاسخ های سریع، لازم است سامانه های رایانه ای به کمک شرکت ها بیایند. سامانه های رایانه ای می توانند فرآیند پاسخ را تسهیل و تسریع نمایند.

ادامه مطلب