ماشین لرنینگ چیست؟
یادگیری ماشین یا ماشین لرنینگ (به اختصار ML) به عنوان یک سرویس علمی تعریف میشود که به کامپیوترها و ماشینها اجازه میدهد بدون برنامهریزی صریح، آموزش ببینند و یاد بگیرند. یادگیری ماشین یکی از هیجانانگیزترین فناوریها در مقایسه با سایر تکنولوژیهای موجود است. همانطور که از نام آن پیداست، این توانایی یادگیری ماشین است که به کامپیوتر این امکان را میدهد که مانند انسان عمل کند. امروز، یادگیری ماشین به طور گستردهای مورد استفاده قرار می گیرد.
یادگیری ماشین، مشابه نحوه کسب دانش و درک مغز انسان، به ورودیهایی مانند دادههای آموزشی و نمودارهای دانش برای درک دامنهها، موجودیتها و ارتباطات آنها متکی است. فرآیند یادگیری ماشین با مشاهدات یا دادههایی مانند نمونهها، تجربیات دست اول و دستورالعملها آغاز میشود. ماشین به دنبال الگوهایی در دادهها میگردد تا بعداً بر اساس نمونه ارائه شده استنتاج کند. هدف اصلی ماشین لرنینگ این است که کامپیوترها را قادر سازد تا به طور مستقل یاد بگیرند و کارهای خود را بر اساس آن و بدون دخالت یا کمک انسانی تطبیق دهند.
ماشین لرنینگ با استفاده از الگوریتمها برای شناسایی الگوها و یادگیری در یک فرآیند تکراری، اطلاعات مفیدی را از حجم زیادی از دادهها به دست می آورد. الگوریتم های ماشین لرنینگ از روشهای محاسباتی برای یادگیری مستقیم از دادهها به جای تکیه بر هر معادله از پیش تعیینشدهای استفاده میکنند که ممکن است به عنوان یک مدل باشد.
عملکرد الگوریتم های ماشین لرنینگ به طور تطبیقی با افزایش تعداد نمونههای موجود در طول فرآیندهای “یادگیری” بهبود مییابد. برای مثال، یادگیری عمیق (Deep Learning) زیرمجموعهای از یادگیری ماشین است که کامپیوترها را برای تقلید از ویژگیهای طبیعی انسان مانند یادگیری از مثالها آموزش میدهد. در واقع یادگیری عمیق پارامترهای عملکرد بهتری را نسبت به الگوریتم های ماشین لرنینگ معمولی ارائه میدهد.
اگرچه در زمان تعریف این که ماشین لرنینگ چیست باید این نکته را به یاد داشته باشیم که یادگیری ماشین، مفهوم جدیدی نیست و قدمت آن به جنگ جهانی دوم برمیگردد – یعنی زمانی که ماشین انیگما (Enigma Machine) مورد استفاده قرار گرفت – توانایی اعمال محاسبات پیچیده ریاضی به طور خودکار برای حجم و انواع دادههای موجود در حال رشد، پیشرفت نسبتاً جدیدی است.
امروزه با ظهور کلان دادهها، اینترنت اشیا و محاسبات فراگیر، یادگیری ماشین برای حل مشکلات در بسیاری از زمینهها از جمله موارد زیر ضروری شده است:
- صنعت مالی محاسباتی (امتیاز اعتبار، تجارت الگوریتمی)
- بینایی کامپیوتر (تشخیص چهره، احراز هویت، ردیابی حرکت، امضای الکترونیکی، تشخیص اشیا)
- زیست شناسی محاسباتی (توالی یابی DNA، تشخیص تومور مغزی، کشف دارو)
- خودرو، هوافضا و تولید (تعمیر و نگهداری پیش بینی شده)
- پردازش زبان طبیعی (تشخیص صدا)
ماشین لرنینگ چگونه کار میکند؟
الگوریتم های ماشین لرنینگ روی یک مجموعه داده آموزشی برای ایجاد یک مدل، قالبگیری میشوند. از آن جایی که دادههای ورودی جدید به الگوریتم ماشین لرنینگ آموزش دیده معرفی میشود، از مدل توسعهیافته برای پیشبینی استفاده میکند.
نکته: تصویر بالا یک سناریوی مورد استفاده در سطح بالا را نشان میدهد. با این حال، نمونههای یادگیری ماشین معمولی ممکن است شامل بسیاری از عوامل، متغیرها و مراحل دیگر باشد.
علاوه بر این، پیشبینی برای صحت بررسی میشود. بر اساس دقت آن، الگوریتم ماشین یا مستقر میشود یا به طور مکرر با مجموعه داده آموزشی تقویتشده، آموزش داده می شود تا زمانی که دقت مورد نظر بدست آید.
انواع ماشین لرنینگ
الگوریتمهای یادگیری ماشین را میتوان به روشهای مختلفی آموزش داد که هر روشی مزایا و معایب خود را دارد. بر اساس این روشها و روشهای یادگیری، ماشین لرنینگ به طور کلی به چهار نوع اصلی طبقهبندی میشود:
یادگیری ماشین تحت نظارت
در این نوع ماشین لرنینگ، ماشینهای تحت نظارت روی مجموعه دادههای برچسبگذاری شده آموزش میبینند و قادر به پیشبینی خروجیها بر اساس آموزش ارائهشده هستند. مجموعه داده برچسبگذاری شده مشخص میکند که برخی از پارامترهای ورودی و خروجی قبلاً نقشهبرداری شدهاند. از این رو، ماشین با ورودی و خروجی مربوطه آموزش داده میشود. دستگاهی برای پیشبینی نتیجه با استفاده از مجموعه داده آزمایشی در مراحل بعدی ساخته شده است.
به عنوان مثال، مجموعه داده ورودی از تصاویر طوطی و کلاغ را در نظر بگیرید. در ابتدا، دستگاه برای درک تصاویر، از جمله رنگ، چشم، شکل و اندازه طوطی و کلاغ آموزش دیده است. پس از آموزش، یک عکس ورودی از یک طوطی ارائه میشود و انتظار می رود که دستگاه، شیء را شناسایی و خروجی را پیشبینی کند. ماشین آموزش دیده، ویژگیهای مختلف جسم مانند رنگ، چشمها، شکل و غیره را در تصویر ورودی بررسی میکند تا پیش بینی نهایی را انجام دهد. این فرآیند شناسایی شی در یادگیری ماشین تحت نظارت است.
هدف اصلی تکنیک یادگیری تحت نظارت، ترسیم متغیر ورودی (a) با متغیر خروجی (b) است. ماشین لرنینگ تحت نظارت معمولاً به دو دسته کلی طبقهبندی میشود:
- طبقهبندی : این نوع ماشین لرنینگ تحت نظارت به الگوریتمهایی اشاره دارد که مشکلات طبقهبندی را در جایی بررسی می کند که متغیر خروجی آن را طبقهبندی می کند. به عنوان مثال، بله یا خیر، درست یا نادرست، مرد یا زن، و غیره. برنامههای کاربردی دنیای واقعی این دسته در تشخیص هرزنامه و فیلتر ایمیل مشهود هستند.
برخی از الگوریتمهای طبقه بندی شناخته شده عبارتند از: الگوریتم جنگل تصادفی، الگوریتم درخت تصمیم، الگوریتم رگرسیون لجستیک و الگوریتم ماشین بردار پشتیبانی.
- رگرسیون : الگوریتمهای رگرسیون مشکلات رگرسیونی را مدیریت می کنند که در آن متغیرهای ورودی و خروجی رابطه خطی دارند. این نوع الگوریتمها برای پیشبینی متغیرهای خروجی پیوسته شناخته شدهاند. به عنوان مثال میتوان به پیش بینی آب و هوا، تحلیل روند بازار و غیره اشاره کرد.
الگوریتمهای رگرسیون محبوب عبارتند از: الگوریتم رگرسیون خطی ساده، الگوریتم رگرسیون چند متغیره، الگوریتم درخت تصمیم و رگرسیون لاسو (رگرسیون کمند).
بیشتر بخوانید: هوش مصنوعی یا AI چیست؟
یادگیری ماشین بدون نظارت
یادگیری بدون نظارت به یک تکنیک یادگیری اشاره دارد که بدون نظارت انجام میشود. در اینجا، ماشین با استفاده از یک مجموعه داده بدون برچسب آموزش داده میشود و قادر است خروجی را بدون هیچ نظارتی پیشبینی کند. هدف یک الگوریتم یادگیری بدون نظارت، گروهبندی مجموعه داده مرتبنشده بر اساس شباهتها، تفاوتها و الگوهای ورودی است.
به عنوان مثال، یک مجموعه داده ورودی از تصاویر یک ظرف پر از میوه را در نظر بگیرید. در اینجا، تصاویر برای مدل یادگیری ماشین شناختهشده نیستند. وقتی مجموعه داده را در مدل ماشین لرنینگ وارد میکنیم، وظیفه مدل شناسایی الگوی اشیا، مانند رنگ، شکل یا تفاوتهایی است که در تصاویر ورودی مشاهده میشود و آنها را دستهبندی میکند. پس از طبقهبندی، دستگاه خروجی را پیشبینی میکند که با یک مجموعه داده آزمایشی تست میشود.
یادگیری ماشین بدون نظارت معمولاً به دو نوع طبقهبندی میشود:
- خوشهبندی : تکنیک خوشه بندی به گروه بندی اشیا به خوشهها بر اساس پارامترهایی مانند شباهتها یا تفاوتهای بین اشیا اشاره دارد. به عنوان مثال، گروهبندی مشتریان بر اساس محصولاتی که خریداری میکنند.
برخی از الگوریتم های خوشه بندی شناخته شده عبارتند از: الگوریتم K-Means Clustering، Mean-Shift Algorithm، الگوریتم DBSCAN، Principal Component Analysis و Independent Component Analysis.
- انجمنی : یادگیری انجمنی به شناسایی روابط معمولی بین متغیرهای یک مجموعه داده بزرگ اشاره دارد. وابستگی آیتمهای مختلف داده و نقشههای متغیرهای مرتبط را تعیین میکند. کاربردهای معمولی شامل استخراج استفاده از وب و تجزیه و تحلیل دادههای بازار است.
الگوریتمهای محبوبی که از قوانین ارتباط تبعیت میکنند عبارتند از الگوریتم Apriori، الگوریتم Eclat و الگوریتم رشد FP.
یادگیری نیمهنظارتی
یادگیری نیمه نظارت شده شامل ویژگیهای یادگیری ماشین تحت نظارت و بدون نظارت به صورت همزمان است. این نوع از ماشین لرنینگ از ترکیب مجموعه دادههای برچسبدار و بدون برچسب برای آموزش الگوریتمهای خود استفاده میکند. با استفاده از هر دو نوع مجموعه داده، یادگیری نیمه نظارتی بر اشکالات گزینههای ذکر شده در بالا غلبه میکند.
برای مثال یک دانشجوی کالج را در نظر بگیرید. یادگیری دانشجویی که تحت نظارت معلم در کالج یک مفهوم را یاد میگیرد، یادگیری تحت نظارت نامیده میشود. در یادگیری بدون نظارت، دانشجو همان مفهوم را در خانه بدون راهنمایی معلم خود یاد میگیرد. در همین حال، تمرین دانشجو پس از یادگیری در این مفهوم، تحت هدایت یک استاد کالج، یک شکل نیمهنظارتی از یادگیری است.
یادگیری تقویتی
یادگیری تقویتی یک فرآیند مبتنی بر بازخورد است. در اینجا، مؤلفه هوش مصنوعی بهطور خودکار با روش ضربه و آزمایش از محیط اطراف خود استفاده میکند، اقدام میکند، از تجربیات میآموزد و عملکرد را بهبود میبخشد. جزء سازنده، برای هر عمل خوب پاداش و برای هر حرکت اشتباه جریمه میشود. بنابراین، مؤلفه یادگیری تقویتی با انجام اقدامات خوب پاداش را به حداکثر میرساند.
برخلاف یادگیری تحت نظارت، یادگیری تقویتی فاقد دادههای برچسبگذاری شده است و عوامل فقط از طریق تجربیات یاد میگیرند. برای مثال، بازیهای ویدیویی را در نظر بگیرید. در اینجا بازی، محیط را مشخص میکند و هر حرکت عامل تقویتکننده وضعیت آن را مشخص می کند. نماینده کامپیوتری فردی که در حال بازی است، از طریق تنبیه و پاداش بازخورد دریافت میکند که این دو بر امتیاز کلی بازی تأثیر میگذارند. هدف نهایی نماینده دستیابی به امتیاز بالا است.
یادگیری تقویتی در زمینههای مختلفی مانند نظریه بازی، نظریه اطلاعات و سیستمهای چند عاملی اعمال میشود. یادگیری تقویتی بیشتر به دو نوع روش یا الگوریتم تقسیم میشود:
- یادگیری تقویتی مثبت: این الگوریتم به افزودن یک محرک تقویتکننده پس از یک رفتار خاص عامل اشاره دارد، که احتمال تکرار آن رفتار را در آینده افزایش میدهد، به عنوان مثال، اضافه کردن یک پاداش پس از یک رفتار.
- یادگیری تقویتی منفی: یادگیری تقویتی منفی به تقویت یک رفتار خاص اشاره دارد که از نتیجه منفی جلوگیری میکند.
بیشتر بخوانید: آیا ماشینها میتوانند فکر کنند؟
۵ کاربرد ماشین لرنینگ
صنایع مهمی که حجم زیادی از دادهها را مدیریت می کنند، به اهمیت و ارزش فناوری ماشین لرنینگ پی بردهاند. از آنجایی که یادگیری ماشین بینشهایی را از دادهها در زمان واقعی به دست میآورد، سازمانهایی که از آن استفاده میکنند میتوانند به طور موثر کار کنند و نسبت به رقبای خود برتری پیدا کنند.
در این دنیای دیجیتال که پیشرفتها پر سرعت پیش میرود، هر صنعتی میتواند از فناوری یادگیری ماشین بهره ببرد. در اینجا، ما به پنج کاربرد ماشین لرنینگ اشاره میکنیم.
۱.ماشین لرنینگ در صنعت پزشکی و مراقبتهای بهداشتی
یادگیری ماشین به طور فزایندهای در صنعت پزشکی و مراقبتهای بهداشتی استفاده میشود؛ دستگاههای پوشیدنی و گجتها و همچنین حسگرهایی مانند ردیابهای تناسب اندام پوشیدنی، ساعتهای سلامت هوشمند و غیره همگی نشان از کاربرد یادگیری ماشین در صنعت سلامت دارند. همه این دستگاهها دادههای سلامتی کاربران را برای ارزیابی سلامت آنها دریافت و در زمان واقعی بر آنها نظارت میکنند.
علاوه بر این، این فناوری به پزشکان در تجزیه و تحلیل روندها یا نشانهگذاری رویدادهایی کمک می کند که ممکن است در بهبود، تشخیص و درمان بیمار موثر باشند. الگوریتمهای ماشین لرنینگ حتی به متخصصان پزشکی اجازه میدهند تا طول عمر بیمار مبتلا به یک بیماری کشنده را با دقت بیشتری پیشبینی کنند.
علاوه بر این، یادگیری ماشین به طور قابل توجهی در دو زمینه زیر به صنعت پزشکی کمک میکند:
- کشف دارو: ساخت یا کشف یک داروی جدید پرهزینه است و فرآیند طولانی را در بر میگیرد. یادگیری ماشین به سرعت بخشیدن به مراحل درگیر در چنین فرآیند چند مرحله ای کمک می کند. به عنوان مثال، کمپانی فایزر از هوش مصنوعی واتسون، محصول شرکت IBM، برای تجزیه و تحلیل حجم عظیمی از دادههای متفاوت برای کشف دارو استفاده میکند.
- درمان شخصی: تولیدکنندگان دارو با چالش سخت اعتبارسنجی اثربخشی یک داروی خاص بر توده بزرگی از جمعیت مواجه هستند. این امر به دلیل آن است که داروی مورد نظر در آزمایشهای بالینی تنها بر روی گروه کوچکی اثر میگذارد و احتمالاً باعث ایجاد عوارض جانبی در برخی افراد میشود.
برای رسیدگی به این مشکلات، شرکتهایی مانند Genentech با GNS Healthcare همکاری کردهاند تا از یادگیری ماشین و شبیهسازی پلتفرمهای هوش مصنوعی استفاده کنند و در درمانهای زیستپزشکی برای رفع این مشکلات نوآوری خلق کنند. فناوری ماشین لرنینگ با تجزیه و تحلیل ژنهای فردی که درمانهای هدفمندی را برای بیماران فراهم میکند، به دنبال نشانگرهای پاسخ بیماران میگردد.
۲.ماشین لرنینگ و کاربرد آن در بخش مالی
امروزه، چندین سازمان مالی و چندین بانک از فناوری یادگیری ماشین برای مقابله با فعالیتهای متقلبانه استفاده میکنند و بینشها و تحلیلهای ضروری را از حجم وسیعی از دادهها به دست میآورند. بینشهای مشتق شده از یادگیری ماشین به شناسایی فرصتهای سرمایهگذاری کمک میکند که به سرمایهگذاران اجازه میدهد تا تصمیم بگیرند چه زمانی معامله کنند.
علاوه بر این، روشهای دادهکاوی به سیستمهای نظارت سایبری کمک میکنند تا علائم هشداردهنده فعالیتهای متقلبانه را از بین ببرند و متعاقباً آنها را خنثی کنند. چندین مؤسسه مالی قبلاً با شرکت های فناوری همکاری کرده اند تا از مزایای یادگیری ماشین استفاده کنند.
۳.ماشین لرنینگ و کاربرد آن در بخش خرده فروشی
وب سایتهای خرده فروشی به طور گسترده از یادگیری ماشین برای توصیه اقلام بر اساس سابقه خرید کاربران استفاده میکنند. خردهفروشان از تکنیکهای ماشین لرنینگ برای جمعآوری دادهها، تجزیه و تحلیل آنها و ارائه تجربیات خرید شخصی به مشتریان خود استفاده میکنند. آنها همچنین ماشین لرنینگ را برای کمپینهای بازاریابی، ارزیابی مشتری، برنامهریزی ارسال کالای مشتری و بهینهسازی قیمت پیادهسازی میکنند.
علاوه بر این، سایتهای خردهفروشی به دستیاران مجازی یا رباتهای گفتگوی مکالمهای نیز مجهز هستند که از ماشین لرنینگ، پردازش زبان طبیعی (NLP) و درک زبان طبیعی (NLU) برای خودکارسازی تجربه خرید مشتری استفاده میکنند.
۴.ماشین لرنینگ و کاربرد آن در صنعت سفر و حمل و نقل
یادگیری ماشین نقشی اساسی در گسترش دامنه صنعت سفر ایفا میکند. خدمات سفر که توسط شرکتهای تاکسیرانی اینترنتی Uber، Ola و حتی خودروهای خودران ارائه شدهاند، پشتوانه یادگیری ماشین قوی دارند.
الگوریتم یادگیری ماشین اوبر را در نظر بگیرید. اوبر از یک مدل یادگیری ماشین به نام “Geosurge” برای مدیریت پارامترهای قیمت گذاری پویا استفاده میکند. از مدلسازی پیشبینی بیدرنگ بر روی الگوهای ترافیک، عرضه و تقاضا استفاده میکند. اگر برای جلسه دیرتان میشود و نیاز به گرفتن تاکسی Uber در یک منطقه شلوغ دارید، مدل قیمتگذاری پویا شروع میشود و میتوانید فوراً سوار اوبر شوید، اما باید دو برابر کرایه معمولی بپردازید.
علاوه بر این، صنعت سفر از یادگیری ماشین برای تجزیه و تحلیل نظرات کاربران استفاده میکند. نظرات کاربران از طریق تجزیه و تحلیل احساسات بر اساس نمرات مثبت یا منفی طبقهبندی میشوند. این ویژگی برای نظارت بر کمپین، نظارت بر برند، نظارت بر انطباق و غیره توسط شرکتهای صنعت سفر استفاده میشود.
۵.ماشین لرنینگ و کاربرد آن در رسانه های اجتماعی
با یادگیری ماشین، میلیاردها کاربر میتوانند به طور موثر در شبکههای اجتماعی مشارکت کنند. یادگیری ماشین در هدایت پلتفرمهای رسانههای اجتماعی از شخصیسازی فیدهای خبری تا ارائه تبلیغات خاص کاربر بسیار مهم است. به عنوان مثال، ویژگی برچسبگذاری خودکار فیسبوک از تشخیص تصویر برای شناسایی چهره دوست شما و تگ کردن خودکار آنها استفاده میکند. این شبکه اجتماعی از ANN برای شناسایی چهرههای آشنا در لیست مخاطبین کاربران استفاده و برچسبگذاری خودکار را آسان میکند.
به طور مشابه، شبکه اجتماعی لینکدین هم میداند که باید با چه کسی باید ارتباط برقرار کنید و مهارتهای شما در مقایسه با همتایان چگونه رتبهبندی میشود. همه این ویژگیها با یادگیری ماشین امکانپذیر شدهاند.
و در پایان این که…
کامپیوترها میتوانند به کمک یادگیری ماشین آموزش ببینند، به خاطر بسپارند و خروجیهای دقیقی تولید کنند. این تکنولوژی شرکتها را قادر میسازد تا تصمیمات آگاهانهای برای سادهسازی کارهای تجاری خود بگیرند. چنین تصمیمات مبتنی بر دادهها به شرکتها در تمامی صنعتها، از تولیدیها و خردهفروشیها گرفته تا مراقبتهای بهداشتی، انرژی و خدمات مالی کمک میکند.
خدمات یوآیدی
برای مصون ماندن از انواع کلاهبرداری اینترنتی شما میتوانید خدمات احراز هویت مانند احراز هویت سجام و احراز هویت ثنا را به راحتی و به صورت اینترنتی در کوتاهترین زمان ممکن انجام دهید. این کار با استفاده از راه حل احراز هویت یوآیدی به سادگی انجام میشود.
یوآیدی اولین سرویس احراز هویت غیر حضوری در ایران است که در ارائه روشهای احراز هویت آنلاین پیشگام است. این شرکت راهکارهای خود را با استفاده از هوش مصنوعی و الگوریتمهای پیشرفته ارائه میدهد.
سوالات متداول در مورد یادگیری ماشین
یادگیری تقویتی سختترین بخش یادگیری ماشین است. مهمترین نتایج در یادگیری عمیق مانند طبقهبندی تصاویر تاکنون با یادگیری نظارت شده یا یادگیری بدون نظارت به دست آمده است.
یادگیری ماشین با دگرگونی همه بخشها از جمله خدمات مراقبتهای بهداشتی، آموزش، حملونقل، غذا، سرگرمی و دیگر صنایع جهان را تغییر میدهد و بر تمامی جنبههای زندگی تأثیر میگذارد.
یادگیری ماشین شاخهای از هوش مصنوعی (AI) و علوم کامپیوتر است که بر استفاده از دادهها و الگوریتمها برای تقلید از روشی که انسانها یاد میگیرند تمرکز دارد و به تدریج دقت آن را بهبود میبخشد.
4 دیدگاه دربارهٔ «یادگیری ماشین یا Machine Learning چیست؟»
من فرق هوش مصنوعی رو با یادگیری ماشین نمیفهمم :-(((
سلام سامان عزیز
مقاله “تفاوت یادگیری عمیق و یادگیری ماشین و ارتباط آنها با هوش مصنوعی” رو مطالعه بفرمایید تا با تفاوتهاشون بیشتر آشنا شید.
سلام. آموزش یادگیری ماشین با پایتون رو از کجا تهیه کنم بهتره؟
سلام نیمای عزیز
در این خصوص باید جستجوی کامل انجام بدید و نظرات متخصصان رو بخونید.