چکیده: در دهه 1960ميلادی Tsypkin روشي براي ساده كردن مسائل به مسالهاي براي تشخيص پارامترهاي بهينه معرفي كرد و نخستین بار مسئله اتوماتای یادگیری توسط Tsetlinدر اتحاد جماهیر شوروی مطرح شد Varshavski و Vorontsova بر روی اتوماتای تصادفی کار کردند. کارهای صورت گرفته عبارت بودند از: تئوري بازي، ...
دسته بندی: فنی و مهندسی » کامپیوتر و ITتعداد مشاهده: 1250 مشاهده
فرمت فایل دانلودی:.docx
فرمت فایل اصلی: docx
تعداد صفحات: 25
حجم فایل:404 کیلوبایت
چکیده:
در دهه 1960ميلادی Tsypkin روشي براي ساده كردن مسائل به مسالهاي براي تشخيص پارامترهاي بهينه معرفي كرد و نخستین بار مسئله اتوماتای یادگیری توسط Tsetlinدر اتحاد جماهیر شوروی مطرح شد Varshavski و Vorontsova بر روی اتوماتای تصادفی کار کردند. کارهای صورت گرفته عبارت بودند از: تئوري بازي، اتوماتاي تصادفي در تخمين پارمترها، تشخيص الگو. McLaren روشهاي بِروز رساني خطي و ويژگيهایش و Chandrasekar و Shen روشهاي بِروزرساني غير خطي را مطرح کردند. اتوماتایک ماشین است برای انجام خودکار یکسری اعمال یا جواب به مجموعه ای از دستورات. اتوماتای یادگیری یک شئ مجرداست که میتوان تعدادی عمل متناهی انجام دهد. اتوماتا ازمجموعه ی اقدام های خود یکی را انتخاب می کند و آنها را بر محیط اعمال میکند. اتوماتا از پاسخی که محیط به آن می دهد اقدام بعدی خودش را انتخاب میکند. نتیجه این کار بهینه عمل کردن اتوماتا است. هر عملی که انتخاب می شود در یک محیط احتمالی بررسی می شود و نتیجه این بررسی سیگنال مثبت یا منفی است که به اتوماتا داده می شود و اتوماتا از این جواب در انتخاب عمل بعدی استفاده می کند در واقع هدف نهایی این است که اتوماتا از بین کارهای خود کارهایی را انتخاب کند که احتمال گرفتن پاداش از محیط را به بیشترین حد خود برساند. يادگيري همان تغييرات ايجاد شده در كارايي يك سيستم بر اساس تجربه های گذشته است.
در دهه 1960ميلادی Tsypkin روشي براي ساده كردن مسائل به مسالهاي براي تشخيص پارامترهاي بهينه معرفي كرد و نخستین بار مسئله اتوماتای یادگیری توسط Tsetlinدر اتحاد جماهیر شوروی مطرح شد Varshavski و Vorontsova بر روی اتوماتای تصادفی کار کردند. کارهای صورت گرفته عبارت بودند از: تئوري بازي، اتوماتاي تصادفي در تخمين پارمترها، تشخيص الگو. McLaren روشهاي بِروز رساني خطي و ويژگيهایش و Chandrasekar و Shen روشهاي بِروزرساني غير خطي را مطرح کردند. اتوماتایک ماشین است برای انجام خودکار یکسری اعمال یا جواب به مجموعه ای از دستورات. اتوماتای یادگیری یک شئ مجرداست که میتوان تعدادی عمل متناهی انجام دهد. اتوماتا ازمجموعه ی اقدام های خود یکی را انتخاب می کند و آنها را بر محیط اعمال میکند. اتوماتا از پاسخی که محیط به آن می دهد اقدام بعدی خودش را انتخاب میکند. نتیجه این کار بهینه عمل کردن اتوماتا است. هر عملی که انتخاب می شود در یک محیط احتمالی بررسی می شود و نتیجه این بررسی سیگنال مثبت یا منفی است که به اتوماتا داده می شود و اتوماتا از این جواب در انتخاب عمل بعدی استفاده می کند در واقع هدف نهایی این است که اتوماتا از بین کارهای خود کارهایی را انتخاب کند که احتمال گرفتن پاداش از محیط را به بیشترین حد خود برساند. يادگيري همان تغييرات ايجاد شده در كارايي يك سيستم بر اساس تجربه های گذشته است.