مقایسه و ارزیابی شبکه های عصبی بازگشتی RBM و LSTM برای برچسب زنی تصاویر
کد مقاله : 1069-CFIS (R1)
نویسندگان
مهرداد باقری *1، محرم منصوری زاده2، میرحسین دزفولیان3
1گروه کامپیوتر، دانشکده مهندسی،دانشگاه بوعلی سینا،همدان
2گروه کامپیوتر، دانشکده فنی مهندسی، دانشگاه بوعلی سینا، همدان
3گروه کامپیوتر،دانشکده فنی مهندسی،دانشگاه بوعلی سینا،همدان
چکیده مقاله
امروزه اختصاص دادن برچسب به تصاویر به صورت خودکار و به نحوی که گویای مضامین تصویر باشد؛ به یکی از زمینه های مورد علاقه پژوهشگران در حوزه یادگیری ماشین و پردازش تصویر تبدیل شده است. شبکه های عصبی مولد به خصوص شبکه های بازگشتی با توجه به توانایی آن ها در تولید دادگان مشابه دادگان آموزش به عنوان انتخاب های اولیه در این زمینه مطرح هستند. در این میان شبکه های بولتزمن محدود (RBM) و شبکه های حافظه دارLSTM جایگاه ویژه ای دارند. در این مقاله این دو شبکه را برای برچسب زنی تصاویر استفاده کرده و عملکرد آن ها را تحلیل و ارزیابی می کنیم. نتایج اولیه به دست آمده نشان می دهد که شبکه LSTM به صورت قابل ملاحظه ای عملکرد بهتری نسبت به شبکه های RBM دارد.
کلیدواژه ها
image tagging، CNN، RNN، RBM
وضعیت: پذیرفته شده برای ارائه شفاهی