هفتمین کنگره مشترک سیستمهای فازی و هوشمند ایران

یادگیری چند وظیفه‌ای به منظور پیدا کردن زیر فضای مشترک بین احساسات و گفتار گویندگان

کد مقاله : 1060-CFIS (R1)

نویسندگان

الهام کلهر *¹، بهزاد بختیاری²

¹دانشگاه صنعتی سجاد- گروه مهندسی کامپیوتر و فناوری اطلاعات-مشهد

²دانشگاه صنعتی سجاد-عضو هیت علمی دانشکده ی مهندسی کامپیوتر و فناوری اطلاعات

چکیده مقاله

انتخاب ویژگی در سیستم‌های مستقل از گوینده از کارهای مهم در حوزه‌ی پردازش حالت گفتار محسوب می‌شود. زیرا از آنجایی که به طور معمول نمی‌دانیم کدام ویژگی از گفتار فرد به حالت وی ارتباط دارد، معمولا تعداد زیادی ویژگی در نظر گرفته می‌شود و سعی می‌شود به کمک آن‌ها طبقه‌بندی حالت احساس افراد صورت پذیرد. اما کم بودن تعداد داده‌های آموزشی و متفاوت بودن ویژگی‌های توصیف کننده‌ی حالت افراد مختلف، موجب می‌شود که انتخاب ویژگی‌های مناسب امری ضروری تلقی شود. در این مقاله با رویکرد یادگیری چند وظیفه‌ای انتخاب ویژگی‌ها به نحوی صورت می‌پذیرد که ویژگی‌های انتخاب شده برای تمام گویندگان به خوبی توصیف کننده‌ی حالت‌های احساسی آن‌ها باشد. به عبارت دیگر زیر فضایی پیدا شود که در بین تمام گویندگان و تمام حالت‌های احساسی مشترک است. همچنین برای نشان دادن کارایی از دو مجموعه داده Berlin و Enterface که از دادگان معروف این حوزه هستند استفاده شد. نتایج نشان می‌دهند که روش پیشنهادی نسبت به روش‌های مورد مقایسه کارایی بهتری داشته و با سرعت مناسب انتخاب ویژگی را انجام می‌دهد.

کلیدواژه ها

انتخاب ویژگی چند وظیفه‌ای، تشخیص حالت احساس، مستقل از گوینده، نُرم L2،1

وضعیت: پذیرفته شده برای ارائه شفاهی