چکیده
ما از مدل LDA به عنوان ویژگی روش استخراج برای استخراج موضوعات پنهان، کاهش اثرات پراکندگی داده، و ساخت ویژگی موضوع با مجموعه برای آموزش بیشتر مدل های طبقه بندی قوی برای دسته های مکمیاب استفاده می کنیم. آزمایش ها بر روی مجموعه ای از صفحات اینترنت از شاخه چینی ساده شده ی راهنمایی DMOZ انجام شد. نتیجه نشان می دهد که روش ها به بهبود عملکرد برای دسته های کمیاب برروی روش های طبقه بندی سلسله مراتبی براساس ترم و ویژگی کلمه و بهبود بیشتر عملکرد در کل موضوع طبقه بندی دست می یابد
ادامه نوشته